Databricks posiada swoje własne możliwości orkiestracji procesów poprzez wywoływanie jednych notebooków z poziomu innych co możemy osiągnąć przy pomocy komendy %run lub dbutils.notebook.run. Często jednak zdarza się tak, że notebook jest jedynie częścią większego procesu i wtedy orkiestrację musimy przekazać do innego narzędzia takiego jak np. Azure Data Factory. Na szczęście oba narzędzia integrują się […]
Author: Adrian Chodkowski
500 tysięcy odwiedzin bloga – Kilka słów o aktywnościach i szeroko pojętym community
Czas leci nieubłaganie, zdajemy sobie z tego sprawę bardzo często przy okazji wspomnień określonych zdarzeń z przeszłości. Nie inaczej było w moim przypadku, gdy zwróciłem uwagę na licznik odwiedzin na niniejszym blogu, który niedawno przekroczył 500 tysięcy wyświetleń. Liczba ta zrobiła na mnie niemałe wrażenie, w jednym momencie zdałem sobie sprawę, że mnóstwo osób celowo […]
Przechwytywanie zmian z Change Data Feed w Azure Databricks
Częstym problemem na jaki napotykamy przy pracach związanych z budową hurtowni danych jest fakt przechwytywania zmian zarówno z systemów źródłowych jak i z poszczególnych warstw wchodzących w skład naszej architektury systemu. Tego typu operacja jest w większości przypadków obligatoryjną częścią procesu ładowania ponieważ ładowanie za każdym razem całego zbioru danych jest albo nieefektywne albo wręcz […]
Pobieranie danych z Azure Active Directory przy pomocy Data Factory i Microsoft Graph
Bywają przypadki w których chcemy wyciągnąć dane z Active Directory. Może się to zdarzyć z wielu różnych powodów np. chcemy stworzyć zestawienie czy też raport na podstawie określonych danych lub zaimplementować coś takiego jak Dynamic Security w Power BI tzn. filtrować dane na podstawie tabeli security zawierającej użytkowników i ich przypisanie do konkretnej grupy. Tego […]