Podczas licznych wizyt u Klientów i rozmów z nimi bardzo często prędzej czy później pojawia się pojęcie samoobsługowego Business Intelligence. Prawdą jest to, że pojęcie to jest dosyć ciekawym sloganem powtarzanym jak mantra przez kolejnych dostawców oprogramowania mówiących o tym, że ich produkt jest jedynym i najlepszym narzędziem umożliwiającym wydajną analizę danych w taki a nie inny sposób- ile w tym prawdy, a ile fałszu? Postaram się to przedstawić w ramach niniejszego artykułu. Dodatkowo przedstawię mój subiektywny punkt widzenia na tego typu podejście do analizy danych na podstawie oprogramowania Microsoft- zapraszam do lektury.
Na samym początku wyjaśnijmy pojęcie Self-Service Business Intelligence gdyż nie jest ono oczywiste ze względu na fakt, iż często pojawiaja się w materiałach marketingowych różnorakiego oprogramowania, które czasem mija się z prawdą lub miesza różne podejścia. Idea tego typu narzędzi opiera się na tym, iż użytkownicy którzy niekoniecznie posiadają zaawansowane umiejętności techniczne będą w stanie samodzielnie integrować, modelować i wizualizować dane. Brzmi całkiem dobrze prawda? I w rzeczywistości tak właśnie jest! Jednakże wiele osób z różnych kręgów biznesowych postrzega tego typu narzędzia w kompletnie nieprawidłowy sposób, a niektórzy dostawcy oprogramowania utwierdzają ten pogląd poprzez dodanie sloganu “self-service” do swoich narzędzi często mijając się z prawdą (w niektórych przypadkach dosyć mocno). Jeśli chodzi o klientów i inne osoby z biznesu to często postrzegają oni wspomniane narzędzia jako coś co umożliwi zbudowanie rozwiązań analitycznych w prosty i intuicyjny sposób bez żadnych umiejętności technicznych lub co gorsza w sposób automatyczny (sic!). Czy to prawda? Oczywiście, że nie! Żadne narzędzie nie działa i nie będzie działać automatycznie i dawać pożądane efekty. Każdy powinien zdać sobie z tego sprawę i myślę, że póki co nie zapowiada się aby w najbliższej przyszłości ten stan rzeczy się zmienił. Należy położyć szczególny nacisk na pojawiającą się w definicji sentencję “nieposiadająjący zaawansowanych umiejętności technicznych” – przy czym zdanie to nie oznacza, iż docelowy użytkownik nie będzie posiadał żadnych umiejętności, im prędzej zdamy sobie z tego sprawę tym mnie nerwów i rozczarowań w przyszłości.
Dobrze, wiemy już co i jak ale pojawia się pytanie czy jest coś co działa w sposób choć zbliżony do automatyzmu? Myślę, że tak i jest nim bez wątpienia usługa Q&A na portalu Power BI oferowanym przez Microsoft. Funkcjonalność ta polega na tym, że model zawarty w naszym rozwiązaniu Power BI może być odpytywany przy pomocy prostych naturalnych zdań w języku angielskim
Jak można zauważyć na powyższym zrzucie ekranowym napisałem proste zdanie “Show me sum of amount on column chart by Month order by Month” i usługa Q&A zobrazowała dane w pożądany przez nas sposób. Dla mnie osobiście jest to najbardziej zautomatyzowana forma analizy danych – ktoś kto nie ma umiejętności technicznych naturalnym językiem odpytuje wcześniej przygotowany model. W tym przypadku jak prawie wszędzie diabeł tkwi w szczegółach tzn. kluczowa jest tutaj sentencja “przygotowany wcześniej model” – bo cały mechanizm opiera się na modelu analitycznym Power BI z odpowiednimi synonimami słów i przygotowaniem wyliczeń, miar, atrybutów – tak więc potrzebna jest praca osób trzecich, które umiejętności techniczne w większym bądź mniejszym stopniu posiadają. Mimo, iż jest to tylko usługa w ramach całej platformy warto o niej pamiętać gdyż w niektórych przypadkach może być naprawdę użyteczna.
Niezrozumienie tego czym są narzędzia Self-Service jest często powodem niezadowolenia i bezradności u osób, które takich narzędzi miały używać. Każdy spodziewa się tajemniczego pudełka który zgadnie co mamy na myśli i w magiczny sposób wygeneruje nam piękne analizy z wyszczególnieniem faktów, które nas najbardziej interesują. Prawda jest niestety z goła inna i trzeba sobie jasno powiedzieć, że takie “czary-mary” jeszcze nie powstały (chociaż Q&A w pewnym sensie może być magiczną różdżką generującą analizy w taki własnie sposób). Użytkownicy którzy chcą (lub co gorsza zostali przymuszeni) do zapoznania się z narzędziem self-service często narzekają na trudność budowy konkretnych analiz. Zadowolenie może być również spotęgowane gdyż powszechną rzeczą jest strach przed nowościami i niechęć do nauki nowych rzeczy. Jednakże czasem jest to w pełni uzasadnione oburzenie – pamiętam niejednokrotnie gdy przedstawiono Tableau czy QlikView jako automatyczne narzędzie Self-Service, które posiadają duże możliwości ale wystarczy spojrzeć na poniższą część skryptu kalkulacyjnego (w tym wypadku QlikView) zasilającego dane aby zadać sobie pytanie czy nietechniczna osoba, anlityk czy kontroler jest w stanie coś takiego napisać. Odpowiedzcie sobie sami:
Oczywiście powyższy skrypt nie jest niczym złym i da się go nauczyć – ale nie trzeba mieć bujnej wyobraźni żeby domyśleć się reakcji typowego nietechnicznego użytkownika w sytuacji gdy chcielibyśmy mu powiedzieć żeby się czegoś takiego nauczył. Nie chcę powiedzieć, że powyższe narzędzia nie są samoobsługowe – po prostu w niektórych przypadkach niektórzy handlowcy starają się “przemilczeć” niektóre bardziej skomplikowane aspekty swojego oprogramowania. Stali czytelnicy niniejszego bloga wiedzą, że zajmuje się głównie technologiami Microsoft, w takim razie jak coś takiego wygląda w tym stosie technologicznym? Również w tym przypadku często nie pokazuje się wszystkich zalet i wad. Jeśli chodzi o self-service od MS wspomniałem już Power BI Q&A ale to oczywiście nie wszystko. Pamiętajmy, że Microsoft jest producentem pakietu biurowego Office, którego kluczowym elementem jest arkusz kalkulacyjny Excel. Jest to lider wśród narzędzi analitycznych i myślę, że mało kto zdecydował by się tą pozycję zakwestionować. Od wersji 2010 wspomnianego pakietu Microsoft zaczął wydawać darmowe dodatki rozszerzające funkcjonalność tj. Power Query, Power Map, Power View oraz Power Pivot. Power Query jest niczym innym jak narzędziem do budowania procesów pobierania, transformacji i ładowania danych. Interfejs tego narzędzia zostały przedstawiony na poniższym zrzucie ekranowym:
Cóż można o tym powiedzieć? Interfejs typowej wstążki – bardzo podobny do interfejsu całego pakietu Office. Wyposażony jest on w cały szereg kreatorów umożliwiających stworzenie nawet bardzo zaawansowanych przekształceń. W Power Query bardzo wiele rzeczy można zrobić bez konieczności napisania nawet jednej linijki kodu. Dla osób z większym zacięciem technicznym również coś się znajdzie gdyż pod spodem sekwencji wizualnych modyfikacji generowany jest kod języka M, który potrafi naprawdę wiele. Dane, pobrane i przetransformowane w ten sposób możemy załadować nie tylko bezpośrednio do arkusza Excel ale również do modelu Power Pivot, którego interfejs został przedstawiony poniżej:
Znów mamy do czynienia ze wstążką – ponadto definiowanie relacji, hierarchii i innych obiektów związanych z modelami danych odbywa się metodą przeciągnij-upuść. Poniżej przedstawiony został widok diagramu narzędzia Power Pivot – jak widać jest ona bardzo prosty (Szczególnie jeśli przypomnimy sobie co trzeba było zrobić, żeby osiągnąć podobny efekt np. w kostkach SSAS):
Ponadto Power Pivot można zdefiniować miary i wyliczenia przy pomocy języka DAX, który bardzo przypomina formuły Excel np. poniższy zapis tworzy miarę o nazwie SumOfSalesAmount:
SumOfSalesAmount := CALCULATE ( SUM ( [SalesAmount] ); 'Tabela1'[Country] = "Poland" )
Nie wchodząc w szczegóły możemy domyśleć się co dana miara zwraca – ponadto jest ona dynamiczna i obliczy się zależnie od wyboru np. w tabeli przestwnej odpowiednich filtrów itd. Oczywiście tak jak każde narzędzie tak i to ma swoje wady i zalety oraz w niektórych aspektach wyliczenia nie są takie proste jak powyższe – jednakże lepiej aby narzędzie dawało bardziej zaawansowane możliwości niż żeby było ograniczone tylko do tego co proste.
Jeśli chodzi o Power View i Power Map to są to typowe narzędzia do wizualizacji danych. Zajmiemy się Power View gdzie tworzenie wizualizacji i interaktywnych raportów opiera się o metodą przeciągnij-upuść i definiowaniu prostych właściwości:
Bardziej rozbudowanym narzędziem, które opiera się na Power Pivot, Power Query i Power View (chociaż wizualizacje w Power View dają dużo mniejsze możliwości) jest Power BI, który działa mniej więcej tak samo i posiada naprawdę rozbudowane możliwości. Technologia przeciągnij-upuść, graficzne metody definiowania obiektów i właściwości, kreatory, podobieństwo do Excela + wstążka w moim mniemaniu czyni to oprogramowanie zbliżonym do idylicznego obrazu samoobsługowego Business Intelligence. W żadnym wypadku nie chce powiedzieć, że te narzędzia są prose – aby je w całości poznać i potrafić zrobić bardzo wiele potrzeba naprawdę dużo czasu i praktyki – jednakże bardzo szybko można w nich wystartować. Próg wejścia do tych technologii nie jest bardzo wysoki jak ma to miejsce w przypadku innego oprogramowania, a po osiągnięciu pewnego poziomu użytownicy naprawdę mogą tworzyć fajne wizualizacje i analizy bez pomocy osób trzecich. Pamiętajmy jednak, że nie są to narzędzia automatyczne i nigdy nie będą za nas myśleć i właśnie myślenia i otwarcia na nowości u Klientów i użytkowników życzę sobie i Wam.
- Avoiding Issues: Monitoring Query Pushdowns in Databricks Federated Queries - October 27, 2024
- Microsoft Fabric: Using Workspace Identity for Authentication - September 25, 2024
- Executing SQL queries from Azure DevOps using Service Connection credentials - August 28, 2024
Co do marketingowego hasła “self-service” dla produktów BI można dodać pytanie “Ale od którego momentu self-service?”. Gdy ograniczymy się tylko do tworzenia wizualizacji danych, to większość narzędzi będzie samoobsługowe. Krok wcześniej – przygotowanie modelu, będzie wymagało wiedzy technicznej. Oczywiście, im więcej wiemy, tym więcej damy radę zrobić sami. Pozdrawiam 🙂
To prawda 🙂 Chociaż moim zdaniem przy wizualizacji też nie wszystkie narzędzia są samoobsługowe 🙂