Data Science

Docker dla “amatora” danych – cz. 0 Wprowadzenie

Docker dla amatora danych
Follow me on

Slawomir Drzymala

Still playing with data and .NET technologies
Slawomir Drzymala
Follow me on

Wstęp Kontenery to temat na pewno nie nowy, natomiast w ostatnich latach bijący chyba rekordy popularności. Podczas tej rosnącej fali ja również postanowiłem sprawdzić, z czym to się je i w czym Docker może pomóc mi. W niniejszym serii postów chciałbym podzielić się z własnymi doświadczeniami, notatkami, fragmentami kodów oraz pokazać, w jaki sposób można wykorzystać Docker’a. Będzie to Docker z perspektywy osoby, która pracuje z danymi. Począwszy od ich gromadzenia, po ich przechowywanie, aż po ich przetwarzanie. Na pewno nie zabraknie samego Docker’a, SQL Server’a i Python’a przedstawionych w jak najbardziej praktyczny sposób. Zapraszam! Wprowadzenie Docker to, jak możemy…
Read more

Naiwny klasyfikator Bayesa – Analysis Services Data Mining tutorial

Follow me

Adrian Chodkowski

SQL geek, Data enthusiast, Consultant & Developer
Adrian Chodkowski
Follow me

Dziś chciałem się napisać parę słów o tym o czym stosunkowo rzadko piszę, a mianowicie o eksploracji danych aka. Data Miningu. Obecnie pojęcie to niejako “przycichło” zagłuszone przez nowe slogany w stylu “Data Science” czy “Machine Learning” ale czy przestało być aktualne? Z całą pewnością nie ponieważ wszystkie te terminy mają coś ze sobą wspólnego, a stare dobre algorytmy eksploracyjne mają się bardzo dobrze. Bohaterem dzisiejszego wpisu jest jeden z najprostszych algorytmów dostępnych w Analysis Services tj. Naiwny klasyfikator Bayesa – zapraszam do lektury! Przy okazji chciałbym wspomnieć o tym, iż nie będę zbytnio zagłębiał się w matematyczną strukturę algorytmu…
Read more

Power BI – wyświetlanie wartości zmiennych z wizualizacji języka R

Follow me on

Slawomir Drzymala

Still playing with data and .NET technologies
Slawomir Drzymala
Follow me on

Power BI za pomocą wizualizacji języka R (R script visual) pozwala na wykorzystanie niemalże wszystkich graficznych możliwości pakietu R. W chwili gdy będziemy jednak chcieli wyświetlić wartości pojedynczych zmiennych otrzymamy komunikat z błędem: Zgodnie z komunikatem w Power BI Desktop możemy prezentować wyłącznie wizualizacje, które są generowane przez R Server, a próba wyświetlenia pojedynczej wartości zmiennej skończy się błędem: “Can’t display this visual. No image was created…” W sytuacji gdy nie chcemy jednak wyświetlać wykresu tylko jedną lub kilka wartości w tabeli możemy wykorzystać jedną z bibliotek. Spójrzmy na poniższy kod:

Kod jest dość prosty. Korzystamy z biblioteki gridExtra, dzięki której będziemy…
Read more

Prosta analiza odchyleń (outliers) w Power BI z wykorzystaniem programu R

Follow me on

Slawomir Drzymala

Still playing with data and .NET technologies
Slawomir Drzymala
Follow me on

Dzisiejszy post będzie bardzo krótki, natomiast wynika to też z faktu, że w PowerBI Desktop w połączeniu z “R” możemy uzyskać świetne rezultaty małym nakładem pracy. “Outliers”, czyli wartości, które są skrajnie różne od pozostałych w badanej domenie mogą zniekształcić wynik analiz. Czasami to one będą stanowić najciekawsze punkty obserwacyjne, natomiast w większości przypadków będą “zakłamywać” faktyczny obraz. Weźmy pod uwagę na przykład analizę sprzedaży względem klinetów. Jeżeli stu klientów zamówi średnio po 3 produkty, natomiast stupierwszy zamówi nagle 50 produktów to z badania średniej arytmetycznej będzie wynikać, że klienci średnio kupują po 3.5 produktu. Oczywiście w powyższym przykładzie dość…
Read more

Wyświetlanie tabeli z dodatku R w Power BI Desktop

Follow me on

Slawomir Drzymala

Still playing with data and .NET technologies
Slawomir Drzymala
Follow me on

Korzystając z dodatku, który umożliwia integrację pomiędzy “R” i Power Bi Desktop możemy natknąć się na potrzebę wyświetlenia zwykłej porcji danych lub na przykład pewnego podsumowania danych w formie tabelarycznej. O ile pracując z programem “R” po wpisaniu komendy i jej wywołaniu naszym oczom ukaże się rezultat to rezultat ten zostanie zwrócony bezpośrednio w konsoli. Wspomniany dodatek do Power BI Desktop współpracuje jedynie i wyświetla na raporcie wyłącznie wykresy, a mówiąc ściślej to co znajdzie się w “domyślnym oknie wykresu” (Default Graphical Devices). Możemy natomiast do wyświetlenia danych tabelarycznych użyć dodatkowego pakietu, który pozwoli przekierować tabelę w odpowiednie miejsce i…
Read more