Data Science

Naiwny klasyfikator Bayesa – Analysis Services Data Mining tutorial

Adrian Chodkowski
Follow me

Adrian Chodkowski

SQL geek, Data enthusiast, Consultant & Developer
Adrian Chodkowski
Follow me

Latest posts by Adrian Chodkowski (see all)

Dziś chciałem się napisać parę słów o tym o czym stosunkowo rzadko piszę, a mianowicie o eksploracji danych aka. Data Miningu. Obecnie pojęcie to niejako “przycichło” zagłuszone przez nowe slogany w stylu “Data Science” czy “Machine Learning” ale czy przestało być aktualne? Z całą pewnością nie ponieważ wszystkie te terminy mają coś ze sobą wspólnego, a stare dobre algorytmy eksploracyjne mają się bardzo dobrze. Bohaterem dzisiejszego wpisu jest jeden z najprostszych algorytmów dostępnych w Analysis Services tj. Naiwny klasyfikator Bayesa – zapraszam do lektury! Przy okazji chciałbym wspomnieć o tym, iż nie będę zbytnio zagłębiał się w matematyczną strukturę algorytmu…
Read more

Power BI – wyświetlanie wartości zmiennych z wizualizacji języka R

Slawomir Drzymala
Follow me on

Slawomir Drzymala

Still playing with data and .NET technologies
Slawomir Drzymala
Follow me on

Power BI za pomocą wizualizacji języka R (R script visual) pozwala na wykorzystanie niemalże wszystkich graficznych możliwości pakietu R. W chwili gdy będziemy jednak chcieli wyświetlić wartości pojedynczych zmiennych otrzymamy komunikat z błędem: Zgodnie z komunikatem w Power BI Desktop możemy prezentować wyłącznie wizualizacje, które są generowane przez R Server, a próba wyświetlenia pojedynczej wartości zmiennej skończy się błędem: “Can’t display this visual. No image was created…” W sytuacji gdy nie chcemy jednak wyświetlać wykresu tylko jedną lub kilka wartości w tabeli możemy wykorzystać jedną z bibliotek. Spójrzmy na poniższy kod:

Kod jest dość prosty. Korzystamy z biblioteki gridExtra, dzięki której będziemy…
Read more

Prosta analiza odchyleń (outliers) w Power BI z wykorzystaniem programu R

Slawomir Drzymala
Follow me on

Slawomir Drzymala

Still playing with data and .NET technologies
Slawomir Drzymala
Follow me on

Dzisiejszy post będzie bardzo krótki, natomiast wynika to też z faktu, że w PowerBI Desktop w połączeniu z “R” możemy uzyskać świetne rezultaty małym nakładem pracy. “Outliers”, czyli wartości, które są skrajnie różne od pozostałych w badanej domenie mogą zniekształcić wynik analiz. Czasami to one będą stanowić najciekawsze punkty obserwacyjne, natomiast w większości przypadków będą “zakłamywać” faktyczny obraz. Weźmy pod uwagę na przykład analizę sprzedaży względem klinetów. Jeżeli stu klientów zamówi średnio po 3 produkty, natomiast stupierwszy zamówi nagle 50 produktów to z badania średniej arytmetycznej będzie wynikać, że klienci średnio kupują po 3.5 produktu. Oczywiście w powyższym przykładzie dość…
Read more

Wyświetlanie tabeli z dodatku R w Power BI Desktop

Slawomir Drzymala
Follow me on

Slawomir Drzymala

Still playing with data and .NET technologies
Slawomir Drzymala
Follow me on

Korzystając z dodatku, który umożliwia integrację pomiędzy “R” i Power Bi Desktop możemy natknąć się na potrzebę wyświetlenia zwykłej porcji danych lub na przykład pewnego podsumowania danych w formie tabelarycznej. O ile pracując z programem “R” po wpisaniu komendy i jej wywołaniu naszym oczom ukaże się rezultat to rezultat ten zostanie zwrócony bezpośrednio w konsoli. Wspomniany dodatek do Power BI Desktop współpracuje jedynie i wyświetla na raporcie wyłącznie wykresy, a mówiąc ściślej to co znajdzie się w “domyślnym oknie wykresu” (Default Graphical Devices). Możemy natomiast do wyświetlenia danych tabelarycznych użyć dodatkowego pakietu, który pozwoli przekierować tabelę w odpowiednie miejsce i…
Read more

Excel Data-Mining Add-ins Tutorial krok po kroku

Slawomir Drzymala
Follow me on

Slawomir Drzymala

Still playing with data and .NET technologies
Slawomir Drzymala
Follow me on

Tym razem zostanie przedstawiony Office Data Mining Add-In, czyli dodatek do Microsoft Excel, który służy do eksploracji danych. Eksploracja danych to pojęcie niezwykle szerokie, ale w ogólności oznacza odkrywanie pewnej ukrytej wiedzy z danych. Co prawda w bieżącym i następnych postach będzie trochę informacji teoretycznych, natomiast dociekliwych i zainteresowanych od razu odsyłam na wikipedię (http://en.wikipedia.org/wiki/Data_mining), która będzie dobrym punktem wyjścia do dalszych poszukiwań wiedzy teoretycznej i zgłębiania wiedzy. W tej serii postów zostanie przedstawione wykorzystanie jednego z dostępnych pakietów do analizy danych, a konkretnie dodatku do Excela Office Data Mining Add-In. Zostaną zaprezentowane jego możliwości w kontekście analizy danych oraz…
Read more