Tag Archive: data mining

Naiwny klasyfikator Bayesa – Analysis Services Data Mining tutorial

Dziś chciałem się napisać parę słów o tym o czym stosunkowo rzadko piszę, a mianowicie o eksploracji danych aka. Data Miningu. Obecnie pojęcie to niejako “przycichło” zagłuszone przez nowe slogany w stylu “Data Science” czy “Machine Learning” ale czy przestało być aktualne? Z całą pewnością nie ponieważ wszystkie te terminy mają coś ze sobą wspólnego, a stare dobre algorytmy eksploracyjne mają się bardzo dobrze. Bohaterem dzisiejszego wpisu jest jeden z najprostszych algorytmów dostępnych w Analysis Services tj. Naiwny klasyfikator Bayesa – zapraszam do lektury! Przy okazji chciałbym wspomnieć o tym, iż nie będę zbytnio zagłębiał się w matematyczną strukturę algorytmu…
Read more

Prosta analiza odchyleń (outliers) w Power BI z wykorzystaniem programu R

Dzisiejszy post będzie bardzo krótki, natomiast wynika to też z faktu, że w PowerBI Desktop w połączeniu z “R” możemy uzyskać świetne rezultaty małym nakładem pracy. “Outliers”, czyli wartości, które są skrajnie różne od pozostałych w badanej domenie mogą zniekształcić wynik analiz. Czasami to one będą stanowić najciekawsze punkty obserwacyjne, natomiast w większości przypadków będą “zakłamywać” faktyczny obraz. Weźmy pod uwagę na przykład analizę sprzedaży względem klinetów. Jeżeli stu klientów zamówi średnio po 3 produkty, natomiast stupierwszy zamówi nagle 50 produktów to z badania średniej arytmetycznej będzie wynikać, że klienci średnio kupują po 3.5 produktu. Oczywiście w powyższym przykładzie dość…
Read more

Excel Data-Mining Add-ins Tutorial krok po kroku

Tym razem zostanie przedstawiony Office Data Mining Add-In, czyli dodatek do Microsoft Excel, który służy do eksploracji danych. Eksploracja danych to pojęcie niezwykle szerokie, ale w ogólności oznacza odkrywanie pewnej ukrytej wiedzy z danych. Co prawda w bieżącym i następnych postach będzie trochę informacji teoretycznych, natomiast dociekliwych i zainteresowanych od razu odsyłam na wikipedię (http://en.wikipedia.org/wiki/Data_mining), która będzie dobrym punktem wyjścia do dalszych poszukiwań wiedzy teoretycznej i zgłębiania wiedzy. W tej serii postów zostanie przedstawione wykorzystanie jednego z dostępnych pakietów do analizy danych, a konkretnie dodatku do Excela Office Data Mining Add-In. Zostaną zaprezentowane jego możliwości w kontekście analizy danych oraz…
Read more