Tag Archive: R

R data analysis language

Wykres Gantt aktywności SQL Server

Gantt report for MS SQL Server
Slawomir Drzymala
Follow me on

Slawomir Drzymala

Still playing with data and .NET technologies
Slawomir Drzymala
Follow me on

Wstęp   Narzędzi oraz sposobów monitorowania poszczególnych obiektów w SQL Server jest wiele i wiele zostało już na ten temat napisane. W tym poście chciałbym pokazać jeden ze sposobów graficznej analizy aktywności różnych obiektów działającej na serwerze Microsoft SQL Server, który – mam nadzieję – nie jest tak bardzo oczywisty. Idea tego postu to przygotowanie wykresu Gantt (https://pl.wikipedia.org/wiki/Diagram_Gantta), który zobrazuje aktywność uruchamianych procedur, pakietów SSIS oraz zadań SQL Server Agent. Taki wykres powinien okazać się przydatny do ogólnej analizy tego, co dzieje się na serwerze, ale również powinien pomóc dokładniej zrozumieć które zadania są wykonywane równocześnie i jakie zależności mogą…
Read more

Power BI – wyświetlanie wartości zmiennych z wizualizacji języka R

Slawomir Drzymala
Follow me on

Slawomir Drzymala

Still playing with data and .NET technologies
Slawomir Drzymala
Follow me on

Power BI za pomocą wizualizacji języka R (R script visual) pozwala na wykorzystanie niemalże wszystkich graficznych możliwości pakietu R. W chwili gdy będziemy jednak chcieli wyświetlić wartości pojedynczych zmiennych otrzymamy komunikat z błędem: Zgodnie z komunikatem w Power BI Desktop możemy prezentować wyłącznie wizualizacje, które są generowane przez R Server, a próba wyświetlenia pojedynczej wartości zmiennej skończy się błędem: “Can’t display this visual. No image was created…” W sytuacji gdy nie chcemy jednak wyświetlać wykresu tylko jedną lub kilka wartości w tabeli możemy wykorzystać jedną z bibliotek. Spójrzmy na poniższy kod:

Kod jest dość prosty. Korzystamy z biblioteki gridExtra, dzięki której będziemy…
Read more

Prosta analiza odchyleń (outliers) w Power BI z wykorzystaniem programu R

Slawomir Drzymala
Follow me on

Slawomir Drzymala

Still playing with data and .NET technologies
Slawomir Drzymala
Follow me on

Dzisiejszy post będzie bardzo krótki, natomiast wynika to też z faktu, że w PowerBI Desktop w połączeniu z “R” możemy uzyskać świetne rezultaty małym nakładem pracy. “Outliers”, czyli wartości, które są skrajnie różne od pozostałych w badanej domenie mogą zniekształcić wynik analiz. Czasami to one będą stanowić najciekawsze punkty obserwacyjne, natomiast w większości przypadków będą “zakłamywać” faktyczny obraz. Weźmy pod uwagę na przykład analizę sprzedaży względem klinetów. Jeżeli stu klientów zamówi średnio po 3 produkty, natomiast stupierwszy zamówi nagle 50 produktów to z badania średniej arytmetycznej będzie wynikać, że klienci średnio kupują po 3.5 produktu. Oczywiście w powyższym przykładzie dość…
Read more

dplyr – selekcja atrybutów i aliasowanie

Adrian Chodkowski
Follow me

Adrian Chodkowski

SQL geek, Data enthusiast, Consultant & Developer
Adrian Chodkowski
Follow me

W ostatnim artykule przejrzeliśmy możliwości pakietu pakietu dplyr rozszerzającego możliwości języka R jeśli chodzi o szybkie rozpoznanie danych. Dziś chciałbym zaprezentować jedną z fundamentalnych funkcji wchodzących w skład tego pakietu – chodzi mianowicie o funkcję select. Entuzjaści języka TSQL mogą czuć się jak w domu ponieważ funkcja ta ma podobne znaczenie jak przy manipulacji danymi bazodanowymi. Tak więc zaczynajmy! Pierwszym krokiem jest oczywiście załadowanie dwóch pakietów: dplyr oraz hflights oraz przypiszmy hflights do obiektu typu tbl_df o nazwie df :

Teraz wprowadzimy podstawową składnię select – poniższe zapytanie pobiera z zestawu df kolumny Year, Month, DayOfYear oraz AirTime:…
Read more

dplyr – szybkie wyświetlanie danych – tbl_df, sample_n, sample_frac

Adrian Chodkowski
Follow me

Adrian Chodkowski

SQL geek, Data enthusiast, Consultant & Developer
Adrian Chodkowski
Follow me

Język R zdobywa coraz większą popularność w kręgach związanych z szeroko pojętą analizą danych. Obecnie jest on zdecydowanym liderem w tej kategorii i raczej nic w najbliższej przyszłości nie zagrozi jego pozycji. Część z Was na pewno miała do czynienia w mniejszym lub większym stopniu z tym językiem, a po jego integracji z narzędziami platformy danych od Microsoft jego znaczenie w naszej codziennej pracy będzie nieprzerwanie rosło. R w pakiecie bazowym daje nam bardzo wiele możliwości manipulacji danymi, jednak można oczywiście używać dodatkowych bibliotek – jedną z najważniejszych w moim mniemaniu jest pakiet dplyr. Pakiet ten daje ogromne możliwości jeśli…
Read more