Data Science

dplyr – selekcja atrybutów i aliasowanie

Follow me

Adrian Chodkowski

SQL geek, Data enthusiast, Consultant & Developer
Adrian Chodkowski
Follow me

W ostatnim artykule przejrzeliśmy możliwości pakietu pakietu dplyr rozszerzającego możliwości języka R jeśli chodzi o szybkie rozpoznanie danych. Dziś chciałbym zaprezentować jedną z fundamentalnych funkcji wchodzących w skład tego pakietu – chodzi mianowicie o funkcję select. Entuzjaści języka TSQL mogą czuć się jak w domu ponieważ funkcja ta ma podobne znaczenie jak przy manipulacji danymi bazodanowymi. Tak więc zaczynajmy! Pierwszym krokiem jest oczywiście załadowanie dwóch pakietów: dplyr oraz hflights oraz przypiszmy hflights do obiektu typu tbl_df o nazwie df :

Teraz wprowadzimy podstawową składnię select – poniższe zapytanie pobiera z zestawu df kolumny Year, Month, DayOfYear oraz AirTime:…
Read more

dplyr – szybkie wyświetlanie danych – tbl_df, sample_n, sample_frac

Follow me

Adrian Chodkowski

SQL geek, Data enthusiast, Consultant & Developer
Adrian Chodkowski
Follow me

Język R zdobywa coraz większą popularność w kręgach związanych z szeroko pojętą analizą danych. Obecnie jest on zdecydowanym liderem w tej kategorii i raczej nic w najbliższej przyszłości nie zagrozi jego pozycji. Część z Was na pewno miała do czynienia w mniejszym lub większym stopniu z tym językiem, a po jego integracji z narzędziami platformy danych od Microsoft jego znaczenie w naszej codziennej pracy będzie nieprzerwanie rosło. R w pakiecie bazowym daje nam bardzo wiele możliwości manipulacji danymi, jednak można oczywiście używać dodatkowych bibliotek – jedną z najważniejszych w moim mniemaniu jest pakiet dplyr. Pakiet ten daje ogromne możliwości jeśli…
Read more

Power Query – tutorial cz. 2

Zapraszamy również do zapoznania się z serią Poznaj Power BI gdzie omawiane są również transformacje Power Query – serię znajdziesz tutaj. W jednym z poprzednich postów został przedstawiony dodatek do Excela Microsoft Power Query. W tym poście temat się nie zmieni i ten wpis również będzie traktował o Microsoft Power Query, zmieni się natomiast zakres materiału. Jak już wspomniano wszystko co zostało zaprojektowane w tym dodatku, jest tłumaczone na język “M”. Dzisiaj właśnie zostaną omówione podstawy, ale nie tylko, tego języka. Zostaną zaprezentowane najważniejsze komendy i polecenia, ale także techniki, które mogą pomóc podczas pracy z Power Query i uczynić…
Read more

Power Query – tutorial cz. 1

Zapraszamy również do zapoznania się z serią Poznaj Power BI gdzie omawiane są również transformacje Power Query – serię znajdziesz tutaj. Microsoft Power Query (PQ) to dodatek do arkusza kalkulacyjnego Microsoft Excel, który został zaprojektowany przez firmę Microsoft do wspierania rozwiązań klasy Self-Service Business Intelligence. Równie przydatny może okazać się jednak do codziennej pracy z danymi, do gromadzenia danych czy przygotowywania ich do odkrywania z nich wiedzy. Pozwala pobierać dane z wielu różnych miejsc; począwszy od relacyjnych baz danych, poprzez dane pochodzące z SharePointa i systemu operacyjnego aż po dowolne dane z dowolnej strony internetowej. Dodatkowo umożliwia wstępną obróbkę danych…
Read more