Filtrowanie danych w R może odbywać się na wiele różnych sposobów. W ramach dzisiejszego krótkiego artykułu przedstawię jak to zrobić wykorzystując pakiet dplyr. Zaczynajmy! Pierwsze kroki zapewne już znacie – musimy załadować interesujące nas pakiety i stworzyć zmienną typu tbl_df. library(“dplyr”) library(“hflights”) df<-hflights Mając już do dyspozycji interesujące nas funkcje przyjrzyjmy się pierwszej z nich […]
Author: Adrian Chodkowski
dplyr – selekcja atrybutów i aliasowanie
W ostatnim artykule przejrzeliśmy możliwości pakietu pakietu dplyr rozszerzającego możliwości języka R jeśli chodzi o szybkie rozpoznanie danych. Dziś chciałbym zaprezentować jedną z fundamentalnych funkcji wchodzących w skład tego pakietu – chodzi mianowicie o funkcję select. Entuzjaści języka TSQL mogą czuć się jak w domu ponieważ funkcja ta ma podobne znaczenie jak przy manipulacji danymi […]
dplyr – szybkie wyświetlanie danych – tbl_df, sample_n, sample_frac
Język R zdobywa coraz większą popularność w kręgach związanych z szeroko pojętą analizą danych. Obecnie jest on zdecydowanym liderem w tej kategorii i raczej nic w najbliższej przyszłości nie zagrozi jego pozycji. Część z Was na pewno miała do czynienia w mniejszym lub większym stopniu z tym językiem, a po jego integracji z narzędziami platformy […]
Microsoft Data Driven
W ostatnim czasie miało miejsce bardzo ciekawe wirtualne wydarzenie dotyczące platformy danych od Microsoft. Wydarzenie to zostało nazwane Data Driven SQL Event – można było oglądać krótkie sesje na temat wybranego elementu narzędzia. Kluczowym elementem był oczywiście SQL Server oraz funkcjonalności związane z jego najnowszą, niewydaną jeszcze wersją 2016. Sesje były bardzo ciekawe, odpowiedni poziom […]