Pierwsza sesja seequality za nami! Opowiedzieliśmy sobie o planach wykonywania zapytań – mam nadzieję, że się Wam podobało. Poniżej zamieszczam slajdy z tego wydarzenia – myślę, że w niedługim czasie pojawi się zapis wideo oraz pozostałe materiały. Przy okazji zapraszam na kolejną sesję, która odbędzie się 29.04.2016 o godzinie 15:15 w siedzibie firmy JCommerce- to […]
Author: Adrian Chodkowski
dplyr – filtracja i sortowanie rezultatu
Filtrowanie danych w R może odbywać się na wiele różnych sposobów. W ramach dzisiejszego krótkiego artykułu przedstawię jak to zrobić wykorzystując pakiet dplyr. Zaczynajmy! Pierwsze kroki zapewne już znacie – musimy załadować interesujące nas pakiety i stworzyć zmienną typu tbl_df. library(“dplyr”) library(“hflights”) df<-hflights Mając już do dyspozycji interesujące nas funkcje przyjrzyjmy się pierwszej z nich […]
dplyr – selekcja atrybutów i aliasowanie
W ostatnim artykule przejrzeliśmy możliwości pakietu pakietu dplyr rozszerzającego możliwości języka R jeśli chodzi o szybkie rozpoznanie danych. Dziś chciałbym zaprezentować jedną z fundamentalnych funkcji wchodzących w skład tego pakietu – chodzi mianowicie o funkcję select. Entuzjaści języka TSQL mogą czuć się jak w domu ponieważ funkcja ta ma podobne znaczenie jak przy manipulacji danymi […]
dplyr – szybkie wyświetlanie danych – tbl_df, sample_n, sample_frac
Język R zdobywa coraz większą popularność w kręgach związanych z szeroko pojętą analizą danych. Obecnie jest on zdecydowanym liderem w tej kategorii i raczej nic w najbliższej przyszłości nie zagrozi jego pozycji. Część z Was na pewno miała do czynienia w mniejszym lub większym stopniu z tym językiem, a po jego integracji z narzędziami platformy […]