Korzystając z dodatku, który umożliwia integrację pomiędzy “R” i Power Bi Desktop możemy natknąć się na potrzebę wyświetlenia zwykłej porcji danych lub na przykład pewnego podsumowania danych w formie tabelarycznej. O ile pracując z programem “R” po wpisaniu komendy i jej wywołaniu naszym oczom ukaże się rezultat to rezultat ten zostanie zwrócony bezpośrednio w konsoli. Wspomniany dodatek do Power BI Desktop współpracuje jedynie i wyświetla na raporcie wyłącznie wykresy, a mówiąc ściślej to co znajdzie się w “domyślnym oknie wykresu” (Default Graphical Devices).
Możemy natomiast do wyświetlenia danych tabelarycznych użyć dodatkowego pakietu, który pozwoli przekierować tabelę w odpowiednie miejsce i zaprezentować ją jako – de facto – wykres. W tym celu możemy użyć pakietu “gridExtra”. Poniżej dwa przykładowe scenariusze użycia.
Zanim jeszcze zaczniemy musimy zadbać o to, aby pakiet został pobrany i zainstalowany na maszynie na której znajduje się program “R”. W tym celu wywołujemy oczywiście komendę:
install.packages("gridExtra")
Od tej pory możemy korzystać z tego pakietu również wewnątrz Power BI Desktop wskazując chęć skorzystania z wybranego pakietu dodatkowego:
library(gridExtra)
Posłużmy się prostym przykładem w którym chcemy wyświetlić tabelę, którą przekazujemy bezpośrednio do wizualizacji. W tym przypadku wybierzemy kategorię produktu oraz sumy ich zamówień. Wyświetlenie tabeli sprowadza się do wywołania odpowiedniej funkcji.
Cały kod programu “R” sprowadza się do dwóch linijek:
library(gridExtra) grid.table(dataset)
W wyniku rzeczywiście jesteśmy w stanie zobaczyć tabelę z wynikiem.
Bardziej realnym przypadkiem użycia będzie natomiast wyświetlanie pewnych próbek danych czy też wyświetlanie statystyk dotyczących danego zbioru. Zbiorem danych do analizy w tym przypadku będą poszczególni klienci (numer identyfikacyjny klienta) oraz liczba zamówień jakich dokonał.
Teraz wykorzystując pozostałe funkcjonalności pakietów “R” możemy “ręcznie” zbudować tabelę z pożądanymi rezultatami – w tym przypadku będą to podstawowe wartości statystyczne dotyczące danego zbioru.
# load libraries library(gridExtra) # change column names to be without special characters colnames(dataset) <- c("OrderQuantity","AccountNumber") # evaluate the disired statistics number_of_rows <- nrow(dataset) min_value <- min(dataset$OrderQuantity) max_value <- max(dataset$OrderQuantity) median_value <- median(dataset$OrderQuantity) mean_value <- mean(dataset$OrderQuantity) sd_value <- sd(dataset$OrderQuantity) #create blank table with one column x <- matrix(c("Value"), ncol=1) # add calculated values into table as rows y <- rbind(x, number_of_rows) y <- rbind(y, min_value) y <- rbind(y, max_value) y <- rbind(y, median_value) y <- rbind(y, mean_value) y <- rbind(y, sd_value) # create the table as plot grid.table(y)
Rezultatem będzie następujący widok:
Jak widać na powyższych przykładach również i w tym przypadku połączenie Power BI Desktop i programu “R” spełnia oczekiwania i pozwala realizować kompleksowe problemy.
- Docker dla amatora danych – Tworzenie środowiska (VM) w Azure i VirtualBox (skrypt) - April 20, 2020
- Power-up your BI project with PowerApps – materiały - February 5, 2020
- Docker dla “amatora” danych – kod źródłowy do prezentacji - November 18, 2019
Last comments