Ta strona używa cookies. Dowiedz się więcej o celu ich używania i zmianie ustawień cookies w przeglądarce.
Korzystając ze strony wyrażasz zgodę na używanie cookies, zgodnie z aktualnymi ustawieniami przeglądarki.

Zamknij X
Strona główna  Baza Wiedzy   Analiza Danych cz. 3
Logo SOFTRONIC

Ośrodek Szkoleniowy i Egzaminacyjny

Analiza Danych cz. 3

08.06.17r.

Podziel się:

        

PowerQuery

Witam serdecznie,
 
tym razem chciałbym przybliżyć Wam dodatek PowerQuery. Miłej lektury.

Pierwszą rzeczą jest oczywiście instalacja/włączenie dodatku w programie MS Excel. Tutaj Microsoft zrobił niespodziankę ponieważ dołączył Power Query do programu wersji 2016. Znajduje się on w zakładce dane jako sekcja „Pobieranie i przekształcanie”.
 

Dla poprzednich wersji MS Excel trzeba pobrać ze strony Microsoft pliki instalacyjne (odpowiednio dla posiadanych wersji 32 czy 64 bitowych):
 

Po zainstalowaniu, na wstążce pojawi się nowa zakładka „Power Query”.
 
Główną funkcją Power Query jest „Nowe zapytanie”. Służy ona do definiowania wczytania czy  modyfikacji danych, na którym będziemy pracować dalej. Co wyróżnia tą funkcje to to, że wszystko co robimy na danych będzie zapisywane w postaci kolejnych kroków. Kroki te możemy również modyfikować (zmieniać kolejność, usuwać itp.). Gdy wybierze się  „Nowe zapytanie” rozwinie się menu dające wybór źródła danych:
 
Podobnie jak ma to miejsce w Power Pivot, mamy bardzo bogaty wybór źródeł danych: 
 

Do dalszych przykładów wykorzystam bazę danych AdventureWorks (bazę można pobrać ze strony Codeplex https://msftdbprodsamples.codeplex.com). Baza ta zawiera dane dotyczące sprzedaży, klientów, pracowników, towarów itd. 
Po wprowadzeniu adresu serwera pojawia lista obiektów bazy tzw. Nawigator, do których dany użytkownik ma dostęp:
 

Rozwijając drzewko bazy zobaczymy, że jest oprócz do tabel, dostęp również do widoków czy funkcji. Wybierając interesujący nasz obiekt, po prawej stronie pojawi się podgląd danych:
 

Po wybraniu opcji Załaduj, następuje wczytanie tych danych do arkusza w MS Excel:
 

Na pierwszy rzut oka nie jest nic nadzwyczajnego, ot wczytanie danych. Widać, że te dane stały tabelą w programie i mogę wykonać na niej znane już nam operacje (zakładka Projektowanie). Prawdziwa moc pojawie się w momencie przejścia na zakładką Zapytanie:
 

 
W tej zakładce kluczową opcją jest Edycja. Można by spytać „Ale czego edycja, przecież tylko wczytaliśmy dane ?”. I to jest właśnie clou - edycja procesu wczytywania danych. Gdy wybierzemy tą opcję pojawi się nowe okno (tak jak w Power Pivot) nazwane „Edytor zapytań”:
 

 
Teraz można modyfikować zbiór danych. Każda czynności zostanie zapisana w oknie „Zastosowane Kroki”. Całość stanie się automatycznym procesem zaczytywania i przekształcania danych, które będą potem wykorzystywane dalej nie tylko w MS Excel ale także mogą zostać wykorzystane do załadowania do PowerBI online.

Do każdej operacji można wrócić, zmienić ustawienia  czy usunąć . Należy pamiętać, że działamy na całych kolumnach (tak jak w Power Pivot) a nie na pojedynczych komórkach. 
Po kliknięciu prawym przycisku myszki na kolumnie pojawi się menu czynności, które można na tej kolumnie wykonać:

Oprócz standardowych czynności typu jak usunięcie kolumny, można również wykonać operacje z zakresu DQS (Data Quality Services): Usun duplikaty, Usuń błędy, Zamień wartości czy Zamień błędy. Operacje stosuje się wtedy, gdy dane, które wczytujemy trzeba przekształcić po to aby zapewnić odpowiednią jakość danych. Tą funkcjonalność można też zastosować przy tłumaczeniu z jednego języka na drugi (Ms. Jako Panna Mr. Jako Pan).
 
Ciekawą opcją jest możliwość liczenia na tym etapie agregatów danych „Grupuj według”
 
 
Po zatwierdzeniu wyboru pojawi zliczony agregat:


Gdy dane są już prawidłowo przekształcone, wystarczy wybrać „Zamknij i załaduj” aby wrócić do arkusza w MS Excel:

Warto zauważyć, że program automatyczne konwertuje wartości null na puste komórki. Jak widać na powyższym obrazku, można mieć wiele Zapytań dotyczących różnych danych. Dane uzyskane w ten sposób są w dalszej kolejności przekształcane/analizowane/tworzone na ich podstawie wykresy w zwykłym MS Excel. 
Oczywiście możliwości modyfikacji zbioru danych jest więcej, wystarczy spojrzeć na zakładki Przekształć czy Dodaj kolumnę:
 

 
 

Są tutaj operacje zarówno na tabeli (transpozycja czy odwracanie wierszy) jak i na typach danych (wyciąganie fragmentów danych z kolumny). 
Każda taka czynność zostanie zapisana jako kolejny krok, który potem będzie można edytować.
 
Dziękuję i zapraszam na kolejną odsłonę Analizy danych.
 
--------------------------------------------------------------------------
Autor:
Andrzej Ostrowski - MCT, MCSE: Data Platform, Business Intelligence, Communication

« powrót