Analiza Danych cz. 2
14.04.17r.
PowerPivot może rewolucjonizować pracę z danymi w Excelu. Wprowadzenie do instalacji, funkcji i praktycznego zastosowania tego potężnego dodatku.
Witam serdecznie,
w tym artykule chciałbym przybliżyć Wam dodatek
PowerPivot. Miłej lektury.
Pierwszą rzeczą jest oczywiście instalacja/włączenie dodatku w programie MS Excel. Aby tego dokonać należy w menu Plik->Opcje->Dodatki, na dole strony w opcji Zarządzaj, wybrać „Dodatki COM” i kliknąć Przejdź
Z menu, które się pojawiło zaznaczmy interesujący nas dodatek (w tym przypadku „
Microsoft Power Pivot for Excel”) i potwierdzamy OK.
Po zatwierdzeniu, na wstążce pojawi się nowa zakładka.
Główną funkcją Power Pivot jest Zarządzaj. Służy ona do definiowania modelu danych (wczytania, modyfikacji i relacji danych), na którym będziemy pracować dalej. Po jej wybraniu pojawi się dodatkowe okno aplikacji (okno jest w stylu MS Office).
Pierwszym krokiem jest wczytanie danych. Do tego celu wybieramy opcje „Pobieranie danych zewnętrznych”.
Lista źródeł danych jest imponująca : Microsoft SQL Server, Microsoft SQL Azure, Microsoft SQL Parallel Data Warehouse, Microsoft Access, Oracle, Teradata, Sybase, Informix, IBM DB2, OLEDB/ODBC, Microsoft Analysis Services, Raport, Microsoft Azure Marketplace, sugeruj dane pokrewne, Inne strumieniowe źródła danych, plik programu Excel, plik tekstowy.
Do dalszych przykładów wykorzystam bazę danych AdventureWorks (bazę można pobrać ze strony Codeplex
https://msftdbprodsamples.codeplex.com/ ). Baza ta zawiera dane dotyczące sprzedaży, klientów, pracowników, towarów itd.
Pierwszą rzeczą, którą warto zauważyć to, że w PowerPivot zastosowano nowy sposób na przechowywanie danych zarówno w pamięci jak i na dysku. Dzięki temu plik MS Excel szybciej się przetwarza/oblicza jak i zajmuje mniej miejsca.
Wczytałem, do arkusza jak i do PowerPivot, te same dane dotyczące szczegółów zamówienia (SalesOrderDetails). 727903 rekordów w formacie:
I teraz porównanie wielkości (test1.xlsx – dane w arkuszu, test2.xlsx – dane w PowerPivot):
Drugą funkcjonalnością, o której wspomniałem w pierwszej części to możliwość tworzenia relacji/powiązania między arkuszami. Przydaje się to w sytuacji kiedy mamy arkusze/tabele „słownikowe” z danymi, które musiałby się znaleźć w arkuszu z danymi do analizy.
Dla przykładu wczytam dwie tabele: Orders i OrderDetails (ang. zamówienia i pozycje zamówienia):
Każda tabela jest w osobnym arkuszu. Aby zobaczyć/tworzyć relacje zmieniam widok z „Widoku danych” na „Widok diagramu”:
Pokazuje widok samych tabel bez danych tylko z nazwami kolumn:
Teraz można tworzyć relacje – najprostszy sposób to przeciągnięcie pola z jednej tabeli na pole w drugiej tabeli, w ten sposób wiążemy te tabele.
W tym przypadku pole OrderID z tabeli Orders z polem OrderID tabeli OrderDetails (pola w tabelach nie muszą tak samo się nazywać ale dzięki temu, że tak jest łatwiej się rozeznać w danych).
Program jest na tyle inteligentny, że od razu oznacza rodzaj relacji – jeden do wielu 1 -> * (taki rodzaj relacji mówi o tym, że jednemu elementowi z tabeli Orders przypisane może być jeden lub wiele elementów z tabeli OrderDetails) – zamówienie składa się z wielu pozycji zamówień. W razie problemów można prawym przyciskiem myszy na relacji wejść do jej edycji:
Pojawi się wtedy okno edycji:
Po skończeniu prac nad relacjami, można dokonać analizy tych danych przy pomocy tabeli przestawnej.
Tutaj wybrano CustmerID z tabeli Orders oraz sumę po Quantity czyli sumę zamówionych towarów przypadających na jednego klienta. Oczywiście te dane można wiązać dalej z innymi tabelami:
I wtedy nasza analiza w powiązaniu z tabelą Customers (ang. klienci) będzie wyglądać tak, że zamiast CustomerID będzie już np. danego klienta:
Dziękuję i zapraszam na kolejną odsłonę Analizy danych.
PS.
Może się zdarzyć, że tabele, które importujemy posiadają dużą liczbę kolumn. Przez to czasami wybór odpowiedniego pola do tabeli przestawnej jest kłopotliwy. Istnieje możliwość ukrycia kolumn przed analizą w tabeli przestawnej. Aby tego dokonać należy w trybie Widok diagramu zaznaczyć te kolumny a następnie wybrać prawym przyciskiem „Ukryj przed narzędziami klienta”:
--------------------------------------------------------------------------
Autor:
Andrzej Ostrowski - MCT, MCSE: Data Platform, Business Intelligence, Communication