Analiza Danych cz. 6
02.03.18r.
Power BI: kompleksowe rozwiązanie do analizy danych, które eliminuje potrzebę korzystania z MS Excel. Zapraszam do zapoznania się z funkcjonalnościami i wersjami tego narzędzia.
W tym artykule chciałbym przybliżyć program
Power BI, łączący, wspomniane przeze mnie wcześniej w poprzednich artykułach, funkcjonalności w jeden osobny produkt bez potrzeby posiadania aplikacji
MS Excel.
PowerBI można używać na trzy sposoby.
Pierwszy,historycznie, to wersja online – „przeglądarkowa”. Wymaga ona założenia konta Microsoft. Można wykupić wersję „firmową” i korzystać z niej w ramach pakietu O365. Taka opcja umożliwia na udostępnianie/korzystanie z raportów w całej firmie.
Drugi sposób to instalacja lokalna aplikacji PowerBI Desktop. Czyli zamiast w przeglądarce, uruchamia się na komputerze osobny program. Raporty w nim stworzone możemy albo dystrybuować w postaci pliku *.pbix albo również umieszczać/publikować online.
Trzeci sposób dostępny od końca zeszłego roku to PowerBI Server. Opcja ta umożliwia dystrybucje raportów tak jak w wersji online tylko lokalnie w ramach firmy. Jest szczególnie ważne dla firm, które ze względów prawnych/bezpieczeństwa nie chcą tworzyć/udostępniać raportów w chmurze.
W tym odcinku zajmiemy się PowerBI Desktop.
Pierwszą rzeczą, jaką należy wykonać to instalacja programy. Aby tego dokonać należy pobrać wersję instalacyjną *.msi ze strony powerbi.com - należy sprawdzić, która wersja jest odpowiednia dla nas: 32-bit x86 czy 64-bit x64 (wersja 64-bit będzie mogła użyć więcej pamięci RAM).
Przy uruchomieniu programu pokaże się domyślnie ekran powitalny:
Możemy przejść od razu do wczytywanie danych „Get data” (także z zapamiętanych poprzednich źródeł danych „Recent sources”) czy też wczytać inne raporty „Open other reports”. Jeżeli korzystamy z PowerBI Desktop jako klienta wersji online to możemy od razu zalogować na to konto. Oprócz tego możemy skorzystać z linków powiązanych z bazą wiedzy nt. Power Bi. Jeśli nie chcemy korzystać z tych opcji, można zamknąć okno wybierając krzyżyk (cancel).
Główne okno po otwarciu programu wygląda tak:
Domyślnym trybem pracy jest tworzenie raportów/wizualizacji (PowerView i PowerMap). Ekran podzielny jest cztery części: pierwsza to wstążka w stylu MsOffice, druga to tryb pracy (po lewej stronie), trzecia to główne miejsce pracy danego trybu (środek ekranu - w tym trybie, strony z raportami) oraz czwarta to opcje danego trybu (po prawej stronie – opcje wizualizacji).
W zależności od trybu pracy podział ekranu będzie się zmieniał (tzn. wstążka pozostaje bez zmian – oprócz opcji w zależności od trybu pracy oraz tryb pracy):
Aby zobaczyć większe różnice należy wczytać dane. Tutaj Power BI daje dużą pulę źródeł danych poczynając od pliku poprzez bazy danych (np.: MS SQL, Oracle, IBM DB2, SAP,…), chmurę (Azure) a na innych usługach online (np.: Google Analitycs, Salesforce, MsDynamics,…) kończąc. Po wybraniu opcji „Get Data” z grupy opcji „External Data” na wstążce, pojawi się lista/listy możliwości importu:
Do dalszych przykładów wykorzystam bazę danych AdventureWorksDW (bazę można pobrać ze strony Codeplex
https://msftdbprodsamples.codeplex.com/ ). Baza ta zawiera dane dotyczące sprzedaży, klientów, pracowników, towarów itd.
Po wybraniu „SQL Server database” trzeba podać dane bazy (okno można poszerzyć poprzez rozwinięcie „Advanced options” gdzie można wpisać konkretne zapytanie SQL) oraz tryb podłączenia się do danych (Data Connectivity mode). Import – importuje dane do Power BI (tak jak PowerPivot – opcja domyślna) a Direct Query zapisuje sobie definicje danych (czyli dane nie są zapisywane w pliku PowerBI).
Domyślnie zaimportowane zostaną także kolumny używane w relacjach w bazie danych – „Include relationship columns”.
Po wybraniu „ok” pojawią się bazy danych z danej instancji do której posiadamy uprawnienia.
W wybieramy tabele/widoki , z których będziemy korzystać.
Można skorzystać z opcji „Select RElated Tables” aby zaznaczyć tabele powiązanie relacjami z aktualnym wyborem – w typ przykładzie jest to FactResllerSales” i tabele powiązane.
Teraz można zrobić dwie rzeczy albo wczytać wszystkie dane „Load” albo edytować źródło danych „Edit”. Gdy wybierz się edycję pojawi się ekran do edycji kroków importu (PowerQuery):
Jeżeli nie to zobaczymy tylko ekran ładowania danych:
Po pobraniu danych PowerBI wraca do pierwszego ekranu – wizualizacji.
Jak widać po prawej stronie pojawiły się pola „Fields” do wyboru do wizualizacji. Wybierając prawym przyciskiem myszy na nazwie tabeli możemy: edytować to zapytanie „Edit Query” – czyli wchodzimy w tryb PowerQuery, edytować poprzez dodanie nowych pól/kolumn czy nowych miar –tryb PowerPivot, ukryć – „Hide”, usunąć – „Delete” czy też oznaczyć tabele jako tabele dat – „Mark as date table” – PowerPivot.
Można przejść w tryb edycji danych (PowerPivot):
Można przejść w tryb edycji relacji (PowerPivot):
Po dostosowaniu danych można przejść do wizualizacji – PowerView – dla przykładu pole „Sales Amount” i wykres kolumnowy:
W zależności od rodzaju wizualizacji dostępne będą parametry do skonfigurowania:
Wybranie natomiast kolejnego pola spowoduje dostosowanie się wykresu(aby powiększyć wykres na cały ekran wybieramy w prawym górnym rogu opcje maksymalizacji):
Jeżeli są utworzone hierarchie to można z nich od razu skorzystać poprzez opcje „w wwiercania się” i zmienić w tym przydatku z rok na miesiąc.
Dane można posortować po polach, które używamy. Aby wrócić do slajdu wystarczy wybrać „Back to Report”.
W momencie skorzystania z wizualizacji w postaci map/y (PowerMap), należy pamiętać aby znalazły się dane zawierające dane geograficzne:
W około Power BI działa silnie społeczność dzięki, której można zaimportować inne wizualizacje:
W akwarium oprócz tego, że rybki pływają to: kolor oznacza serię danych (w tym przydatku pracownika), wielkość oznacza sprzedaż. W sytuacji, gdy są wartości ujemne lub jest trend malejący to rybki pływają do góry brzuchem .
Wersja online PowerBI posiada funkcjonalność Q&A tzn., że można wydawać polecenia w języku naturalnym np.: jaka była tegoroczna sprzedaż i zeszłoroczna sprzedaż według miesięcy jako wykres warstwowy (obrazek pochodzi z https://docs.microsoft.com/).
Dziękuję i zapraszam na kolejną odsłonę Analizy danych.
--------------------------------------------------------------------------
Autor:
Andrzej Ostrowski - MCT, MCSE: Data Platform, Business Intelligence, Communication