Konsolidacja i scalanie danych w Power Query
28.01.25r.
Dowiedz się, jak szybko i łatwo konsolidować i scalać dane z różnych źródeł, tworząc spójne raporty. Odkryj narzędzia, które ułatwią pracę z BIG DATA i pozwolą na precyzyjne analizy w mgnieniu oka!
Niezwykle istotnym zagadnieniem w pracy z danymi jest możliwość konsolidacji wielu zbiorów danych do jednego zbiorczego. Szczególnie jest to istotne w przypadku
BIG DATA. Nowoczesne narzędzia konsolidacyjne takie jak
POWER QUERY umożliwiają połączenia danych za pomocą relacji lub dodawanie ich do siebie. Narzędzia te mogą działać w oparciu o specjalizowane konektory do danych składowanych zarówno w klasycznych hurtowniach danych jak i w źródłach online. Przy czym istotne jest to, że nie musimy pobierać wszystkich danych na dysk lub do pamięci komputera, a jedynie pracujemy na zapytaniach, które możemy bezpośrednio przekształcać do raportów.
Możemy konsolidować dane korzystając z:
-
Dołączania zapytań
-
Scalania zapytań
Dołączanie zapytań
Operacja dołączania tworzy pojedynczą tabelę, dodając zawartość jednej lub większej liczby tabel do innej i agregując nagłówki kolumn z tabel w celu utworzenia schematu dla nowej tabeli.

W wyniku scalania otrzymujemy jedną tabelę zawierającą zawartość wszystkich cząstkowych.

Istotne jest to, że agregacji podlegają nagłówki tabel i dane z identycznych kolumn są dołączane a odrębne kolumny są dodawane do zestawu. Kolumny nie muszą występować w tej samej kolejności.
Scalanie Zapytań
Jeśli tabele posiadają pole, po którym możemy scalić dane np. pochodzą z bazodanowego źródła, w którym są stosowane relacje lub są odpowiedni przygotowane, to możemy te dane scalić. Istotnym jest, aby pole klucza, po którym będziemy scalać spełniało reguły relacyjności – tzn. zawierało unikalne wartości przynajmniej w jednej tabeli, było tego samego typu i nie zawierało wartości NULL.
Mechanizm scalania zapytań łączy dwie istniejące tabele na podstawie pasujących wartości z jednej lub wielu kolumn. Możesz użyć różnych typów sprzężeń, w zależności od żądanych danych wyjściowych.

Przykładowo, jeśli w tabeli wszystkich klientów mamy pole waluta i utworzyliśmy zapytanie do pliku lub zasobu online np. kursów walut NBP w którym będziemy mieć aktualne kury walut to możemy przypisać transakcjom wykonywanym w danej walucie jej aktualny kurs.

W wyniku otrzymujemy jedną tabelę, w której będziemy widzieć wartości z obu scalanych tabel.

Tak skonsolidowane dane możemy już używać w analizach business intelligence tworząc raporty za pomocą tabeli przestawnej lub narzędzi Power BI.