Dataflow

Něco, co nám do Power BI světa minulý rok přibylo. Co to ale je? K čemu se to hodí? Dvě krásné otázky, které slýchám velmi často, když začnu o Dataflow (Toky dat) mluvit. Nebo občas bývám opraven, že se to jmenuje Power Flow (Automate). Pak následuje chvíle, kdy vysvětluji, že se opravdu jedná o Dataflow a s Power Automate to nemá moc společného. Pojďme si tedy na tyto otázky také odpovědět zde. Na otázku, jak Dataflow vytvořit můžete nalézt odpověď zde.

Co je to Dataflow?

Pro představu si zkusme připustit, že Dataflow je vlastně jen Power Query, která jen běží v cloudu. To vyvolává další dotaz. Když ale vypublikuji svou datovou sadu do Power BI Service, tak mé Dotazy (Query) běží v cloudu. Ano, je pravda, že když vypublikujete datovou sadu, a budete ji aktualizovat, tak se váš Power Query skript v cloudu spustí. Rozdíl oproti tomu zde nastává v tom, že dataflow může být zdrojem pro další datové sady. Takové vzájemné chování ale u jednotlivých datových sad však není.  Dalším rozdílem je zde pak to, že jednotlivé dataflow se mohou aktualizovat samy o osobě bez ohledu na navázané datové sady. Jde tedy o dotazy (query), které probíhají v cloudu a jsou nezávislé na libovolném reportu. Dataflow je možné vytvořit v rámci Power BI Service v týmových pracovních prostorách.

Zde si vytvoříte nové entity pro Common Data Service nebo využijete již stávající.

Dataflow vytvoření Entity nebo importování modelu
Kde se mi tedy data pro dataflow ukládají?

Všechna načtená data se ukládají do Azure Data Lake generace 2. Úložiště Azure Data Lake je cloudové úložiště společnosti Microsoft, které může ukládat strukturovaná data (jako tabulky) a nestrukturovaná data (jako soubory). Data se sem ukládají bez nutnosti, abyste ho vlastnili, nastavovali, spravovali nebo za něj platili. Veškeré ukládání, nastavování a správa tedy probíhají interně, kdy vše nastavuje právě Dataflow. Pokud ale Azure Data Lake vlastníte, pak v Portálu pro správu (Admin portal) máte možnost přesměrovat Dataflow, aby data ukládalo sem.

Jak Dataflow ukládá data
Jak zpracovaná data získat do Power BI Desktop?

V Power BI Desktop si zvolením nabídky Načíst data v sekci Domovská Stránka zobrazíte konektory. Mezi konektory se nachází konektor, který se jmenuje „Toky dat Power BI“ (Dataflow Power BI). Po přihlášení si můžete vybrat z již vytvořených tabulek v jednotlivých dataflows. Tabulky se vám do Power Query vloží stejně jako ostatní datové zdroje a můžete je dále editovat.

K čemu se dataflow hodí?

Přepoužitelnost

Základním příkladem je přepoužitelnost. Představte si, kolikrát jste si říkali, že tenhle jeden konkrétní dotaz budete potřebovat pro více reportů. Takže jste si ho pak kopírovali do nového souboru a všude se musí počítat znovu a znovu celý. Místo toho lze použít dataflow, kde vytvoříte dotaz jednou a datové sady, které tento dotaz potřebují, se na něj jen připojí. Takové scénáře se hledají velmi jednoduše. Například datumová tabulka, kterou převedete do všech potřebných datasetů.

 

Aktualizace

Dalším, v příkladech použití, je rozpadlý harmonogram aktualizací dat. Představte si, že máte databázi se zaměstnanci. Databáze se mění jen jednou za čas a vyžaduje větší čas na její zpracování. Pro naše účely řekněme, že se mění jednou za měsíc. Vedle toho ale máte výkaz práce, který se aktualizuje každý den. Možností je každý den provést aktualizace všech dotazů, což by znamenalo se všech databází dotazovat každý den a pak provádět transformační operace. Druhou možností je databázi se zaměstnanci zpracovat pomocí dataflow. Nastavit aktualizaci jednou za měsíc a pro report při aktualizaci načítat již hotová a připravená data, která se doplní o každodenní úpravu z dotazu nad výkazy práce.

 

Jistota historických dat

Pokud se stane cokoliv, co zapříčiní, že dataflow nebude schopné proběhnout v pořádku, tak máte jistotu, že to neohrozí celistvost vašich reportů. Dokud dataflow neproběhne v pořádku, tak všechny reporty budou číst historická data z doby poslední úspěšné aktualizace.

Related Posts

Leave a comment

Privacy Preferences
When you visit our website, it may store information through your browser from specific services, usually in form of cookies. Here you can change your privacy preferences. Please note that blocking some types of cookies may impact your experience on our website and the services we offer.