[Explained] Cum se realizează modelarea datelor în Power BI

Sunteți nou în Power BI sau doriți să îl cunoașteți mai bine? Ar trebui să începeți cu modelarea datelor în Power BI și apoi să vă parcurgeți minarea datelor și, în final, să extrageți informații utile din rapoartele Power BI.

Modelarea datelor se află în centrul oricărui proiect de analiză a datelor. Rămâne sub vizualizările reale de date și tablourile de bord pe care le vede publicul general.

La fel ca orice alt instrument de analiză a datelor, Power BI De asemenea, necesită modelarea datelor în backend pentru integrarea datelor, transformarea datelor, crearea de relații între diferite tabele ale setului de date de intrare, adăugarea de calcule și așa mai departe.

Continuați să citiți pentru a afla tot ce trebuie să știți despre modelarea datelor în Power BI, inclusiv îndrumări pas cu pas fără efort despre cum să creați un model de date Power BI.

Ce este modelarea datelor?

În modelarea datelor, creați o reprezentare simplificată a structurilor de date, a relațiilor și a atributelor prin legarea blocurilor subiacente ale seturilor de date, cum ar fi tabele, rânduri, coloane etc.

Ajută la organizarea și înțelegerea datelor pentru stocare, recuperare și analiză eficiente. Modelul de date backend ajută la proiectarea bazelor de date, a software-ului și a sistemelor.

Modelarea datelor implică identificarea entităților, definirea proprietăților acestora și arătarea modului în care acestea se conectează între ele pentru a genera modele și perspective acționabile. Este esențial pentru analiza datelor, pentru a asigura acuratețea datelor și pentru a sprijini procesele de luare a deciziilor.

Cât de esențial este pentru analiza datelor în Power BI

Modelarea datelor joacă un rol esențial în instrumentele de analiză a datelor, cum ar fi Power BI. Acest instrument de business intelligence se bazează pe modele de date bine structurate pentru a crea vizualizări și perspective semnificative.

Folosind principiile de modelare a datelor, puteți conecta, transforma și vizualiza în mod eficient datele din mai multe surse într-un set de date mare. Modelarea datelor în Power BI vă ajută, de asemenea, să vă asigurați că datele prezentate în aceste instrumente de analiză sunt corecte și relevante

În cele din urmă, facilitează luarea deciziilor în cunoștință de cauză și deblochează întregul potențial al informațiilor bazate pe date. În esență, acționează și ca fundație pe care instrumente puternice de analiză a datelor, cum ar fi Power BI, pot oferi informații valoroase de afaceri.

Tipuri de modelare a datelor

#1. Modelarea conceptuală a datelor

Se concentrează pe imaginea de ansamblu a datelor. Deci, modelarea conceptuală reprezintă datele la un nivel înalt, fără a lua în considerare structuri specifice de baze de date sau detalii tehnice. Acest concept ajută la alinierea datelor cu obiectivele organizaționale și ajută părțile interesate să înțeleagă scopul și semnificația datelor.

#2. Modelarea datelor fizice

Când modelați setul de date pe baza aspectului de implementare tehnică pentru stocare și recuperare, aceasta este modelarea datelor fizice. Specifică structurile de stocare a datelor, cum ar fi tabele, indecși și constrângeri, pe care le puteți utiliza într-un sistem de baze de date.

#3. Modelarea logică a datelor

Modelarea logică a datelor face o punte între modelarea conceptuală și cea fizică. O astfel de modelare servește ca model pentru proiectarea bazei de date și facilitează comunicarea între părțile interesate de afaceri și echipele tehnice, menținând în același timp integritatea și coerența datelor.

Tehnici de modelare a datelor în Power BI

#1. Schema stelelor

Schema Star este o tehnică de modelare a datelor foarte utilizată în Power BI. În această abordare, există un tabel de fapte central care conține metrici și măsuri cheie, înconjurat de tabele de dimensiuni care oferă context datelor. Se numește „stea” deoarece Tabelul de fapte este în centru, conectat la Tabelele de dimensiuni ca punctele unei stele.

#2. Cardinalitatea

Cardinalitatea definește relația dintre tabele în Power BI. Specifică câte valori unice dintr-un tabel se potrivesc cu valorile din altul. Opțiunile de cardinalitate includ One to One, One to Many și Many to One. Alegerea cardinalității potrivite este crucială pentru modelarea corectă a datelor.

#3. Direcția filtrului încrucișat

Modul în care un filtru aplicat datelor dintr-un tabel conectat va afecta datele celuilalt tabel este cunoscut sub numele de direcția filtrului încrucișat. Există două tipuri de direcție de filtru încrucișat și acestea sunt după cum urmează:

Singur

Direcția unică a filtrului încrucișat este o opțiune de relație în care filtrele pot curge într-o singură direcție, de obicei de la Tabelul de dimensiuni la Tabelul de fapte. Se asigură că filtrarea Tabelului de dimensiuni afectează Tabelul de fapte, dar nu invers.

Bidirecțional

Filtrul încrucișat bidirecțional permite filtrelor să curgă în ambele direcții între tabelele de fapt și de dimensiuni. Poate fi util în unele scenarii, dar trebuie utilizat cu prudență, deoarece poate duce la rezultate neașteptate dacă nu este gestionat corespunzător.

#4. Schema fulgilor de nea

Credit imagine: Learn.Microsoft.Com

Schema Fulgului de zăpadă este o extensie a Schemei Stelare, în care tabelele de dimensiuni sunt normalizate în continuare în subdimensiuni. Acest lucru creează o schemă mai structurată, dar complexă. Deși poate reduce redundanța datelor, poate necesita mai mult efort pentru a naviga în Power BI.

#5. Tabele de căutare

Tabelele de căutare sunt tabele de dimensiuni care conțin informații de referință, cum ar fi detalii despre produse sau date geografice. Acestea sunt folosite pentru a îmbogăți datele în tabelele de fapte, oferind context suplimentar pentru analiză.

#6. Tabele de date

Tabelele de date sunt un termen folosit uneori interschimbabil cu Tabelele de fapte. Acestea conțin datele primare, inclusiv măsurile și cheile externe și servesc drept bază pentru construirea de rapoarte și vizualizări Power BI.

Beneficiile modelării datelor în Power BI

  • Modelarea de date Power BI vă permite să conectați mai multe tabele de date, astfel încât să puteți sursa date din aceste tabele atunci când analizați întregul set de date, creați rapoarte sau construiți tablouri de bord.
  • Modelele de date bine structurate permit vizualizări convingătoare și semnificative în Power BI.
  • Publicul general poate interacționa cu ușurință cu partea vizuală a datelor atunci când există un model de date subiacent.
  • Modelele de date Power BI optimizate vă ajută să interogați mai rapid datele dintr-o bază de date mare care conține milioane de rânduri.
  • Puteți efectua o analiză aprofundată într-un set de date mare, analizând toate tabelele acestuia atunci când există un model de date structurate în backend.
  • De asemenea, puteți conecta cu ușurință un model de date la altul sau puteți face referire la un model de date dintr-un alt raport pentru a lega seturi de date încrucișate pentru extragerea de informații la nivel înalt.
  • Puteți controla și proteja părțile sensibile ale datelor și puteți menține deschisă partea publică a datelor prin crearea modelelor de date Power BI și securizarea acestora cu acces bazat pe roluri.
  • Dacă lucrați la un set de date care continuă să crească în timp real prin colectarea datelor de la POS-uri, aplicații și piețe de vânzare cu amănuntul, trebuie să creați mai întâi un model de date înainte de a analiza întregul set de date pe măsură ce crește în fiecare zi.
  • Cum se face modelarea datelor în Power BI

    Crearea unui model de date în Power BI este foarte simplă. Iată pașii pe care trebuie să îi urmezi:

    Importați setul de date în Power BI

    Mai întâi, trebuie să importați seturile de date în Power BI. Puteți importa câte seturi de date doriți sau puteți importa un set de date care conține multe obiecte de date precum tabele, coloane, rânduri etc.

    Power BI va analiza automat setul de date sau obiectele de date importate și va crea un model de date primar bazat pe numele antetelor de coloană sau ale antetelor de tabel.

    Pentru a importa seturi de date, urmați acești pași:

    • Deschideți aplicația desktop Power BI.
    • Ar trebui să arate spațiul de lucru Power BI împreună cu un ecran de introducere.
    • Faceți clic pe Obține date.
    • În caseta de dialog Obțineți date, puteți alege ce categorie de date doriți să importați în panoul de navigare din stânga și sursele sau tipurile de date în panoul de navigare din dreapta.
    • Selecția implicită a tipului de sursă de date este Toate.
    • Deoarece setul meu de date se află într-un registru de lucru Excel, voi selecta opțiunea Registrul de lucru Excel din dreapta și voi face clic pe Conectare.

    • În caseta de dialog Deschide, navigați la fișierul Excel pe care doriți să îl importați pe computer și faceți dublu clic pe fișier pentru a-l importa în Power BI.

    • Acum, ar trebui să vă aflați în caseta de dialog Navigator.
    • Acolo, bifați obiectele de date pe care doriți să le importați în raportul Power BI.
    • Faceți clic pe Încărcare pentru a finaliza procesul de import de date în Power BI.

    Creați un model de date Power BI

    Când faceți clic pe butonul Încărcare din Navigator, Power BI începe să analizeze setul de date, să creeze modele de obiecte de date, să creeze modele de date și, în sfârșit, vă duce la fila Vizualizare raport.

    Dacă faceți clic pe meniul Vizualizare tabel din panoul din stânga, ar trebui să obțineți vizualizările tabelare ale tuturor obiectelor de date pe care tocmai le-ați importat în Power BI.

    Power BI nu vă va salva munca până acum în mod automat. Deci, trebuie să faceți clic pe Fișier din meniul panglică și apoi să faceți clic pe Salvare pe panoul din partea stângă pentru a salva fișierul într-o locație de pe computer.

    Acum, săpăm mai profund în procesul de modelare a datelor în Power BI. Urmați acești pași:

    • Faceți clic pe fila Vizualizare model din panoul din partea stângă a spațiului de lucru Power BI.
    • Ar trebui să vedeți acum modelul de date implicit creat de Power BI.
    • În exemplul curent, este o schemă stea, deoarece există un tabel de fapte în mijloc, iar tabelul de fapte este înconjurat de tabelele de dimensiuni.

    • Acum, este posibil ca Power BI să nu creeze întotdeauna cu acuratețe conexiunile modelului de date de care aveți nevoie.
    • În exemplul curent, nu a putut conecta tabelul de fapte cu dimensiunea Table24, deși există anteturi de coloană similare Geography și Geo.
    • Nu a putut face acest lucru, deoarece antetele coloanei nu se potrivesc așa cum sunt.
    • Două conectează Table24 cu datele principale ale tabelului de fapte, pur și simplu trageți obiectul Geo din Table24 pe elementul Geography al tabelului de fapte din centru.

    Asta este! Ați creat cu succes un model de date pe Power BI. Găsiți mai jos semnificația diferitelor obiecte de pe liniile de relație:

    • O stea la marginea tabelului de fapte și 1 numeric la marginea tabelului de dimensiuni reprezintă o conexiune unu-la-mai multe.
    • O săgeată pe linia de legătură dintre două tabele din Power BI indică direcția filtrului. Când muchia ascuțită a săgeții este îndreptată spre tabelul de fapte, orice filtru aplicat tabelului de dimensiuni va afecta tabelul de fapte.

    • Când există două săgeți, filtrul afectează tabelul ambelor părți, adică tabelele de fapte și dimensiuni.

    Vizualizați-vă datele

    Iată cum vă puteți vizualiza acum setul de date pentru a extrage informații utile:

    • Faceți clic pe fila Vizualizare raport.
    • Alegeți orice diagramă din secțiunea Vizualizări din dreapta.

    • Am selectat o diagramă cu coloane stivuite.
    • Extindeți seturile de date din extrema dreaptă a spațiului de lucru Power BI.

    • Trageți și plasați elemente pe câmpurile axa X și axa Y din editorul de diagrame.
    • Power BI va crea automat diagrama pentru dvs.

    Cazuri de utilizare ale modelării datelor în Power BI

    Creați rapoarte holistice

    Pentru a crea un raport sau un tablou de bord multidimensional Power BI, trebuie să utilizați funcționalitatea modelului de date Power BI. Este posibil ca datele dintr-un tabel să nu aibă suficient sens. Cu toate acestea, atunci când aduceți date din seturi de date și obiecte diferite, puteți vizualiza datele într-un sens mai bun.

    Integrarea datelor

    Să presupunem că există multe seturi de date sau tabele de date în registrul de lucru Excel sursă sau baza de date SQL. În loc să creați rapoarte Power BI diferite, le puteți conecta pe toate într-o schemă stea sau fulg de zăpadă și le puteți vizualiza ca întreg. Puteți face o poveste mai bună a datelor unificând toate obiectele de date.

    Curățarea și transformarea datelor

    Devine evident dacă trebuie să curățați și să transformați un set de date brute atunci când încercați să creați modele de date Power BI.

    De exemplu, dacă instrumentul nu poate conecta coloanele sau tabelele de date asociate în modelul de date, atunci ar putea exista o nepotrivire în anteturile coloanelor. Deci, știi ce să remediezi.

    Un alt exemplu ar putea fi mai mult de un element din tabele. Să presupunem că există doar 4 zone geografice în setul de date, și anume SUA, CA, Marea Britanie și DE. Dar modelul de date arată un plus, care este Blank. Asta pentru că unele dintre numele de geografie conțin spații inutile și, prin urmare, Power BI le clasifică într-un nou element de geografie.

    Controlați vizibilitatea datelor

    Puteți restricționa cine poate vedea ce în raportul sau tabloul de bord Power BI utilizând fila Vizualizare model. Făcând clic pe pictograma ochi de pe fiecare card de date din spațiul de lucru Power BI model de date, puteți ascunde sau ascunde tabelul.

    Dacă există mai multe coloane în cardul de date, puteți personaliza și vizibilitatea acelor coloane.

    Manipulați tabelele de date selectate

    Fiecare tabel de date din interfața modelului de date Power BI vine cu Mai multe opțiuni sau o pictogramă cu trei puncte. Acolo, puteți descoperi următoarele activități pe care le puteți efectua pe tabelul de date selectat:

    • Măsură sau coloană nouă
    • Actualizează datele
    • Gestionați relațiile
    • Reîmprospătare incrementală
    • Gestionați agregarile
    • Si multe altele

    Concluzie

    Deci, asta este totul despre crearea unui Power BI model de date pentru a vizualiza seturi de date mari și distribuite într-un singur raport logic sau tablou de bord.

    Până acum, ați aflat despre diferitele tehnici de modelare a datelor din Power BI. De asemenea, ați găsit pașii pentru a crea un model de date Power BI de la zero. Urmați pașii și creați-vă propriul model de date în cel mai scurt timp.

    În continuare, cele mai bune cursuri de analist de date pentru a-ți începe cariera de știință a datelor sau de analist de date.