Differenza tra la tabella dei fatti e la tabella delle dimensioni

Autore: Laura McKinney
Data Della Creazione: 1 Aprile 2021
Data Di Aggiornamento: 5 Maggio 2024
Anonim
Difference Between Fact Table and Dimension Table - Interview questions
Video: Difference Between Fact Table and Dimension Table - Interview questions

Contenuto


La Tabella dei fatti e la Tabella delle dimensioni sono i fattori essenziali per creare un schema. Il record di una tabella dei fatti è una combinazione di attributi di diverse tabelle delle dimensioni. La tabella dei fatti aiuta l'utente ad analizzare le dimensioni dell'azienda, aiutandolo a prendere decisioni per migliorare la propria attività. D'altro canto, le tabelle delle dimensioni aiutano la tabella dei fatti a raccogliere le dimensioni lungo le quali devono essere prese le misure.

Il punto che distingue la tabella Fact e la tabella Dimension è che tabella dimensionale contiene attributi lungo i quali vengono prese le misure tabella dei fatti. Esistono altri fattori che creano differenze tra la Tabella dei fatti e la Tabella delle dimensioni per visualizzarli, diamo un'occhiata alla tabella di confronto mostrata di seguito.

  1. Tabella di comparazione
  2. Definizione
  3. figura
  4. Differenze chiave
  5. Conclusione

Tabella di comparazione

Base per il confrontoTabella dei fattiTabella dimensionale
Di baseLa tabella dei fatti contiene la misurazione lungo gli attributi di una tabella delle dimensioni. La tabella delle dimensioni contiene gli attributi lungo i quali la tabella dei fatti calcola la metrica.
Attributo e record La tabella dei fatti contiene meno attributi e più record.La tabella delle dimensioni contiene più attributi e meno record.
Dimensione del tavoloLa tabella dei fatti cresce verticalmente.La tabella dimensionale cresce in senso orizzontale.
Chiave La tabella dei fatti contiene una chiave primaria che è una concatenazione di chiavi primarie di tutta la tabella delle dimensioni. Ogni tabella dimensionale contiene la sua chiave primaria.
CreazioneLa tabella dei fatti può essere creata solo al completamento delle tabelle delle dimensioni.Le tabelle delle dimensioni devono essere create per prime.
Schema Uno schema contiene un numero inferiore di tabelle dei fatti.Uno schema contiene più numero di tabelle di dimensioni.
attributiLa tabella dei fatti può contenere dati sia in formato numerico che in quello corrente.La tabella dimensionale contiene sempre attributi nel formato attuale.


Definizione della tabella dei fatti

Una tabella dei fatti è una tabella che contiene misurazioni lungo gli attributi delle tabelle delle dimensioni. Può contenere le informazioni al livello più basso possibile. Alcune tabelle dei fatti contengono solo dati di riepilogo, chiamati come Tabella dei fatti aggregata. La tabella dei fatti contiene quasi il file data timbrata dati. Discutiamo le caratteristiche di una tabella dei fatti.

Chiave concatenata
La tabella dei fatti contiene la chiave concatenata che è la concatenazione delle chiavi primarie di tutte le tabelle delle dimensioni. La tabella concatenata della chiave fattuale deve identificare in modo univoco la riga in una tabella fattuale.

Data Grain
La granulosità dei dati mostra quanto in profondità sono state memorizzate le misurazioni nella tabella. La granulosità dei dati deve essere al livello più alto possibile.


Misure additive
Gli attributi della tabella dei fatti possono essere completamente additivo o semiadditivo. Le misure completamente additive sono quelle che possono essere facilmente riassunte per tutte le dimensioni nella tabella dei fatti. Ad esempio quantità_ordinata, è un attributo che può essere riassunto per tutte le dimensioni. Ad esempio, siamo in grado di eliminare l'ordine quantitativo totale, per un particolare cliente, regione, data, marchio, ecc. Le misure semi-additive sono quelle che possono essere sommate lungo alcune dimensioni della tabella dei fatti ma non tutte le dimensioni. Ad esempio, l'importo del saldo non può essere riassunto nella dimensione temporale in quanto cambia nel tempo.

Dati sparsi
A volte possiamo vedere la tabella dei record che ha attributi con misure nulle. Ad esempio, potrebbe non esserci alcun ordine in vacanza. Pertanto, gli attributi per questa data avranno misure nulle. Non è necessario memorizzare misure per questo tipo di record in quanto non forniscono alcuna informazione.

Dimensioni degenerate
A volte potresti imbatterti in alcune dimensioni nella tabella dei fatti, che non sono affatto additivi. Ad esempio order_number, customer_id, non è possibile aggiungere questi tipi di dimensioni. Tuttavia, nel caso, è necessario trovare l'ordine effettuato da un determinato cliente in questo mese; allora avrai bisogno del customer_id per mettere in relazione la tua ricerca. Questi tipi se vengono chiamati attributi o dimensioni della tabella dei fatti Dimensione degenerata.

Definizione della tabella dimensionale

La tabella delle dimensioni è un componente chiave per Start Schema. Una tabella delle dimensioni contiene gli attributi che rappresentano le dimensioni, lungo le quali viene presa la tabella dei fatti. Inoltre, discuteremo alcune caratteristiche di una tabella dimensionale.

Attributi e chiavi
Ogni tabella dimensionale deve avere a chiave primaria che identifica in modo univoco ogni record della tabella. Si osserva comunemente che la tabella delle dimensioni contiene molti attributi. Quindi, sembra essere largo cioè quando crei una tabella dimensionale la troverai diffusa orizzontalmente.

Valori di attributo
I valori degli attributi nella tabella delle dimensioni sono raramente numerici, il più delle volte troverai i valori negli attributi formato originale. Ad esempio nome del prodotto, marchio, categoria, sottocategoria, ecc.

Relazione tra attributi
Spesso è possibile osservare, gli attributi che si incontrano in una tabella dimensionale non sono direttamente correlati. Ad esempio, Product_brand non deve fare nulla con package_date, ma entrambi potrebbero essere gli attributi della tabella delle dimensioni del prodotto.

Normalizzazione
La tabella delle dimensioni è non dovrebbe essere normalizzato. Questo perché la normalizzazione di una tabella creerebbe molte tabelle intermedie. Quando una query prende un attributo dalla tabella delle dimensioni e recupera le misure lungo quella per la tabella dei fatti, la query deve passare attraverso quelle tabelle intermedie che diventano inefficienti. Pertanto, le tabelle delle dimensioni non sono normalizzate.

Drill down, roll up
Gli attributi della tabella delle dimensioni consentono di ottenere i dettagli passando da un livello superiore di attributi aggregati ad attributi di livello inferiore. Ad esempio, se si desidera trovare la vendita totale in una regione, è possibile eseguire il drill-down per trovare le vendite per stato, città, CAP. Puoi anche arrotolare per trovare le vendite totali prima tramite lo zip, poi per città e poi per stato.

Gerarchia multipla
Spesso la tabella delle dimensioni offre più gerarchie. Ad esempio, abbiamo una tabella delle dimensioni del prodotto per un negozio dipartimentale. Ora, abbiamo due dipartimenti marketing e contabilità.

Il reparto marketing analizzerà gli attributi della tabella delle dimensioni del prodotto in una determinata gerarchia per ottenere misurazioni per la tabella dei fatti.

D'altro canto, il reparto contabilità analizzerà gli attributi della tabella delle dimensioni del prodotto nella diversa gerarchia per ottenere misurazioni per la tabella dei fatti.

Pertanto, la tabella delle dimensioni deve avere più gerarchie o livelli di aggregazione di attributi per consentire all'utente di eseguire il drill down lungo una qualsiasi delle gerarchie multiple.

Records
Sebbene una tabella dimensionale abbia troppi attributi, ha meno record.

  1. La tabella dei fatti contiene misure lungo la dimensione / gli attributi di una tabella delle dimensioni.
  2. La tabella dei fatti contiene più record e meno attributi rispetto alla tabella delle dimensioni, mentre la tabella delle dimensioni contiene più attributi e meno record.
  3. La dimensione della tabella della tabella dei fatti cresce verticalmente, mentre la dimensione della tabella della tabella dimensionale aumenta in senso orizzontale.
  4. Ogni tabella delle dimensioni contiene una chiave primaria per identificare ogni record nella tabella, mentre la tabella dei fatti contiene una chiave concatenata che è una combinazione di tutte le chiavi primarie di tutta la tabella delle dimensioni.
  5. La tabella delle dimensioni deve essere registrata prima della creazione della tabella dei fatti.
  6. Uno schema contiene meno tabelle fattuali ma più tabelle dimensionali.
  7. La tabella degli attributi infatti è sia numerica che ual, ma gli attributi della tabella delle dimensioni hanno solo attributi ual.

Conclusione:

Entrambi sono ugualmente importanti per la creazione di uno schema, ma la tabella delle dimensioni deve essere registrata prima della tabella dei fatti. Poiché è impossibile creare una tabella dei fatti senza dimensioni.