Studio longitudinale

Uno studio longitudinale è un metodo di ricerca osservazionale in cui i dati vengono raccolti ripetutamente per gli stessi soggetti per un periodo di tempo. I progetti di ricerca longitudinale possono estendersi per anni o addirittura decenni. In uno studio di coorte longitudinale, gli stessi individui vengono osservati durante il periodo di studio. Gli studi … Leggi tutto

Matrice di confusione

Una matrice di confusione è una tabella che delinea diverse previsioni e risultati dei test e li mette in contrasto con i valori del mondo reale. Le matrici di confusione vengono utilizzate nelle statistiche, nel data mining, nei modelli di machine learning e in altre applicazioni di intelligenza artificiale (AI). Una matrice di confusione può … Leggi tutto

Confabulazione dei dati

La confabulazione dei dati è un termine di business intelligence per l’uso selettivo e possibilmente fuorviante dei dati a supporto di una decisione che è già stata presa. All’interno dei volumi di big data ci sono spesso molte piccole prove che sono contraddittorie anche a fatti chiaramente supportati dai dati. In generale, questo rumore di … Leggi tutto

Sovracampionamento e sottocampionamento

Il sovracampionamento e il sottocampionamento sono tecniche utilizzate nel data mining e nell’analisi dei dati per modificare classi di dati disuguali per creare set di dati bilanciati. Il sovracampionamento e il sottocampionamento sono noti anche come ricampionamento. Queste tecniche di analisi dei dati vengono spesso utilizzate per essere più rappresentative dei dati del mondo reale. … Leggi tutto

Ipotesi del cammino casuale

L’ipotesi del cammino casuale è una teoria matematica in cui una variabile non segue una tendenza apparente e si muove in modo apparentemente casuale. Il concetto è nato come un’ipotesi che teorizza che i movimenti dei prezzi delle azioni sono in gran parte casuali e non possono essere basati su movimenti o tendenze passati, e … Leggi tutto

Database in memoria

Un database in memoria (IMDB, noto anche come database della memoria principale o MMDB) è un database i cui dati sono archiviati nella memoria principale per facilitare tempi di risposta più rapidi. I dati di origine vengono caricati nella memoria di sistema in un formato compresso e non relazionale. I database in memoria semplificano il … Leggi tutto

Box plot

Un box plot è una rappresentazione grafica di dati statistici basati sul minimo, primo quartile, mediana, terzo quartile e massimo. Il termine “box plot” deriva dal fatto che il grafico appare come un rettangolo con linee che si estendono dall’alto e dal basso. A causa delle linee che si estendono, questo tipo di grafico è … Leggi tutto

Quadro

Tableau è una società di software che offre software di visualizzazione dei dati collaborativi per le organizzazioni che lavorano con l’analisi delle informazioni aziendali. Le organizzazioni utilizzano Tableau per visualizzare i dati e rivelare modelli per l’analisi nella business intelligence, rendendo i dati più comprensibili. Tableau è stato creato come un modo per commercializzare la … Leggi tutto

Dati alternativi

I dati alternativi sono informazioni raccolte da fonti di informazione non tradizionali. L’analisi di dati alternativi può fornire approfondimenti oltre a quelli che le normali fonti di dati di un settore sono in grado di fornire. La questione di cosa costituiscano dati alternativi varia da settore a settore. Nel settore bancario, ad esempio, un prestatore … Leggi tutto

Dati strutturati

I dati strutturati sono dati che sono stati organizzati in un repository formattato, tipicamente un database, in modo che i suoi elementi possano essere resi indirizzabili per un’elaborazione e un’analisi più efficaci.  Una struttura dati è una sorta di archivio che organizza le informazioni a tale scopo. In un database, ad esempio, ogni campo è … Leggi tutto