Software di virtualizzazione dei dati

Il software di virtualizzazione dei dati è la programmazione di applicazioni che facilita l’interrogazione dei dati distribuiti su più sistemi di archiviazione interni e / o esterni. Le organizzazioni hanno tradizionalmente consolidato fisicamente i dati all’interno di un data warehouse prima di creare un’applicazione che lo interrogherà. Questo approccio non è molto agile, tuttavia, nell’era … Leggi tutto

Esfiltrazione dei dati (estrusione dei dati)

L’esfiltrazione di dati, chiamata anche estrusione di dati, è il trasferimento non autorizzato di dati da un computer. Tale trasferimento può essere manuale ed eseguito da qualcuno con accesso fisico a un computer oppure può essere automatizzato ed eseguito tramite programmazione dannosa su una rete. Per prevenire l’esfiltrazione di dati, gli amministratori dovrebbero creare rigorosi … Leggi tutto

Data janitor (data wrangler)

Un data janitor è un dipendente IT che ripulisce le origini di big data per prepararle per analisti e data scientist. Il lavoro è stato creato per consentire a coloro con competenze di alto livello di essere impiegati in modo più efficace piuttosto che in un lavoro che potrebbe essere svolto da altri.   Si … Leggi tutto

Metadati

I metadati sono dati che descrivono altri dati. Meta è un prefisso che, nella maggior parte degli usi della tecnologia dell’informazione, significa “una definizione o descrizione sottostante”. I metadati riepilogano le informazioni di base sui dati, che possono semplificare la ricerca e l’utilizzo di particolari istanze di dati. Ad esempio, autore, data di creazione, data … Leggi tutto

Dati transazionali

I dati transazionali, nel contesto della gestione dei dati, sono le informazioni registrate dalle transazioni.  Una transazione, in questo contesto, è una sequenza di scambio di informazioni e lavoro correlato (come l’aggiornamento del database) che viene trattata come un’unità ai fini della soddisfazione di una richiesta. I dati transazionali possono essere finanziari, logistici o relativi … Leggi tutto

Sistema di registrazione (SOR)

Un sistema di registrazione (SOR) è un ISRS (information storage and retrieval system) che è la fonte autorevole per un particolare elemento di dati in un sistema contenente più fonti dello stesso elemento. Per garantire l’integrità dei dati, deve esserci un unico sistema di registrazione per una data informazione. Quando i dati sono presenti su … Leggi tutto

Driver’s Privacy Protection Act (DPPA)

Il Driver’s Privacy Protection Act (DPPA) è una legge federale degli Stati Uniti progettata per proteggere le informazioni di identificazione personale (PII) dei conducenti con licenza da uso improprio o divulgazione. Il Congresso ha approvato il DPPA nel 1994 in risposta alle lamentele secondo cui le agenzie statali vendevano informazioni sui conducenti al marketing diretto … Leggi tutto

Parquet Apache

Apache Parquet è un formato di archiviazione orientato alle colonne per Hadoop. Hadoop è un framework di programmazione gratuito basato su Java che supporta l’elaborazione di grandi set di dati in un ambiente di elaborazione distribuito. Parquet è ottimizzato per lavorare con dati complessi in blocco e include metodi per un’efficiente compressione dei dati e … Leggi tutto

Supporta la macchina vettoriale (SVM)

Una macchina vettoriale di supporto (SVM) è un tipo di algoritmo di apprendimento profondo che esegue l’apprendimento supervisionato per la classificazione o la regressione dei gruppi di dati. Nell’intelligenza artificiale e nell’apprendimento automatico, i sistemi di apprendimento supervisionato forniscono sia i dati di input che quelli di output desiderati, che sono etichettati per la classificazione. … Leggi tutto