Blockchain, sempre più utilizzata dai Data Scientist
25.08.2020

Blockchain, sempre più utilizzata dai Data Scientist

Cos’è la Blockchain

La Blockchain è una tecnologia che permette la conservazione e l’aggiornamento di dati e informazioni in modo sicuro e trasparente. Può essere definita come un registro digitale di dati e transazioni, un database distribuito le cui voci - protette dalla crittografia - sono raggruppate in blocchi dipendenti o concatenati.

Più nello specifico, ogni blocco di informazioni non può essere modificato o cancellato, in quanto un’alterazione della catena comporta l’automatico avvio di un processo di validazione la cui durata è direttamente proporzionale alle dimensioni della catena stessa.

La Blockchain è un software che sfrutta la revisione peer-to-peer da parte dei nodi che compongono il network. La catena può essere trasformata da chiunque, ma ogni rettifica comporterà la revisione da parte dei miner, ovvero da parte di coloro che, attraverso un protocollo di validazione, consentono l’inserimento di un nuovo blocco nella catena (attività che viene definita, per l’appunto, mining). 

Esistono vari protocolli di validazione. Il primo, definito Proof of Work e creato da Satoshi Nakamoto (pseudonimo dell'inventore della criptovaluta Bitcoin, la cui identità risulta ancora sconosciuta) è tuttora il più utilizzato. Vi è poi il Proof of Stake, creato per far fronte ai problemi che il primo genera. Nel tempo, ne sono stati poi creati altri, come ad esempio il Federated Byzantine Agreement (FBA) sviluppato da Stellar Development Foundation. 

 

Data Scientist e Blockchain

La Blockchain è una tecnologia affidabile e sicura. Grazie al controllo immediato e trasparente che qualsiasi componente della catena può esercitare sulle informazioni immesse, eliminate o modificate è considerata una valida alternativa ai registri e ai database classici, gestiti in maniera centralizzata. Per questo motivo, essa è molto apprezzata e sempre più utilizzata dai Data Scientist

I Data Scientist hanno il compito di analizzare informazioni e dati provenienti da varie sorgenti con lo scopo di sostenere e migliorare il business aziendale; per fare ciò, hanno bisogno di modi sempre più efficienti per l’immagazzinamento dei dati.

La Blockchain risolve il problema della conservazione e della condivisione delle informazioni in ambito aziendale. Questa tecnologia permette a due o più persone di lavorare sui dati e di condividerli con gli altri membri dell’organizzazione in modo sicuro e veloce. 

In particolare, la Blockchain promuove la tracciabilità del dato, consente un’analisi in tempo reale delle informazioni, migliora l’integrità del dato e di conseguenza la sua qualità.

Il toolkit utilizzato da un Data Scientist per gestire una catena comprende Python, ma anche R e C++. È fondamentale la conoscenza dei vari protocolli di validazione, così come il possesso di competenze in ambito statistico e matematico.