Blockchain, sempre più utilizzata dai Data Scientist

25.08.2020
Blockchain, sempre più utilizzata dai Data Scientist

Cos’è la Blockchain

La Blockchain è una tecnologia che permette la conservazione e l’aggiornamento di dati e informazioni in modo sicuro e trasparente. Può essere definita come un registro digitale di dati e transazioni, un database distribuito le cui voci - protette dalla crittografia - sono raggruppate in blocchi dipendenti o concatenati.

Più nello specifico, ogni blocco di informazioni non può essere modificato o cancellato, in quanto un’alterazione della catena comporta l’automatico avvio di un processo di validazione la cui durata è direttamente proporzionale alle dimensioni della catena stessa.

La Blockchain è un software che sfrutta la revisione peer-to-peer da parte dei nodi che compongono il network1. La catena può essere trasformata da chiunque, ma ogni rettifica comporterà la revisione da parte dei miner, ovvero da parte di coloro che, attraverso un protocollo di validazione, consentono l’inserimento di un nuovo blocco nella catena (attività che viene definita, per l’appunto, mining). 

Esistono vari protocolli di validazione. Il primo, definito Proof of Work e creato da Satoshi Nakamoto (pseudonimo dell'inventore della criptovaluta Bitcoin, la cui identità risulta ancora sconosciuta) è tuttora il più utilizzato. Vi è poi il Proof of Stake, creato per far fronte ai problemi che il primo genera. Nel tempo, ne sono stati poi creati altri, come ad esempio il Federated Byzantine Agreement (FBA) sviluppato da Stellar Development Foundation2

 

Data Scientist e Blockchain

La Blockchain è una tecnologia affidabile e sicura. Grazie al controllo immediato e trasparente che qualsiasi componente della catena può esercitare sulle informazioni immesse, eliminate o modificate è considerata una valida alternativa ai registri e ai database classici, gestiti in maniera centralizzata. Per questo motivo, essa è molto apprezzata e sempre più utilizzata dai Data Scientist

I Data Scientist hanno il compito di analizzare informazioni e dati provenienti da varie sorgenti con lo scopo di sostenere e migliorare il business aziendale; per fare ciò, hanno bisogno di modi sempre più efficienti per l’immagazzinamento dei dati.

La Blockchain risolve il problema della conservazionee della condivisione delle informazioni in ambito aziendale. Questa tecnologia permette a due o più persone di lavorare sui dati e di condividerli con gli altri membri dell’organizzazione in modo sicuro e veloce. 

In particolare, la Blockchain promuove la tracciabilità del dato, consente un’analisi in tempo reale delle informazioni, migliora l’integrità del dato e di conseguenza la sua qualità.

Il toolkit utilizzato da un Data Scientist per gestire una catena comprende ad esempio linguaggi quali PythonR e C++. È fondamentale la conoscenza dei vari protocolli di validazione, così come il possesso di competenze in ambito statistico e matematico.

 

Fonti
1. Peer-to-Peer, bitcoinwiki.org
2. Blockchain: evoluzioni per un futuro molto prossimo, zerounoweb.it
3. How Blockchain Will Disrupt Data Science: 5 Blockchain Use Cases in Big Data, towardsdatascience.com

Benvenuto.