#5 Spaghetti Data - trentenni che non fanno sesso, Achille Lauro, modelli nel cestino e molto altro
Jeff Bezos, una crescita del 2300% e le opportunità di oggi
Nel 1994 Jeff Bezos venne a conoscenza di una statistica che gli fece decidere di lasciare il suo (ben pagato) lavoro in un hedge fund per andare a fondare Amazon:
Internet stava crescendo del 2300% all’anno
Ora nel 2022, quali sono le statistiche che tra 20 anni creeranno il nuovo Jeff Bezos e la nuova Amazon?
Ecco alcune statistiche interessanti da questo thread su Twitter:
Il costo di mappare un genoma è diminuito del ~100000% negli ultimi 15 anni
La percentuale di ragazzi con meno di 30 anni che non hanno mai fatto sesso è triplicata negli ultimi 10 anni
Il problema della sicurezza informatica sta crescendo in maniera esponenziale (e lo stiamo vedendo in diretta questi giorni attraverso il conflitto in Ucraina)
Entro il 2025 mancheranno 300 mila lavoratori nell’industria dei semiconduttori (stima del NY Times)
La maggior parte dei modelli di ML finiscono nella spazzatura
Nella scorsa edizione di Spaghetti Data parlavo del fatto che la vita di un data scientist è parecchio più complicata di quello che ci si immagina partecipando alle competizioni di machine learning su Kaggle.
Da questo sondaggio su 114 esperti del settore risulta che una grossa maggioranza di modelli di ML non vengono mai messi in produzione. Quanti di preciso? Il ~60% degli intervistati ha risposto che meno del 20% dei modelli viene effettivamente usato! Il rimanente finisce nel cestino, insieme al tempo e ai soldi spesi per costruirli.
Le motivazioni sono varie e il fatto che MLOps (cioè tutto quello che bisogna fare per mettere il modello in produzione - infrastruttura, monitoraggio, etc.) sia difficile non è probabilmente la principale.
François Chollet (creatore di Keras e uno dei maggiori contributor di Tensor Flow) lo riassume in maniera perfetta in un tweet:
Bias della settimana
Una nuova rubrica
Questa settimana provo ad introdurre una mini rubrica su bias e mental model.
Ogni giorno dobbiamo prendere decine di decisioni, da come vestirci a cosa mangiare a quale grafico mettere in una presentazione. Nonostante ci riteniamo esseri razionali, queste decisioni vengono spesso influenzate da meccanismi mentali che il nostro cervello ha costruito in centinaia di migliaia di anni di evoluzione. Molto spesso questi meccanismi funzionano e ci hanno permesso di sopravvivere in ambienti estremamente ostili. In altri casi decisamente no e sono la causa di molte decisioni stupide. Essere consci di questi meccanismi è il primo passo per migliorare il modo in cui ragioniamo e prendiamo le nostre scelte. Se ti interessa l’argomento ti consiglio il libro Pensieri lenti e veloci.
Il bias della settimana: confirmation bias
Il confirmation bias è la tendenza a ignorare le informazioni che vanno contro i nostri pregiudizi e a focalizzarci, invece, solo sue quelle che li confermano.
Pensi che tutti gli immigrati siano criminali? Ti focalizzerai solo sulle informazioni che parlano di crimini commessi dagli immigrati, ignorando altre informazioni o statistiche che possano contraddire la tua idea.
Pensi che Sanremo sia una trashata pop? Ti focalizzerai solo sulla pochezza di Amadeus e deciderai di ignorare Achille Lauro e Morgan che cantano Rolls Royce in uno dei momenti più rock della televisione italiana (ok, con questa qualcuno si potrebbe anche incazzare).
Il confirmation bias però è molto più infame e subdolo di così. Stai per andare ad un colloquio di lavoro? Probabilmente chi ti sta intervistando, dopo aver visto il tuo curriculum per due minuti e senza averti neanche mai parlato, sa già se passerai o meno il colloquio. Le domande che ti farà saranno solo per confermare il (pre)giudizio che si è costruito nella sua mente. Tutto questo avviene in maniera inconscia, senza averlo deciso razionalmente.
Magari qualcuno di voi sta pensando agli antivax…
Come fare a contrastare questo bias? Prova a “metterti il cappello dello scienziato”: quella che ritieni vera è solo una delle tante ipotesi possibili. E’ veramente la più probabile? Quali sono gli elementi contraddittori? Sei sicuro in quello che credi al 100% o magari solo all’80% o forse al 50%? Quali dati stai ignorando? Stai veramente ascoltando chi ha idee diverse dalle tue?
Quante testate nucleari possiedono i vari paesi?
(Clicca sull’immagine o QUI per vedere il video con l’animazione dal 1945 ad oggi )
(fonte)
Aggiungi colori ad un Pandas dataframe (Python)
(fonte)
Elezioni in Nord Corea: la mappa dei risultati
Un’importante mappa per capire meglio come sono andate le elezioni del 2019 in Nord Corea!
Si ok, vi sto perculando! 😆
(fonte)
Deep Learning Interviews - un libro gratis in PDF
Qui il repo su GitHub e qui il link diretto al PDF.
Da un post del buon Francesco Pochetti (che posta spesso cose interessanti su Linkedin).