foto Marc Wathieu via Flickr

Il dj algoritmo

Eugenio Cau
Capisce i vostri gusti, vi indica le canzoni che vi piaceranno (anche appena uscite). E’ una macchina, fa meglio del vostro miglior amico.

“La musica è una pratica occulta dell’aritmetica, nella quale l’anima non sa di calcolare” (Gottfried Wilhelm von Leibniz)


 

La più grande sfida tecnologica del nostro tempo è capire cosa piace alla gente. Tutta la costruzione commerciale di internet si basa sullo scoprire i nostri gusti, e trasformarli in denaro, sotto forma di pubblicità venduta agli inserzionisti o di prodotti. I miliardi di dollari che ogni anno entrano nelle casse di Facebook, di Google e di Amazon nascono così: migliaia e migliaia di ingegneri e informatici trascorrono giorno e notte a cercare di capire cosa piace a chi usa i rispettivi servizi. Pensate a Facebook: ha perfino un tasto apposito. Ogni volta che clicchiamo “Mi piace” sotto a un post di Facebook appare un pollice all’insù (o una faccina, da qualche tempo) e tutti possono vedere che abbiamo apprezzato le foto delle vacanze di Veronica o il link alle ricette dei brownies al caramello. Esprimiamo un giudizio di valore primordiale, simile a quello di un bambino che accetta o rifiuta la pappa, e degli algoritmi sviluppati da migliaia di ingegneri sono lì a registrare, come bravi genitori, se la pappa ci è piaciuta o meno, per poi sottoporci un’altra pietanza. Visti dal lato meramente commerciale, l’algoritmo di Google nel suo motore di ricerca e quello di Facebook nel suo social network non sono altro che questo: tentativi di far combaciare nel miglior modo possibile i gusti degli utenti con le offerte degli inserzionisti. Su internet, ogni singolo clic è un “mi piace”. Guardare un video su YouTube è un mi piace (il servizio proporrà da quel momento dei video simili), mandare una mail è un mi piace (la mail di Google graziosamente ci ricorda quali sono i contatti più frequenti), soffermarsi tre secondi su un video di Facebook è un mi piace (Facebook la conterà come una visualizzazione completa: bastano davvero tre secondi). Ogni singola canzone che ascoltiamo in streaming su internet è un mi piace.

 

Per questo, trovare una tecnologia che riesca a distillare in forma definitiva il gusto di ciascun utente, un algoritmo che sappia unire i puntini tra tutti i miliardi di “mi piace” significa trovare il sacro Graal di internet. E finora nessuno è stato capace di trovare una formula migliore di quella di Spotify, la startup svedese di musica via streaming che da diversi anni si è lanciata nella creazione della perfetta alchimia. Spotify vive di pubblicità (poco) e di abbonamenti (tanto), e ha bisogno che i suoi abbonati continuino a pagare perché sanno che lì, e non sulle decine di servizi di streaming concorrenti e magari più blasonati, si trova la musica migliore del mondo. Qui sorge il primo problema: come trovarla?

 

Viviamo nell’età dell’abbondanza. Forse non dell’abbondanza economica, intaccata dalla crisi, ma certamente in quella della cultura. Ogni anno sono stampati più libri, filmati più lungometraggi, registrate più canzoni, inaugurati più show televisivi dell’anno precedente, e ogni volta un nuovo record è infranto. L’èra di internet ha contribuito a democratizzare la creazione, la distribuzione e la fruizione dei prodotti culturali, e oggi siamo afflitti dal “paradosso della scelta”, come lo ha definito lo psicologo Barry Schwartz. Possiamo leggere così tanti libri, vedere così tanti film e ascoltare così tante canzoni che non sappiamo più quali scegliere, o scegliamo con la paura di esserci persi qualcosa di bello e importante, e finiamo per non essere mai soddisfatti delle decisioni prese. Poter scegliere tra infinite possibilità non ci rende davvero liberi, al contrario ci paralizza. Per essere liberi, o quanto meno per sentirci tali, dobbiamo restringere il range delle nostre scelte. Un tempo, a farlo, era un altro essere umano. Il proprietario del negozio di dischi, un amico che ci consigliava un libro o che registrava un’audiocassetta dalla radio. Per consumare cultura, abbiamo bisogno di raccomandazioni, consigli, proposte. I grandi distributori di cultura digitale – teniamoci in questo caso sulla musica – si sono trovati davanti a una scelta esiziale quando i loro utenti hanno chiesto loro una soluzione al paradosso della scelta perché non sapevano su quale canzone apporre i loro mi piace. Pandora, un servizio di radio via streaming oggi sul viale del tramonto, assoldò circa dieci anni fa un esercito di musicologi professionisti (il requisito era che ciascuno avesse studiato composizione e storia della musica per almeno cinque anni e avesse ottenuto un diploma nel campo) per ascoltare la musica e consigliarla agli utenti. L’anno scorso, presentando Apple Music, il produttore leggendario Jimmy Iovine fece una difesa spassionata della sensibilità umana, e dentro al servizio di streaming di Apple un gruppo relativamente ristretto di persone sforna decine di playlist selezionate a mano per venire incontro al favore degli utenti. Spotify ha deciso di far fare tutto questo lavoro alle macchine.

 

Lo scorso fine settimana, Spotify ha annunciato il lancio della sua seconda playlist algoritmica, Release Radar (da ora RR), dopo il lancio un anno fa di Discover Weekly (da ora DW). Entrambe funzionano così: una volta alla settimana, in due giorni diversi (il venerdì per RR, il lunedì per DW), Spotify propone a ciascun utente una playlist personalizzata di 20-30 nuove canzoni che a giudizio dell’algoritmo potrebbero piacergli. Nel caso di DW l’algoritmo sceglie tra tutte le canzoni disponibili, mentre RR pesca soltanto dalle ultimissime uscite. In tutti e due i casi, il risultato è stupefacente. Ogni lunedì, come ha scritto Victor Luckerson in un bel post su Medium, i social network si riempiono di ascoltatori esterrefatti perché Spotify sembra conoscere i loro gusti musicali meglio del fidanzato o del migliore amico. Il funzionamento di DW è già stato raccontato. Spotify costruisce un profilo del gusto di ciascun utente attraverso le canzoni ascoltate in precedenza, e miscelando adeguatamente i dati di ascolto con un algoritmo. Poi confronta il profilo utente con quelli di altri utenti simili e con le playlist che questi hanno compilato manualmente. In pratica, sceglie per noi canzoni che persone simili a noi hanno già scelto per se stesse. Questo processo si chiama “filtraggio collaborativo” ed è usato da molte compagnie digitali per aiutare gli utenti a risolvere il paradosso della scelta: ti aiutiamo a decidere mostrandoti le decisioni di altre persone simili a te. Spotify è inoltre in grado di comprendere entro certi limiti il linguaggio naturale (quello parlato dagli umani; non è per niente scontato che una macchina lo sappia fare, anzi: è una delle sfide maggiori della ricerca odierna) per interpretare i titoli delle canzoni e delle playlist. Infine, usa tecnologie di deep learning, vale a dire macchine addestrate dall’uomo a riconoscere pattern simili nell’enorme mare dei big data. Il risultato (l’ha mostrato Quartz in un articolo recente) è che dal profilo di ogni utente è prodotta una specie di blob colorato con chiazze di diversa intensità, come una cartina geografica altimetrica, che rappresenta l’insieme dei gusti di ciascuno: il sacro Graal del commercio via internet.

 

Release Radar aggiunge un livello di difficoltà all’azione dell’algoritmo, perché deve comporre una playlist partendo da canzoni nuove, che quasi nessuno ha mai ascoltato e giudicato. Il problema è notevole: puoi conoscere perfettamente i gusti di una persona, ma come abbinarli a qualcosa che non hai mai sentito? Le canzoni nuove non sono ancora in nessuna playlist, il filtraggio collaborativo non può funzionare, c’è bisogno di qualcuno che ascolti la nuova musica e decida se è adatta o meno all’utente. A suo tempo, Pandora usava un esercito di esperti umani. Spotify fa ascoltare le canzoni agli algoritmi. Le capacità delle tecnologie di deep learning di Spotify sono così avanzate che le macchine riescono ad analizzare una canzone, capire di che genere è e se corrisponde o meno ai gusti di un certo utente. Si può dire che le macchine hanno le orecchie, e capiscono la musica che sentono.

 

L’altro elemento esaltante delle playlist algoritmiche di Spotify è che sono a loro modo creative. Sarebbe relativamente facile, una volta compresi i gusti di un utente, proporgli canzoni appiattite sul suo profilo, ma gli algoritmi di Spotify sono stati dotati di una piccola dose di imprevedibilità che spesso sorprende anche il melomane e solletica la voglia di ascoltare di più. Questo senso della scoperta, e la ricorrenza continua e settimanale di playlist sempre nuove, sono i due meccanismi di psicologia comportamentale che rendono le playlist di Spotify tanto accattivanti. RR è uscita solo da una settimana (venerdì è uscita la seconda playlist personalizzata), ma DW ha circa 40 milioni di iscritti (gli utenti complessivi di Spotify hanno da poco superato i 100 milioni), e da sola ha più ascoltatori di buona parte dei servizi di streaming concorrenti. Il fatto, come ha spiegato Bas Grasmayer su Medium, è che avere una playlist personalizzata ogni lunedì (e adesso un’altra ogni venerdì: la scelta dei giorni non è per niente casuale) è un’interazione, è come avere un amico che ti registra una musicassetta nuova ogni settimana, e poco importa se l’amico è una macchina: tutte le settimane Spotify regala qualcosa di nuovo ai suoi utenti, stabilendo un meccanismo di attesa e ricompensa che alla lunga crea dipendenza.

 

Sembra un piano perfetto, che finora sta sgominando i tentativi “umani” di tutti gli altri concorrenti e che nella guerra tra il musicologo e l’algoritmo vede in netto vantaggio quest’ultimo: tecnologia all’avanguardia applicata a una comprensione raffinata del sistema dei bisogni umani applicati alla musica. Ma quasi niente di tutto questo è farina del sacco di Spotify. Le tecnologie innovative e le loro applicazioni rivoluzionarie sono il frutto del lavoro di Echo Nest, una startup che Spotify ha comprato nel marzo del 2014 e che costituisce un team indipendente all’interno della società.

 

Echo Nest è stata fondata da due ingegneri del Mit di Boston pazzi per la musica. Uno, Brian Whitman, negli anni Novanta e con il nome di Blitter suonava “intelligent dance music”, usando i computer per gli arrangiamenti. L’altro, Tristan Jehan, aveva inventato la James Brown Machine, un programma che analizzando le canzoni di James Brown ricreava perfette riproduzioni dei brani del grande soulman. I due fondarono Echo Nest nel 2005, in un periodo in cui il paradosso della scelta musicale era già acuto: i servizi di download pirata avevano riempito i computer degli utenti di un’enormità di musica che nessuno ascoltava. Nel 2014 Spotify mise le mani su Echo Nest per creare, a detta del ceo Daniel Ek, la migliore piattaforma di intelligenza musicale sul pianeta. Per Whitman, Jehan e i loro 70 dipendenti pagò appena 100 milioni di dollari, un affare eccezionale visti gli ottimi ritorni. I vecchi uffici nei sobborghi di Boston dove Echo Nest è nata sono stati ribattezzati Spotify Boston, e il vecchio team lavora ancora lì, nelle stesse stanze, indipendente. Tutte le grandi novità lanciate da Spotify negli ultimi due anni dipendono in qualche modo da Echo Nest, non solo le playlist algoritmiche, ma anche gli strumenti per ascoltare musica mentre si corre, o la playlist Fresh Finds, che agli algoritmi aggiunge il contributo umano scandagliando i blog e le recensioni musicali per proporre le migliori nuove uscite divise per genere.

 

Per millenni, a partire dai pitagorici, la filosofia si è chiesta cosa sia il bello musicale, e se esista una regola universale che definisce ciò che è armonioso alle nostre orecchie. E’ possibile trovare un canone dell’estetica musicale, o una formula matematica che decida una volta per tutte perché certa musica è bella e altra no? La filosofia, e dopo di lei le neuroscienze, sono state costrette a usare un metodo ermetico nella ricerca della bellezza musicale: un’unica soluzione, un’unica formula, o un unico insieme di soluzioni. Gli ingegneri di Echo Nest hanno potuto permettersi di usare un metodo quantitativo: grazie alle loro tecnologie, possono creare una mappa dei gusti di decine di milioni di persone. E’ un business miliardario, perseguito da tutte le grandi compagnie tecnologiche, ciascuna nel suo campo e con risultati spesso raffinatissimi. Ma è anche un’impresa meravigliosa. Un giorno, forse, qualcuno avrà il tempo e la capacità computazionale di mettere insieme le mappe del gusto musicale di decine di milioni di persone, che nel frattempo magari saranno diventate centinaia di milioni, tutte accolte dal grande orecchio algoritmico, e creare per davvero una enciclopedia completa del gusto musicale del genere umano in forma matematica. I pitagorici apprezzerebbero.

Di più su questi argomenti:
  • Eugenio Cau
  • E’ nato a Bologna, si è laureato in Storia, fa parte della redazione del Foglio a Milano. Ha vissuto un periodo in Messico, dove ha deciso di fare il giornalista. E’ un ottimista tecnologico. Per il Foglio cura Silicio, una newsletter settimanale a tema tech, e il Foglio Innovazione, un inserto mensile in cui si parla di tecnologia e progresso. Ha una passione per la Cina e vorrebbe imparare il mandarino.