I ricercatori dell’Università della California di San Diego hanno recentemente costruito un sistema di machine learning che prevede ciò che gli uccelli stanno per cantare.
Se non ci trovate grandi possibilità pratiche, inizio col dirvi che una sintesi vocale predittiva in tempo reale per le protesi vocali sarebbe già una cosa fantastica. Ma le implicazioni della comprensione del canto degli uccelli potrebbero andare molto oltre.
Canto degli uccelli, un mondo estremamente articolato
Il canto degli uccelli è una forma complessa di comunicazione che coinvolge ritmo, tono e, soprattutto, comportamenti appresi.
Secondo i ricercatori, insegnare a un’intelligenza artificiale a comprendere (e a saper costruire tanto da anticipare) il canto degli uccelli è un passo prezioso nella strada per sostituire le vocalizzazioni umane biologiche.
Le protesi motorie hanno utilizzato i primati come modello animale. Non c’è un modello simile per le protesi vocali. È per questo, forse, che queste sono più limitate in termini di tecnologia dell’interfaccia neurale, copertura del cervello e progettazione di studi comportamentali.
Non è facile “pensare” il canto degli uccelli, ma è un passo importante
Gli uccelli canterini sono un modello interessante di comportamento vocale complesso appreso. Il canto degli uccelli condivide una serie di somiglianze uniche con il linguaggio umano. Studiarlo ha già fornito ottime informazioni generali su meccanismi e circuiti alla base dell’apprendimento, dell’esecuzione e del mantenimento dell’abilità motoria vocale.
Ma tradurre le vocalizzazioni in tempo reale non è una sfida facile. Gli attuali sistemi sono ancora lenti rispetto ai nostri schemi naturali di pensiero-discorso.
Pensateci, perché è bello: i sistemi di elaborazione del linguaggio naturale all’avanguardia faticano ancora, e tanto, a tenere il passo con il pensiero umano.
Siamo ancora troppo veloci per una macchina
Quando interagiamo con il nostro Assistente Google o con Alexa, spesso c’è una pausa più lunga di quanto ci aspetteremmo parlando con una persona reale. Questo perché l’intelligenza artificiale sta elaborando il nostro discorso, determinando il significato di ogni parola in relazione alle sue capacità e quindi scoprendo a quali reazioni o programmi accedere per rispondere.
Certo, è già sorprendente che questi sistemi basati su cloud funzionino a questa velocità. Ma non sono ancora abbastanza buoni per creare un’interfaccia in tempo reale, che permetta a chi è privo di voce di parlare alla velocità del pensiero.
La ricerca sul canto degli uccelli
Anzitutto, il team ha impiantato elettrodi in una dozzina di cervelli di uccelli (fringuelli zebra) e poi ha iniziato a registrare l’attività cerebrale durante il canto degli uccelli.
Ma non è sufficiente addestrare un’intelligenza artificiale a riconoscere l’attività neurale degli uccelli durante il loro canto: anche il cervello di un uccello è troppo complesso per mappare interamente il funzionamento delle comunicazioni tra i suoi neuroni.
Per questo i ricercatori hanno addestrato un altro sistema per ridurre le canzoni in tempo reale a modelli riconoscibili con cui l’intelligenza artificiale può lavorare.
È molto interessante, perché fornisce una soluzione a un problema in sospeso.
L’elaborazione del canto degli uccelli in tempo reale è impressionante e replicare questi risultati con il linguaggio umano sarebbe una cosa storica.
Ma questo primo lavoro non è ancora pronto. E non è ancora adattabile ad altri sistemi vocali. Potrebbe non funzionare oltre il canto degli uccelli.
Ma se lo facesse, sarebbe tra i primi, giganteschi balzi tecnologici per le interfacce computer cerebrali dalla rinascita del deep learning del 2014.