Il “Miracolo” dell’Intelligenza Artificiale – Parte Seconda: come funziona l’Intelligenza Artificiale

Il “Miracolo” dell’Intelligenza Artificiale – Parte Seconda: come funziona l’Intelligenza Artificiale

Di Sergio Ragaini

Dopo avere, nella prima parte, descritto i “Componenti” dell’Intelligenza Artificiale, quelli che ne permettono il “miracolo”, e, per quanto riguarda le Reti Neurali, avere iniziato ad “addentrarsi” nel loro funzionamento, in questa seconda parte ci occuperemo di vedere come l’Intelligenza Artificiale funziona.

Scopriremo che la sua particolarità, come già accennato nella parte precedente,  è quella di “pensare in numeri”, e trasformare i pensieri e le parole in sequenze numeriche (più precisamente in stringhe e in matrici di numeri), per poi ritrasformare il tutto in pensieri e parole, che generano risposte, e non solo.

Tutto questi ci permetterà di comprendere meglio questo strumento, almeno intuendone la bellezza, e le sue potenzialità. Che, in massima parte, come già evidenziato nella prima parte, sono ancora all’inizio. 

Nota:

In questa Seconda Parte, si farà riferimento a elementi contenuti nella Prima Parte.

Di conseguenza, la lettura della Prima Parte di questo lavoro sull’Intelligenza Artificiale è data per scontata.

Se ancora non l’avete letta, quindi, vi suggerisco di leggerla prima di prosegire con questa parte.

Una vera “rivoluzione” in ambito Tecnologico

Come abbiamo detto, l’Intelligenza Artificiale fa molte cose. Davvero tante. E  tutte con un solo prodotto.

Questo permette di dire che si è realizzata una vera e propria “rivoluzione” nella concezione della Tecnologia. Fino a raggiungere livelli davvero impensabili.

Se consideriamo che questo è solo l’inizio, ci attende un futuro davvero “mirabolante”. Anche se è il caso, forse, di dire che, può che noi, attenderà in gran parte le nuove generazioni.

Personalmente, ci penso spesso: in fondo, la mia generazione è giunta all’Intelligenza Artificiale già in “età decisamente adulta”. Penso spesso, in tal senso, a coloro i quali l’hanno “trovata sul loro cammino” ancora giovanissimi. Il mio pensiero va, in particolare,  a coloro i quali sono nati negli anni 20 di questo secolo, e che quindi hanno aperto davvero da poco gli occhi su questo Mondo: loro hanno “incontrato” l’Intelligenza Artificiale praticamente “nella culla”. Immaginiamo cosa potrebbero trovare sul loro cammino man mano che gli anni trascorreranno. Troveranno davvero l’incredibile.

Anche di questo, però, parleremo più avanti, nel proseguo di questo discorso. Che, sicuramente, si farà sempre più interessante man mano che conosceremo sempre più “da vicino” l’Intelligenza Artificiale.

Anticipo, ovviamente, che questi prodotti si devono  “provare”, per poterli conoscere. Quindi, sarete poi invitati, anche attraverso un elenco dei principali prodotti in tal senso, a sperimentare di persona cosa l’Intelligenza Artificiale può dare alle vostre vite. Scoprirete, sicuramente, un Mondo che, fino ad oggi, non sapevate nemmeno esistesse.

Anche con i limiti che l’Intelligenza Artificiale può avere (vedremo che ci sono) ne avrete dei benefici e dei vantaggi che vi permetteranno davvero di “compiere un volo” sopra le cose, rendendo semplici cose che, senza questo strumento, sarebbero forse insormontabili.

Comunque, di tutto questo parleremo anche più avanti, nella prossima parte, quando tratteremo degli usi di questo prodotto del divenire, che è già ampiamente presente.

Intanto prepariamoci ad “andare oltre”. E qualcuno non può nemmeno immaginare quanto “oltre” potremo andare. Prepariamoci a scoprirlo!

Intelligenza Artificiale “Generativa” (GenAI): generare Realtà che non esisteva(no) prima

Già, auspico, avrete almeno intuito gli usi davvero notevoli dell’Intelligenza Artificiale. Con la “Visione Artificiale” di cui parlavamo, l’Intelligenza Artificiale “interagisce” con il Mondo attorno a noi, comprendendo quello che ha vicino. E permettendo di ricevere risposte, ad esempio per riconoscere un luogo, un monumento e altro ancora.

Oggi l’Intelligenza Artificiale fa però di più, “esplorando”quello che non c’era. E, in alcuni casi, “creandolo”.

Tutto questo ha un nome: Intelligenza Artificiale Generativa. E una sigla: GenAI.

Cosa vuol dire questa parola? Semplice! Vuol dure che l’Intelligenza Artificiale Generativa è in grado non solo di fornire informazioni, generare risposte su questioni note e così via, cosa che è già straordinari: è in grado di generare qualcosa che prima non c’era.

Questo vuol dire che non è solo in grado di rispondere alla domanda: “Puoi darmi un prospetto delle principali tappe di sviluppo dell’Intelligenza Artificiale?”, ma può rispondere a domande del tipo: “Genera un’immagine con un tramonto montano e una baita sullo sfondo”. Oppure” Scrivi una Poesia sull’alba sopra il Mare”, oppure “Dammi qualche idea per un determinato racconto o articolo”, o tanto altro ancora.

Insomma: non è solo, come l’aveva definita un amico, “Un super Motore di ricerca” (che comunque genera risposte, e non fornisce solo link, com visto poco fa, e risposte fortemente “dinamiche”, con le quali si può interagire), ma è qualcosa che è in grado di produrre cose nuove, che prima non c’erano. 

Tra queste, anche cose di un certo rilievo: ad esempio, può generare programmi informatici, può risolvere problemi e altro ancora.

Il “Miracolo”, quindi, va ancora oltre. E permette di avere, in tempo reale, elementi nuovi, qualcosa che prima non c’era. E che ora c’è.

Questo è il massimo sviluppo e livello di avanzamento dell’Intelligenza Artificiale.

Pensate a quale “espansione” di idee tutto questo può offrire.

Qui, i detrattori (che, come dicevo, non hanno alcuna idea di come questo strumento funzioni) “partono” subito, affermando che questo strumento “smorza” la creatività delle persone.

Piuttosto, è il contrario: questo strumento fornisce idee, permette di avere spunti di lavoro.

Permette, ad esempio, di avere “tracce” su cui lavorare, per poi “espanderle” e farla diventare, magari, capolavori.

Non a caso, Gemini, uno dei principali prodotti di Intelligenza Artificiale (ne parleremmo  nella prossima parte di questo lavoro), si “presenta” con “Chatta per espandere le tue idee”.

Contrariamente a quello che i detrattori o i “dubbiosi” pensano (i secondi, secondo me, sono accettabili, mentre i primi no, e lo vedremo molto bene), questi strumenti permettono “espansione” di pensieri, non di certo “contrazione” o “compressione”. Permettono davvero di “volare”, e raggiungere livelli notevoli. Posso dirlo perché ho sperimentato dal vivo tutto questo. E, quindi, ne sono un “esempio vivente”. E non ne parlo, come invece fanno i detrattori, per “sentito dire”.

Comunque, di questo, come dicevo, parleremo più avanti, dove racconterò anch’io la mia esperienza nell’utilizzo dell’Intelligenza Artificiale”.

Ora, prima di passare a come “davvero” l’Intelligenza Artificiale funziona, possiamo chiederci quando è arrivata tra noi la GenAI.

È arrivata da davvero poco. Il primo prodotto in Intelligenza Artificiale Generativa è stato “Chat GPT-1”, lanciato dalla Statunitense Open AI nel giugno 2018. Quindi, l’Intelligenza Artificiale Generativa ha poco più di sei anni: davvero un soffio di tempo.

Dal primo modello di Rete Neurale, elaborato, come visto nella prima parte, nel dicembre 1943, all’Intelligenza Artificiale Generativa, sono passati quasi 75 anni. Questo è il tempo che è stato necessario perché quello che prima era un sogno, un’idea, diventasse realtà tangibile.

Era già tutto lì, tutto pronto. Un bell’esempio che aveva fatto il prodotto di Intelligenza Artificiale “Copilot” era che c’erano i piano di costruzione, i progetti.,.. ma non i materiali.

Già alla fine degli anni 80 sentivo parlare di “Intelligenza Artificiale”, e avevo conosciuto, durante un colloquio di lavoro, una ragazza, brillantemente laureata in Matematica con il massimo dei voti e la lode, che avrebbe voluto lavorare in quel settore.

A quel tempo, però, queste cose erano, in buona parte, solo parole, nomi, speranze, sogni: la potenza di calcolo non avrebbe permesso minimamente di realizzare tutto questo, almeno in forma compiuta (i primi prototipi già esistevano, comunque, da alcuni anni).

Poi, questa potenza è aumentata: e, di conseguenza, questi sogni hanno preso forma.

Quindi, dai corsi di “teoria dell’Elaborazione e della Trasmissione” (denominati con l’acronimo TIT, in alcune Facoltà Universitarie, quali quella di Pavia, dove mi sono laureato in Matematica), che continuano ad esserci, si è passati alla messa in pratica di tutto questo.

Ed oggi tutto questo è sbocciato: un fiore che doveva rimanere quasi “latente” per molti anni, prima di mostrarsi nella sua profonda bellezza.

Una “bellezza” che è ancora più recente: infatti, se è vero che Chat GPT-1 è stata lanciata nel giugno 2018, è vero che il vero “boom” è avvenuto con Chat GPT 3.5, che è stata ufficialmente lanciata, dalla stessa citata Open AI, il 30 novembre 2022. Questa data segna la vera “svolta”: a quel punto, c’era un prodotto in grado di fare molte cose, in grado di essere “davvero” intelligente (possiamo usare, con le dovute cautele, questa parola per definirlo) come ce lo su poteva aspettare. Un prodotto che poteva “realmente” rivoluzionare le vite delle persone.

Due mesi dopo, agli inizi del 2023, un’altra grande rivoluzione: Chat GPT 3.5 era diventata disponibile per Smartphone. In questo modo, l’Intelligenza Artificiale era “mobile”. Questo significa che, in ogni istante, una persona poteva chiedere informazioni su qualsiasi cosa, chiedere prospetti, analisi, pianificazioni. Nessuna ricerca per “parole chiave”, ma domande dirette, e risposte dirette.

Un prodotto non solo in grado di cercare ed elaborare… ma anche di generare. In quel momento, non immagini, ma comunque testi. E tutto questo nel palmo di una mano, nella tasca dei pantaloni: sempre con sé.

Un qualcosa che, in qualche modo, ha segnato il tempo.

Da quel momento, in questi due anni, altri prodotti sono nati, sempre migliori. Che oggi possono generare immagini, suoni e addirittura video. Anche questi li vedremo più avanti, nella prossima parte del lavoro sull’Intelligenza Artificiale.

Tuttavia, quel momento ha segnato una vera “rivoluzione”. Una rivoluzione paragonabile, secondo me, a quella di Internet, a cavallo tra questo secolo e il precedente. Questa rivoluzione non è da meno: anzi, forse (possiamo, credo, togliere il “forse”) è ancora superiore, e avrà sicuramente un impatto sempre più “dirompente” sulle nostre vite. Con tutti i limiti che può avere, può rivoluzionare le modalità di approccio ad ogni cosa, e alla creazione di elementi di ogni tipo.

Necessariamente, tutto questo sarà destinato ad entrare nelle nostre vite. Anche di quelle di coloro i quali oggi ne sono “detrattori”. È inevitabile, parafrasando quanto appariva nel film “Interstate 60”.

Parleremo anche di questi “detrattori”, in seguito: mostrando comunque la potenziale pericolosità di una “denigrazione” organizzata, che invita al “rifiuto a priori” di questi mezzi tecnologici. E, come già accennavo, senza nemmeno spiegare come questi funzionano, e nemmeno cosa sono. E questo, vedremo, è estremamente grave che accada, e accade solo per scopi di potere e controllo sulle persone, come verrà mostrato.

Per concludere questo discorso sull’Intelligenza Artifici\le Generativa, segnalo, per chi vuole approfondire l’argomento, un interessante lavoro sul sito di “Amazon Web Services”. Lo potete trovare a questo indirizzo.

Ora preoccupiamoci di proseguire, per comprendere come davvero questi strumenti funzionano, e cosa fanno davvero.

Vedremo che il miracolo del loro funzionamento è, in realtà, qualcosa che ha a che fare con strutture e modelli matematici. Già lo accennavo nella prima parte.

Anzi: possiamo addirittura dire che l’Intelligenza Artificiale “è” un Modello matematico.

Ma come funziona? Vediamolo subito!

Come pensa l’Intelligenza Artificiale? Ma in numeri, naturalmente!

Ci si chiede come l’Intelligenza Artificiale faccia a pensare, a ricavare informazioni… e addirittura a generare elementi nuovi, in qualche modo “creandoli”.

Proviamo, quindi, a comprenderlo, guardando più da vicino i processi elaborativi e creativi dell’Intelligenza Artificiale.

Di fatto, l’Intelligenza Artificiale “da i numeri”. Lo fa, però, in maniera sicuramente positiva! E davvero molto positiva!

L’abbiamo già visto con le Reti Neurali, nella prima parte di questo lavoro, quando l’informazione veniva codificata in valori numerici, che venivano moltiplicati per dei pesi, per poi aggiungere dei numeri detti “bias”.

Questa tecnica del convertire il linguaggio in numeri, per poi riconvertirlo in linguaggio, è la base dell’Intelligenza Artificiale. Lo vedremo subito.

Da pensieri a sequenze numeriche… e poi ancora in pensieri

L’Intelligenza Artificiale funziona proprio così: con quello che si chiama, e che abbiamo già visto nella prima parte,  “Natural Language Processing”, vale a dire l’elaborazione del linguaggio naturale.

Quello che però viene elaborato non è il linguaggio, ma… sequenze numeriche. In termini tecnici, “vettori” numerici.

Questi, per dirla tecnicamente, sono fatti di elementi che “catturano” il senso dei pensieri e delle parole che vengono espressi.

Questo è il Natural Language Processing: ricevere parole e pensieri, trasformarli in numeri e poi passarli al Modello Linguistico perché vengano elaborati.

Il Modello Linguistico “elabora” queste sequenze numeriche, e le trasforma in una risposta.

Come vedremo, la risposta si definisce spesso una “predizione”, proprio per le sue caratteristiche, come già accennavo nella prima parte, di essere qualcosa di “probabilistico”.

La risposta, ovviamente, è anche quella in sequenze numeriche.

Questa risposta viene nuovamente “inviata”, per così dire,  al Natural Language Processing, che la “decodifica”, mendiate appositi algoritmi, per poi “tornare” una risposta in pensieri e parole, che è il nostro linguaggio.

Cerchiamo, quindi, di capire in dettaglio cosa accade con queste strutture, riassumendo per punti cosa avviene:

  • Acquisizione e trasformazione del testo: Il testo viene acquisito e trasformato in vettori numerici, con tecniche come l’Embedding. Queste rappresentazioni numeriche, per così dire, “catturano” il significato del testo.

  • Elaborazione: I Vettori Numerici vengono elaborati dal Modello Lingustico (LLM), attraverso i suoi parametri. In questo modo, si identificano le relazioni tra parole e frasi.

  • Generazione di risposte: Il Modello Linguistico genera una risposta, in base ai dati in esso presenti, e a quelli che può ricercare. La risposta è anch’essa in forma numerica.

  • Decodifica e Output testuale: La risposta numerica, attraverso algoritmi di decodifica, viene convertita nuovamente in testo, in modo da essere fruibile per l’utente.

Quindi, il “miracolo” dell’Intelligenza Artificiale è reso possibile… dalla Matematica. In fondo, tutto quello che avviene nell’Intelligenza Artificiale sono calcoli, comparazioni ed elaborazioni di tipo statistico.

Tutto questo rende possibile quelle incredibili elaborazioni che fanno sì che possiamo dialogare con l’Intelligenza Artificiale come se dialogassimo con una persona.

Vedremo ora un esempio di decodifica. Chi fosse interessato ad approfondire l’argomento del natural Language Processing, può andare a questo indirizzo.

Un esempio di decodifica

Credo possa essere interessante fare un esempio di come l’Intelligenza Artificiale codifica un insieme di dati.

Scegliamo due frasi, molto semplici, per mostrare come viene “creato” un vocabolario, e come questo può essere “associato” a delle sequenze numeriche.

  • Raccolta delle frasi: Prendiamo le due frasi di esempio:

             – Frase 1: “Il gatto mangia il pesce.”

             – Frase 2: “Il cane mangia il cibo.”

  • Creazione del vocabolario: Identifichiamo tutte le parole uniche presenti nelle frasi. Questo diventa il nostro vocabolario:

            [“Il”, “gatto”, “mangia”, “pesce”, “cane”, “cibo”]

  • Costruzione dei vettori: Per ogni frase, creiamo un vettore che rappresenta la frequenza di ciascuna parola del vocabolario nella frase stessa.

            – Frase 1: “Il gatto mangia il pesce.”

            – “Il” appare 2 volte.

           – “gatto” appare 1 volta.

           – “mangia” appare 1 volta.

           – “pesce” appare 1 volta.

           – “cane” non appare (0 volte).

           – “cibo” non appare (0 volte).

           – Vettore: [2, 1, 1, 1, 0, 0]

           – Frase 2: “Il cane mangia il cibo”.

            – “Il” appare 2 volte.

            – “gatto” non appare (0 volte).

            – “mangia” appare 1 volta.

            – “pesce” non appare (0 volte).

            – “cane” appare 1 volta.

            – “cibo” appare 1 volta.

            – Vettore: [2, 0, 1, 0, 1, 1]

In sintesi, ogni numero nel vettore rappresenta quante volte una parola del vocabolario appare nella frase. Questo processo è semplice ma efficace per trasformare testo in numeri che possono essere utilizzati in vari algoritmi di machine learning.

Dovendo essere tutti i vettori della stessa lunghezza, nelle parole che non compaiono, come visto, si inserisce uno zero. Questa tecnica del rendere tutti i vettori della stessa lunghezza si chiama “padding”.

Credo, o almeno auspico, che l’esempio abbia chiarito come funziona l’Intelligenza Artificiale, almeno nella sua parte di decodifica testi.

La codifica include anche la parte “creativa”, vale a dire la capacità di creare testi, poesie o simili.

Il procedimento è simile, anche se leggermente diverso, quando occorre lavorare su immagini.

In questo caso vi sarà qualche differenza sulla codifica e sulla decodifica delle immagini. Che, Comunque, saranno anch’esse sequenze numeriche. Vediamo come questo avviene.

Visione Artificiale: “vedere” e “riconoscere” la Realtà attorno a noi

Come dicevo nella prima parte, la Visione Artificiale è quell’elemento che permette all’Intelligenza Artificiale di “interagire” con la Realtà.

Quello che si potrà notare, sicuramente, è come i “Processi di tipo Matematico” intervengano sempre in queste elaborazioni, facendo sì che i vari elementi siano gestiti come vettori numerici.

  • Acquisizione: Le immagini vengono acquisite mediante sensori (o mediante input diretto). Vengono quindi acquisiti i vari “pixel” delle immagini.

  • Trasformazione: Gli elementi acquisiti vengono trasformati in matrici numeriche.
    Nelle immagini a colori, ogni pixel viene indicato da una terna di numeri, che rappresentano rispettivamente la quantità di rosso, di verde e di blu, che sono le componenti principali di ogni colore (questa rappresentazione si chiama “RGB”, appunto dalle iniziali dei tre colori, in lingua inglese: Red, Green e Blue).

Ogni elementi contiene, quindi, un numero che indica la quantità di questi colori. I valori numerici che rappresentano i colori possono andare da 0 a 255. Infatti, 255 è il massimo valore rappresentabile in un byte (insieme di 8 bit, che in informatica contiene un singolo carattere) che può andare da 00000000, vale a dire 0, a 11111111, vale a dire 255 (ricordiamo che la scrittura è in sistema binario, che quindi utilizza solo le cifre 0 e 1).

Ad esempio, un pixel sarà codificato come (123,240,35).
Tutte le combinazioni possibili di questi colori forniscono oltre 16 milioni di colori (224, in quanto le combinazioni saranno, essendo i bit 8, (28)3=224, che sviluppando l’esponente, fornisce il valore 16.777.216).

Il bianco e il nero, come ben sappiamo, sono rispettivamente presenza e assenza di tutti i colori. Verrano quindi codificati rispettivamente con il valore massimo e con quello nullo per ogni colore. Quindi, per il bianco, si avrà la codifica (255,255,255), mentre per il nero, la codifica sarà (0,0,0).
Nel caso di immagini in bianco e nero, invece, la codifica è molto più facile. Sarà infatti rappresentata con un solo valore, che va da 0 1 255, e che indica il livello di grigio.
In questo caso, 0 indica il nero totale e 255 il bianco totale.

  • Elaborazione: Le immagini vengono elaborate mediante particolari reti Neurali dette

Reti Neurali Convoluzionali” (CNN) che ne identificano le strutture e gli elementi. Valore che indicherà il quantitativo di rosso, blu e giallo presenti.

Tralasciando il particolare tecnico delle “Reti Neurali Convoluzionali”, che sono particolari tipi di reti Neurali(chi fosse interessato può andare alla pagina indicata dall’ipertesto sopra), è interessante, qui, notare come sia fondamentale la codifica in strutture numeriche e la risposta che verrà data a partire da questi elementi numerici.

Ancora una volta, tutto è calcolo, che poi torna parola e, in questo caso, immagine. Anche questo è il “miracolo” dell’Intelligenza Artificiale.

Per chi volesse approfondire il tema della Visione Artificiale, rimando al sito di Amazon Web Services, a questo indirizzo.

Generazione di Immagini

Nonostante noi possiamo, almeno sotto certi aspetti associare la Generazione di Immagini alla Visione Artificiale, si tratta di due cose quasi opposte.

Infatti, la Visione Artificiale non è una caratteristica “generativa”, in quanto serve ad “interagire” con la Realtà, identificando forme, colori e altro ancora, e permettendo di fornire risposte, ad esempio, su luoghi e simili. La visione artificiale è, quindi, una semplice interpretazione della Realtà attorno a noi. Non è di certo qualcosa che genera elementi nuovi, che prima non esistevano. Piuttosto, è un’interpretazione di elementi già esistenti.

La generazione di immagini, invece, è una vera e propria caratteristica “Generativa”. Con questa caratteristica si entra “a pieno titolo” nell’Intelligenza Artificiale Generativa, la citata “GenAI”.

Il processo di generazione è quasi opposto e inverso rispetto a quello della Visione Artificiale. Nel senso che, in questo caso, viene ricevuta in “input” una descrizione e, in “output”, viene “ritornata” un’immagine.

Vediamo più da vicino come questo processo funziona:

  • Descrizione: Il Sistema riceve in input una descrizione di un’immagine. Ad esempio: “Genera un’immagine con un’isola dove volano uccelli colorati”.
  • Elaborazione del Linguaggio: la descrizione viene convertita in elementi numerici, vale a dire in un vettore che contiene numeri che descrivono gli elementi linguistici della frase usata come descrizione, similmente a quanto visto prima nel descrivere il Natural Language Processing.
  • Trasformazione: Attraverso una Rete Neurale, il vettore “linguistico” viene trasformato in descrizioni numeriche di Pixel,  codificati mediante terne numeriche, come nel caso precedente. In sostanza, i vettori numerici relativi alla descrizione dell’immagine che vogliamo venga generata vengono convertiti in una matrice di pixel, che codifica l’immagine richiesta.
  • Generazione dell’immagine: La matrice numerica viene poi trasformata negli elementi dell’immagine, che sarà l’output del processo. Di fatto, qui si “inverte” il processo di acquisizione delle immagini.

Qui vediamo che, nel processo di generazione immagini, la descrizione viene convertita, come accade anche nell’elaborazione delle risposte, in sequenze numeriche.
In questo caso vediamo che le Reti Neurali giocano un ruolo fondamentale. Infatti, sarà proprio una di queste che, opportunamente “addestrata”, riuscirà a convertire la descrizione fatta dall’utente, che è una descrizione puramente testuale, in una matrice numerica che rappresenta la codifica dei singoli pixel. Questi, poi, con algoritmi di decodifica simili a quelli utilizzati nella Visione Artificiale come dicevo, si inverte, di fatto, il processo), verranno poi riconvertiti nei pixel dell’immagine che dovrà essere generata.

Generazioni di suoni e melodie partendo da un testo:

Similmente, con processi non così diversi, vengono anche generati suoni. Infatti,  oggi, mediante l’Intelligenza Artificiale, è possibile generare Musica, partendo dal testo da musicare e dallo stile musicale che si desidera.
Vediamo rapidamente come questo può avvenire:

  • Interpretazione del testo: Prima di tutto, il sistema analizza l’input testuale per comprendere il tono, l’umore e il contenuto delle parole. Questo può essere fatto utilizzando modelli di elaborazione del linguaggio naturale (NLP) che identificano parole chiave e frasi per determinare se il testo è triste, allegro, riflessivo, ecc.
  • Mappatura delle emozioni: Una volta compreso il testo, il sistema mappa le emozioni identificate a schemi musicali corrispondenti. Ad esempio, un testo allegro potrebbe essere mappato su un tempo vivace con accordi maggiori, mentre un testo triste potrebbe utilizzare un tempo più lento con accordi minori (si tratta dei “modi” fondamentali di quello che si chiama “Sistema Tonale Classico”. Chi volesse saperne di più non solo sul Sistema Tonale Classico, ma anche sulla sua “estensione” ad altri cosiddetti “modi”, può andare

a questo indirizzo).

  • Generazione della melodia: Utilizzando algoritmi di deep learning e reti neurali, il sistema genera una melodia che corrisponde all’emozione e al contenuto del testo. Questo può includere la selezione di scale, progressioni di accordi e strutture melodiche.
  • Arrangiamento: Il sistema poi arricchisce la melodia con arrangiamenti musicali, includendo strumenti virtuali, ritmi e dinamiche per creare una composizione completa. Questo può essere fatto utilizzando modelli di rete neurale che sono stati addestrati su grandi dataset di musica.
  • Sintesi e produzione: Infine, il sistema sintetizza la musica e la converte in un file audio che può essere riprodotto. Questo processo può coinvolgere la sintesi sonora e la manipolazione di campioni audio per ottenere un risultato realistico e di alta qualità.

Il cuore del processo è quella che è stata definita la “mappatura delle emozioni”. È come se il sistema “leggesse tra le righe” e traducesse le parole in suoni che evocano le giuste sensazioni.

Appare davvero qualcosa di incredibile: è come se il Sistema riuscisse a “cogliere” delle emozioni da un testo, e a tradurre queste emozioni in strutture musicali.

Questo appare davvero un qualcosa di incredibile, di “miracoloso”.

Eppure, come in tutti i processi dell’Intelligenza Artificiale, si tratta di un processo, essenzialmente, matematico. Forse, quindi, la vera magia è nella Matematica, che mai come ora appare davvero “Divina Follia”, per dirla alla Morris Kline.

E questa “Divina Follia” ha preso forma. Ed è diventata qualcosa di davvero straordinario.

Ed è bellissimo che sia così.

Spero che, in questa parte del mio lavoro, si sia compreso, almeno a grandi linee, come funziona l’Intelligenza Artificiale, e quello che può fare. Auspico che, almeno in maniera sommaria, possiate avere acquisito un’idea di come l’Intelligenza Artificiale può generare risposte e anche strutture (testi, suoni e immagini ed eventualmente altro ancora) prima non esistenti.

Nella parte successiva, ci appresteremo a “vederla all’opera”. Verranno indicati i principali prodotti di Intelligenza Artificiale oggi disponibili, e i loro vantaggi. Dopodiché verrà “lanciato” il primo sguardo sul Presente, per capire le attuali applicazioni dell’Intelligenza Artificiale, e sul futuro, prossimo e più distante, per riuscire a “intuire”, anche se a grandi linee, quello che potrebbe attenderci, e quello che potrebbe attendere le Nuove Generazioni.

Restate in contatto! Dalla prossima parte si inizierà a “sperimentare”!

DONA ORA E GRAZIE PER IL TUO SOSTEGNO: ANCHE 1 EURO PUÒ FARE LA DIFFERENZA PER UN GIORNALISMO INDIPENDENTE E DEONTOLOGICAMENTE SANO

Gli Scomunicati è una testata giornalistica fondata nel 2006 dalla giornalista Emilia Urso Anfuso, totalmente autofinanziata. Non riceve proventi pubblici.

Lascia un commento

Your email address will not be published.