Neuromodulazione: Cosa Fa il Cervello, Cosa Non Fanno i Trasformatori e Cosa Cerca di Fare Neuraxon

Scritto dal Team Scientifico di Qubic
Neuraxon Intelligence Academy — Volume 3
1. Neuromodulazione nel Cervello: La Fondazione dell'Intelligenza AdattivaLa neuromodulazione si riferisce all'insieme di meccanismi che regolano come il sistema nervoso funziona in un dato momento, senza cambiare la sua architettura di base. Grazie alla neuromodulazione, il cervello può apprendere rapidamente o lentamente, diventare esplorativo o conservativo e rimanere aperto alla novità o concentrarsi su ciò che è già noto. Il cablaggio non cambia; ciò che cambia è il modo in cui quel cablaggio viene utilizzato. Questo concetto è centrale per comprendere l'IA ispirata al cervello e l'architettura dietro Neuraxon di Qubic.
Recettori Ionotropici vs. Metabotropici: Due Tempi di Segnalazione NeuralePer comprendere correttamente la neuromodulazione, è essenziale distinguere tra due forme di azione chimica nel cervello. Da un lato, ci sono i neurotrasmettitori che agiscono sui recettori ionotropici, come il glutammato e il GABA. Questi recettori sono canali ionici: quando vengono attivati, producono cambiamenti elettrici immediati nel neurone, su scale di millisecondi. Questo corrisponde al livello veloce della computazione neurale: informazioni concrete vengono trasmesse, segnali sensoriali vengono integrati, decisioni rapide vengono prese e l'attività neuronale che sostiene la percezione, il movimento e il pensiero in tempo reale viene generata.
D'altra parte, ci sono neurotrasmettitori come dopamina, norepinefrina, serotonina e acetilcolina, la cui azione principale viene esercitata attraverso recettori metabotropici. Questi recettori non generano direttamente un segnale elettrico. Invece, attivano cascades di segnalazione intracellulare che modificano le proprietà interne del neurone su periodi di tempo più lunghi, secondi, minuti o più. Questo rappresenta il livello dinamico lento dell'elaborazione neurale, che è fondamentale per come il cervello si adatta e apprende.
Un modo intuitivo per pensare a questa differenza è attraverso la metafora di un porto. I recettori ionotropici sono come nuotatori, surfisti o piccole barche che entrano ed escono rapidamente. I recettori metabotropici, al contrario, sono come grandi navi cargo. Per attraccare, sono necessari permessi, è necessaria coordinazione e devono essere adattate le logistiche del porto. Questi recettori metabotropici alterano la plasticità sinaptica e la facilità con cui un neurone risponde: questa modulazione lenta non trasmette informazioni, ma modifica invece le regole interne del sistema.
I Quattro Neuromodulatori: Dopamina, Noradrenalina, Serotonina e AcetilcolinaÈ qui che entrano in gioco i principali sistemi neuromodulatori. Ognuno di questi quattro neurotrasmettitori gioca un ruolo distinto nella regolazione di come il cervello elabora informazioni, apprende e si adatta:
La dopamina, che ha origine principalmente dall'area tegmentale ventrale e dalla sostanza nera, non segnala il piacere di per sé, ma piuttosto quando qualcosa è rilevante per l'apprendimento. Regola la sensibilità del sistema agli errori e alla novità. Come dimostrato da Schultz (2016) nel suo lavoro fondamentale sulla codifica dell'errore di previsione della ricompensa della dopamina, la dopamina segnala la differenza tra risultati attesi e reali, un meccanismo critico per l'apprendimento per rinforzo sia nei sistemi biologici che in quelli artificiali.
La norepinefrina (Noradrenalina), rilasciata principalmente dal locus coeruleus, regola l'eccitazione e l'equilibrio tra esplorazione e sfruttamento. Quando il suo tono è alto, il cervello diventa più sensibile ai cambiamenti inaspettati e meno ancorato alle routine. Questo è in linea con la teoria integrativa proposta da Aston-Jones & Cohen (2005), che collega la funzione del locus coeruleus–norepinefrina al controllo del guadagno adattivo e alla decisione in condizioni di incertezza.
La serotonina, che ha origine nei nuclei del raphe, modula l'umore, il sonno, l'inibizione e la stabilità comportamentale. Come esplorato in Dayan & Huys (2009), la serotonina non spinge il sistema ad apprendere rapidamente, ma piuttosto a attendere, a evitare reazioni impulsive e a mantenere un comportamento quando l'ambiente è incerto. Svolge un ruolo critico nella pazienza e nella pianificazione a lungo termine.
L'acetilcolina, rilasciata dai nuclei del forebrain basale nel tronco cerebrale, svolge un ruolo centrale nell'attenzione e nell'apprendimento dipendente dal contesto. Facilita l'apertura delle reti corticali a informazioni sensoriali rilevanti e consente la plasticità sinaptica quando l'ambiente lo richiede. È particolarmente importante quando deve essere appreso qualcosa di nuovo, rendendola essenziale per la computazione neurale adattativa.
Grazie a questa azione combinata, lo stesso stimolo può produrre risposte diverse a seconda dello stato neuromodulatorio. Il circuito è lo stesso, ma il modo in cui opera è cambiato. Questo è il motivo per cui il cervello non risponde allo stesso modo quando è attento rispetto a quando è affaticato, né apprende allo stesso modo in situazioni di routine rispetto a quando si trova di fronte a novità o sorprese.
Il Livello Meta: Finestre di Plasticità e Apprendimento AdattivoC'è anche un terzo livello, più profondo, che può essere compreso come un livello meta di regolazione neurale. Questo livello non regola direttamente l'attività neuronale o la sua velocità, ma piuttosto le condizioni sotto le quali il sistema può cambiare in modo duraturo. Nel cervello, l'attività coincidente tra neuroni non garantisce l'apprendimento. Affinché una connessione si rafforzi o si indebolisca, lo stato neuromodulatorio deve permetterlo. È come se ci fosse un segnale silenzioso che dice: “ora sì” o “ora no”.
La neuromodulazione agisce quindi come un sistema che apre o chiude finestre di plasticità, decidendo quando un errore, un'esperienza o una coincidenza meritano di essere consolidati. Questa architettura multiscala, veloce, lenta e meta, esiste perché un sistema intelligente non può sempre applicare le stesse regole. Come spiegato da Marder (2012) nella sua recensione fondamentale, la neuromodulazione dei circuiti neuronali è come il cervello ottiene flessibilità comportamentale senza ricostruire la sua architettura.
Lo stato del corpo, i livelli di energia, la fatica o il dolore fanno parte dell'ambiente interno. Novità, minaccia, opportunità, ripetizione o prevedibilità fanno parte dell'ambiente esterno. I sistemi neuromodulatori traducono queste condizioni in stati funzionali. Attraverso dopamina, norepinefrina, serotonina e acetilcolina, il cervello valuta se una situazione meriti di essere appresa, se sia necessaria cautela, se l'esplorazione o la conservazione siano preferibili e se un errore sia informativo o semplicemente rumore. L'ambiente non detta direttamente la risposta, ma modula le regole secondo le quali il cervello risponde. Questo principio è al cuore di ciò che Friston (2010) ha descritto come il principio dell'energia libera, un framework unificato che suggerisce che il cervello minimizza continuamente la sorpresa attraverso modelli interni adattivi.
2. Perché i Modelli di Linguaggio di Grandi Dimensioni e le Architetture Transformer Mancano di NeuromodulazioneI modelli di linguaggio di grandi dimensioni (LLM) e le architetture basate su Transformer non possiedono la neuromodulazione. Sebbene elaborino lunghe sequenze e abbiano raggiunto prestazioni notevoli nell'elaborazione del linguaggio naturale, non hanno un sistema che regola dinamicamente il regime operativo del modello durante l'inferenza.
La Natura Statica dei Sistemi AI Basati su TransformerL'apprendimento negli LLM avviene durante le fasi di addestramento che sono completamente separate dall'uso. I pesi vengono regolati attraverso la retropropagazione dell'errore, e una volta completato l'addestramento, il modello entra in uno stato fisso. Durante l'inferenza, non c'è plasticità e nessun cambiamento durevole in funzione del contesto. Il sistema non decide quando sia appropriato apprendere e quando dovrebbe stabilizzarsi, perché non apprende mentre opera. Questa è la limitazione fondamentale che recenti ricerche hanno confermato, gli LLM mancano di veri modelli del mondo interni e della capacità di adattarsi in tempo reale.
Alcuni approcci ispirati alla neuromodulazione tentano di approssimare certi effetti regolando parametri come il tasso di apprendimento durante l'addestramento, attivando o disattivando sottoreti, o modulando le funzioni di attivazione. Tuttavia, queste sono semplici ottimizzazioni esterne, non sistemi interni che regolano l'attività e la plasticità in tempo reale. Come sostenuto da Mei, Müller & Ramaswamy (2022) in Trends in Neurosciences, informare le reti neurali profonde attraverso principi multiscala dei sistemi neuromodulatori rimane una sfida aperta, una che le attuali architetture LLM non hanno affrontato.
Sebbene la neuromodulazione venga talvolta menzionata in contesti AI, gli LLM e i Transformer rimangono approssimazioni parziali, non sistemi comparabili al cervello. Il divario tra calcoli statici in matrice e la regolazione dinamica, dipendente dallo stato, presente nelle reti neurali biologiche è precisamente ciò che rende necessarie architetture AI ispirate al cervello come Neuraxon come passo successivo verso un'intelligenza artificiale adattativa.
3. Come Neuraxon Calcola la Neuromodulazione: Architettura AI Ispirata al CervelloIn Neuraxon, la computazione è un processo che si svolge nel tempo continuo. Il codice esprime un sistema che mantiene stati interni, s(t), che evolvono anche in assenza di chiari stimoli esterni. Questi stati influenzano il comportamento futuro, creando un sistema neurale vivente che è sempre attivo, un concetto esplorato in dettaglio nel documento di ricerca di Neuraxon.
Dinamiche Veloci, Lente e Meta nella Computazione NeuraleNeuraxon incorpora esplicitamente dinamiche veloci, lente e meta, rispecchiando l'architettura temporale multiscala presente nel cervello biologico. Le dinamiche veloci governano la propagazione immediata dell'attività, analoghe alla segnalazione neuronale rapida attraverso recettori ionotropici. Le dinamiche lente introducono accumulo, persistenza e stabilizzazione dei modelli, consentendo al sistema di mantenere informazioni oltre l'istante, simile a come i recettori metabotropici modulano la funzione neurale su secondi e minuti. Le dinamiche meta agiscono sulle regole di interazione tra le prime, modulando quando il sistema diventa più sensibile al cambiamento e quando tende a preservare il suo stato.
La neuromodulazione in Neuraxon non è implementata come un aggiustamento di parametri esterni. Il sistema non decide esplicitamente cosa apprendere, ma piuttosto in quali condizioni può cambiare. Questo rispecchia come i neuromodulatori biologici come dopamina e serotonina creano finestre di plasticità piuttosto che codificare direttamente informazioni. Puoi esplorare queste dinamiche di persona con la simulazione 3D interattiva di Neuraxon su HuggingFace Spaces, dove puoi regolare i livelli di dopamina, serotonina, acetilcolina e norepinefrina in tempo reale e osservare come influenzano il comportamento della rete.
Da Principi Biologici a AI DecentralizzataQuesto approccio non riproduce la complessità molecolare o anatomica del cervello, che attualmente è impossibile da replicare. Non ci sono migliaia di recettori o veri network biologici. Tuttavia, preserva e calcola un principio essenziale: l'intelligenza è adattativa, e quindi richiede dinamiche interne, stato e modulazione.
L'architettura di neuromodulazione di Neuraxon è una parte centrale della visione più ampia di Qubic per l'AI decentralizzata. Integrando Neuraxon con il framework evolutivo Aigarth Intelligent Tissue, Qubic crea un sistema in cui milioni di architetture basate su Neuraxon possono evolversi, competere e migliorare attraverso la computazione distribuita, alimentata dal meccanismo di consenso Useful Proof of Work (UPoW) della rete Qubic.
4. Esplora i Neuromodulatori con la Demo Interattiva di NeuraxonVuoi sperimentare come funziona la neuromodulazione in un sistema AI ispirato al cervello? La demo Neuraxon Mood Mixer ti consente di regolare i livelli di dopamina, serotonina, acetilcolina e norepinefrina in tempo reale e osservare come questi neuromodulatori influenzano il comportamento della rete neurale. È un modo pratico per comprendere i principi discussi in questo articolo e vedere la differenza tra il calcolo statico dell'AI e l'elaborazione dinamica, dipendente dallo stato.
5. La Matematica Dietro la Neuromodulazione Multiscala di NeuraxonLe dinamiche temporali in Neuraxon sono governate da tre equazioni differenziali che catturano le scale temporali veloci, lente e meta della computazione neurale:
Qui, τ_fast < τ_slow < τ_meta riflettono le loro scale temporali distinte, con τ_meta che è significativamente più grande per catturare la natura 'ultraslow' degli effetti metabotropici. Questo framework matematico implementa direttamente il principio biologico secondo cui la neuromodulazione opera su scale temporali molto più lente rispetto alla trasmissione sinaptica veloce, come descritto da Northoff & Huang (2017) nel loro lavoro su come le dinamiche temporali del cervello mediano la coscienza.
Riferimenti ScientificiDayan, P., & Huys, Q. J. M. (2009). Serotonina, inibizione e umore negativo. PLoS Computational Biology.
Marder, E. (2012). Neuromodulazione dei circuiti neuronali: tornare al futuro. Neuron.
Schultz, W. (2016). Codifica dell'errore di previsione della ricompensa della dopamina. Dialoghi in Neuroscienze Cliniche.
Aston-Jones, G., & Cohen, J. D. (2005). Una teoria integrativa della funzione locus coeruleus–norepinefrina. Annual Review of Neuroscience.
Mei, L., Müller, E., & Ramaswamy, S. (2022). Informare le reti neurali profonde attraverso principi multiscala dei sistemi neuromodulatori. Trends in Neurosciences.
Friston, K. (2010). Il principio dell'energia libera: una teoria unificata del cervello? Nature Reviews Neuroscience.
Northoff, G., & Huang, Z. (2017). Come il tempo e lo spazio del cervello mediano la coscienza e i suoi disturbi? Coscienza e Cognizione, 57, 1–10.
#UPoW #Neuraxon