Neuromodulação: O que o Cérebro Faz, O que os Transformadores Não Fazem, e O que a Neuraxon Tenta

Escrito pela Equipe Científica da Qubic
Academia de Inteligência Neuraxon — Volume 3
1. Neuromodulação no Cérebro: A Fundação da Inteligência AdaptativaA neuromodulação refere-se ao conjunto de mecanismos que regulam como o sistema nervoso funciona em qualquer momento, sem alterar sua arquitetura básica. Graças à neuromodulação, o cérebro pode aprender rapidamente ou lentamente, tornar-se exploratório ou conservador, e permanecer aberto à novidade ou focar no que já é conhecido. A fiação não muda; o que muda é a maneira como essa fiação é utilizada. Este conceito é central para entender a IA inspirada no cérebro e a arquitetura por trás da Neuraxon da Qubic.
Receptores Ionotrópicos vs. Metabotrópicos: Duas Escalas Temporais de Sinalização NeuralPara entender a neuromodulação adequadamente, é essencial distinguir entre duas formas de ação química no cérebro. Por um lado, existem neurotransmissores que atuam em receptores ionotrópicos, como o glutamato e o GABA. Esses receptores são canais iônicos: quando ativados, produzem mudanças elétricas imediatas no neurônio, na escala de milissegundos. Isso corresponde ao nível rápido de computação neural: informações concretas são transmitidas, sinais sensoriais são integrados, decisões rápidas são tomadas e a atividade neuronal que sustenta a percepção, o movimento e o pensamento em tempo real é gerada.
Por outro lado, existem neurotransmissores como dopamina, noradrenalina, serotonina e acetilcolina, cuja ação primária é exercida através de receptores metabotrópicos. Esses receptores não geram diretamente um sinal elétrico. Em vez disso, ativam cascatas de sinalização intracelular que modificam as propriedades internas do neurônio ao longo de períodos mais longos, segundos, minutos ou mais. Isso representa o nível dinâmico lento do processamento neural, que é fundamental para como o cérebro se adapta e aprende.
Uma maneira intuitiva de pensar sobre essa diferença é através da metáfora de um porto marítimo. Receptores ionotrópicos são como nadadores, surfistas ou pequenos barcos que entram e saem rapidamente. Receptores metabotrópicos, em contraste, são como grandes navios de carga. Para que eles atracarem, são necessários permisos, coordenação é requerida e a logística do porto deve ser ajustada. Esses receptores metabotrópicos alteram a plasticidade sináptica e a facilidade com que um neurônio responde—essa modulação lenta não transmite informações, mas modifica as regras internas do sistema.
Os Quatro Neuromoduladores: Dopamina, Noradrenalina, Serotonina e AcetilcolinaÉ aqui que os principais sistemas neuromodulatórios entram em cena. Cada um desses quatro neurotransmissores desempenha um papel distinto na regulação de como o cérebro processa informações, aprende e se adapta:
A dopamina, originada principalmente da área tegmental ventral e da substância negra, não sinaliza prazer per se, mas sim quando algo é relevante para o aprendizado. Ela ajusta a sensibilidade do sistema a erros e novidades. Como Schultz (2016) demonstrou em seu trabalho fundamental sobre a codificação do erro de previsão de recompensa da dopamina, a dopamina sinaliza a diferença entre resultados esperados e reais, um mecanismo crítico para o aprendizado por reforço em sistemas biológicos e artificiais.
A noradrenalina (norepinefrina), liberada principalmente do locus coeruleus, regula a excitação e o equilíbrio entre exploração e exploração. Quando seu tom é alto, o cérebro torna-se mais sensível a mudanças inesperadas e menos ancorado a rotinas. Isso se alinha com a teoria integrativa proposta por Aston-Jones & Cohen (2005), que vincula a função do locus coeruleus–norepinefrina ao controle de ganho adaptativo e à tomada de decisões sob incerteza.
A serotonina, originada nos núcleos da rafe, modula o humor, o sono, a inibição e a estabilidade comportamental. Como explorado em Dayan & Huys (2009), a serotonina não empurra o sistema a aprender rapidamente, mas sim a esperar, evitar reações impulsivas e manter o comportamento quando o ambiente é incerto. Ela desempenha um papel crítico na paciência e no planejamento a longo prazo.
A acetilcolina, liberada dos núcleos do cérebro basal no tronco encefálico, desempenha um papel central na atenção e no aprendizado dependente do contexto. Ela facilita a abertura de redes corticais para informações sensoriais relevantes e possibilita plasticidade sináptica quando o ambiente exige. É particularmente importante quando algo novo deve ser aprendido, tornando-se essencial para a computação neural adaptativa.
Graças a esta ação combinada, o mesmo estímulo pode produzir respostas diferentes dependendo do estado neuromodulatório. O circuito é o mesmo, mas a maneira como opera mudou. É por isso que o cérebro não responde da mesma forma quando está atento como quando está fatigado, nem aprende da mesma forma em situações rotineiras como o faz diante da novidade ou surpresa.
O Nível Meta: Janelas de Plasticidade e Aprendizado AdaptativoHá também um terceiro nível, mais profundo, que pode ser entendido como um nível meta de regulação neural. Este nível não regula diretamente a atividade neuronal ou sua velocidade, mas sim as condições sob as quais o sistema pode mudar de maneira duradoura. No cérebro, a atividade coincidente entre neurônios não garante aprendizado. Para uma conexão se fortalecer ou enfraquecer, o estado neuromodulatório deve permitir isso. É como se houvesse um sinal silencioso dizendo: “agora sim”, ou “agora não”.
A neuromodulação atua, assim, como um sistema que abre ou fecha janelas de plasticidade, decidindo quando um erro, uma experiência ou uma coincidência merece ser consolidada. Esta arquitetura multiescalar, rápida, lenta e meta, existe porque um sistema inteligente não pode sempre aplicar as mesmas regras. Como explicou Marder (2012) em sua revisão seminal, a neuromodulação dos circuitos neuronais é como o cérebro alcança flexibilidade comportamental sem reconstruir sua arquitetura.
O estado do corpo, níveis de energia, fadiga ou dor fazem parte do ambiente interno. Novidade, ameaça, oportunidade, repetição ou previsibilidade fazem parte do ambiente externo. Sistemas neuromodulatórios traduzem essas condições em estados funcionais. Através da dopamina, noradrenalina, serotonina e acetilcolina, o cérebro avalia se uma situação merece aprendizado, se a cautela é necessária, se a exploração ou conservação é preferível e se um erro é informativo ou apenas ruído. O ambiente não dita diretamente a resposta, mas modula as regras pelas quais o cérebro responde. Este princípio está no coração do que Friston (2010) descreveu como o princípio da energia livre, uma estrutura unificada que sugere que o cérebro minimiza continuamente a surpresa através de modelos internos adaptativos.
2. Por que Modelos de Linguagem Grandes e Arquiteturas Transformer Carecem de NeuromodulaçãoModelos de linguagem grandes (LLMs) e arquiteturas baseadas em Transformer não possuem neuromodulação. Embora processem longas sequências e tenham alcançado um desempenho notável em processamento de linguagem natural, carecem de um sistema que regule dinamicamente o regime de operação do modelo durante a inferência.
A Natureza Estática dos Sistemas de IA Baseados em TransformerO aprendizado em LLMs ocorre durante fases de treinamento que são totalmente separadas do uso. Os pesos são ajustados através da retropropagação do erro, e uma vez que o treinamento é concluído, o modelo entra em um estado fixo. Durante a inferência, não há plasticidade e nenhuma mudança duradoura como função do contexto. O sistema não decide quando é apropriado aprender e quando deve se estabilizar, porque não aprende enquanto opera. Esta é a limitação fundamental que pesquisas recentes confirmaram, os LLMs carecem de verdadeiros modelos internos do mundo e da capacidade de se adaptar em tempo real.
Algumas abordagens inspiradas na neuromodulação tentam aproximar certos efeitos ajustando parâmetros como a taxa de aprendizado durante o treinamento, ativando ou desativando sub-redes, ou modulando funções de ativação. No entanto, estas são meras otimizações externas, não sistemas internos que regulam a atividade e a plasticidade em tempo real. Como argumentaram Mei, Müller & Ramaswamy (2022) na Trends in Neurosciences, informar redes neurais profundas por princípios multiescalares de sistemas neuromodulatórios continua sendo um desafio em aberto, um que as arquiteturas atuais de LLM não abordaram.
Embora a neuromodulação seja às vezes mencionada em contextos de IA, os LLMs e Transformers permanecem aproximações parciais, não sistemas comparáveis ao cérebro. A lacuna entre as computações matriciais estáticas e a regulação dinâmica, dependente do estado, encontrada em redes neurais biológicas é precisamente o que torna arquiteturas de IA inspiradas no cérebro, como a Neuraxon, um passo necessário em direção à inteligência artificial adaptativa.
3. Como a Neuraxon Computa a Neuromodulação: Arquitetura de IA Inspirada no CérebroNa Neuraxon, a computação é um processo que se desenrola em tempo contínuo. O código expressa um sistema que mantém estados internos, s(t), que evoluem mesmo na ausência de estímulos externos claros. Esses estados influenciam o comportamento futuro, criando um sistema neural vivo que está sempre ativo, um conceito explorado em detalhes no artigo de pesquisa da Neuraxon.
Dinâmicas Rápidas, Lentas e Meta na Computação NeuralA Neuraxon incorpora explicitamente dinâmicas rápidas, lentas e meta, espelhando a arquitetura temporal multiescalar encontrada no cérebro biológico. Dinâmicas rápidas governam a propagação imediata da atividade, análoga à sinalização neuronal rápida através de receptores ionotrópicos. Dinâmicas lentas introduzem acumulação, persistência e estabilização de padrões, permitindo que o sistema retenha informações além do instante, semelhante a como os receptores metabotrópicos modulam a função neural ao longo de segundos e minutos. Dinâmicas meta atuam nas regras de interação entre os anteriores, modulando quando o sistema se torna mais sensível à mudança e quando tende a preservar seu estado.
A neuromodulação na Neuraxon não é implementada como um ajuste de parâmetro externo. O sistema não decide explicitamente o que aprender, mas sim sob quais condições pode mudar. Isso espelha como neuromoduladores biológicos como dopamina e serotonina criam janelas de plasticidade em vez de codificar diretamente informações. Você pode explorar essas dinâmicas em primeira mão com a simulação 3D interativa da Neuraxon no HuggingFace Spaces, onde você pode ajustar os níveis de dopamina, serotonina, acetilcolina e norepinefrina em tempo real e observar como eles afetam o comportamento da rede.
Dos Princípios Biológicos à IA DescentralizadaEsta abordagem não reproduz a complexidade molecular ou anatômica do cérebro, o que atualmente é impossível de replicar. Não existem milhares de receptores ou redes biológicas reais. No entanto, ela preserva e computa um princípio essencial: a inteligência é adaptativa e, portanto, requer dinâmicas internas, estado e modulação.
A arquitetura de neuromodulação da Neuraxon é uma parte central da visão mais ampla da Qubic para IA descentralizada. Ao integrar a Neuraxon com a estrutura evolutiva Aigarth Intelligent Tissue, a Qubic cria um sistema onde milhões de arquiteturas baseadas na Neuraxon podem evoluir, competir e melhorar através da computação distribuída, alimentada pelo mecanismo de consenso de Prova de Trabalho Útil (UPoW) da rede Qubic.
4. Explore Neuromoduladores com a Demonstração Interativa da NeuraxonQuer experimentar como a neuromodulação funciona em um sistema de IA inspirado no cérebro? A demonstração Neuraxon Mood Mixer permite que você ajuste os níveis de dopamina, serotonina, acetilcolina e norepinefrina em tempo real e observe como esses neuromoduladores influenciam o comportamento da rede neural. É uma maneira prática de entender os princípios discutidos neste artigo e ver a diferença entre a computação estática de IA e o processamento dinâmico, dependente do estado.
5. A Matemática por trás da Neuromodulação Multiescalar da NeuraxonAs dinâmicas temporais na Neuraxon são governadas por três equações diferenciais que capturam as escalas de tempo rápidas, lentas e meta da computação neural:
Aqui, τ_fast < τ_slow < τ_meta refletem suas escalas temporais distintas, com τ_meta sendo significativamente maior para capturar a natureza ‘ultraslow’ dos efeitos metabotrópicos. Esta estrutura matemática implementa diretamente o princípio biológico de que a neuromodulação opera em escalas de tempo muito mais lentas do que a transmissão sináptica rápida, conforme descrito por Northoff & Huang (2017) em seu trabalho sobre como as dinâmicas temporais do cérebro mediam a consciência.
Referências CientíficasDayan, P., & Huys, Q. J. M. (2009). Serotonina, inibição e humor negativo. PLoS Computational Biology.
Marder, E. (2012). Neuromodulação de circuitos neuronais: de volta ao futuro. Neuron.
Schultz, W. (2016). Codificação do erro de previsão de recompensa da dopamina. Diálogos em Neurociência Clínica.
Aston-Jones, G., & Cohen, J. D. (2005). Uma teoria integrativa da função do locus coeruleus–norepinefrina. Revisão Anual de Neurociência.
Mei, L., Müller, E., & Ramaswamy, S. (2022). Informando redes neurais profundas por princípios multiescalares de sistemas neuromodulatórios. Trends in Neurosciences.
Friston, K. (2010). O princípio da energia livre: uma teoria unificada do cérebro? Nature Reviews Neuroscience.
Northoff, G., & Huang, Z. (2017). Como o tempo e espaço do cérebro mediam a consciência e seus distúrbios? Consciência e Cognição, 57, 1–10.
#UPoW #Neuraxon