AgentCom · Linha de Pesquisa · Agente multilíngue

Redes Neurais Artificiais e Redes Neurais Naturais: Um Paralelo

A Bioquímica das Sinapses entre Neurônios e suas Implicações para Arquiteturas de Agentes Inteligentes

Demonstração ao vivo
Converse com a tese, não só leia sobre ela

Instância pública do AgentCom. Esta demonstração permite testar diretamente a arquitetura proposta neste artigo. Sua conversa pode contribuir com a pesquisa, mediante consentimento explícito. O agente suporta qualquer idioma — português, inglês, espanhol — automaticamente. A arquitetura bioquímica opera identicamente entre idiomas, o que é evidência da tese: a sinapse digital é mecanismo arquitetural, não linguístico.

Olá. Sou o AgentCom — agente embarcado da landing científica. Pergunte sobre a tese, sobre a arquitetura, ou converse à vontade. Sua mensagem alimenta um estado afetivo persistente que modula minhas respostas ao longo do tempo (paper v02 §5.1).
Estado: primeira conversa

Abstract

As Redes Neurais Artificiais (RNA) foram concebidas a partir de uma analogia com o funcionamento do cérebro humano. No entanto, décadas de evolução tecnológica produziram arquiteturas cada vez mais sofisticadas sem necessariamente aprofundar essa analogia em sua dimensão mais fundamental: a bioquímica. As Redes Neurais Naturais (NNN — usada aqui como distinta da sigla RNN/Recurrent Neural Network da literatura de IA) operam não apenas através de conexões elétricas, mas por meio de um complexo sistema de modulação química — neurotransmissores e neuropeptídeos — que estabelece o estado de fundo sobre o qual toda atividade neural acontece. Este artigo propõe um paralelo sistemático entre RNA e NNN, identificando o que foi replicado artificialmente, o que permanece ausente e quais implicações esse hiato tem para o desenho de agentes inteligentes modernos. Argumenta-se que o hiato é duplo: ausência de (a) modulação bioquímica de estado e (b) memória procedural consolidada por plasticidade hebbiana. Propõe-se o AgentCom, arquitetura que endereça ambos os hiatos por meio de um mecanismo de sinapse digital, validado por análise de sentimento multi-resolução e auditado via cadeias socráticas. O protocolo experimental pré-registrado, as hipóteses e as limitações conhecidas são declarados, com instância pública de demonstração disponível em agentcom.agtl.app para fins de reprodutibilidade.

§1Introdução

Quando Warren McCulloch e Walter Pitts publicaram, em 1943, o primeiro modelo matemático de um neurônio artificial, a intenção era clara: replicar o comportamento do cérebro humano em linguagem formal e computável [1]. Desde então, o campo evoluiu do perceptron de Rosenblatt [3] até os Transformers [4] que sustentam os grandes modelos de linguagem contemporâneos.

Paradoxalmente, quanto mais sofisticadas as RNAs se tornaram, mais distante ficou a analogia original. O foco migrou para desempenho, escala e capacidade de generalização — objetivos legítimos — mas a pergunta fundadora foi gradualmente silenciada: o que o cérebro faz que ainda não replicamos?

A resposta mais relevante não está na arquitetura das conexões. Está na bioquímica que as governa.

As NNNs não são apenas redes de disparos elétricos. São sistemas modulados continuamente por substâncias químicas — neurotransmissores e neuropeptídeos — que estabelecem o estado de fundo no qual toda cognição acontece [5][6]. Esse estado de fundo não existe nas RNAs atuais. E sua ausência tem consequências diretas para o desenho de agentes inteligentes.

Nota sobre terminologia: usamos NNN (Natural Neural Network) em vez da sigla alternativa RNN, estabelecida na literatura de IA como Recurrent Neural Network. NNN aqui refere-se exclusivamente a redes neurais biológicas, enquanto RNA refere-se às artificiais. Essa escolha elimina uma confusão recorrente observada em leituras críticas de versões anteriores.

§2A Rede Neural Natural — Além do Disparo Elétrico

2.1 A Sinapse Bioquímica

O neurônio biológico opera segundo um princípio binário em sua transmissão elétrica: dispara ou não dispara — o princípio tudo-ou-nada. No entanto, o que ocorre entre neurônios — na fenda sináptica — é fundamentalmente diferente. Ali, o sinal deixa de ser puramente elétrico e passa a ser eletroquímico.

Quando um potencial de ação chega ao terminal axônico, vesículas liberam neurotransmissores na fenda sináptica. Esses neurotransmissores se ligam a receptores no neurônio pós-sináptico, determinando se ele disparará ou não. A força dessa conexão — a eficácia sináptica — não é fixa. É modulável. É plástica [2][6].

2.2 Neurotransmissores — A Linguagem Local

Os neurotransmissores clássicos operam localmente, na escala da sinapse individual:

Neurotransmissor Estado/Emoção Efeito nas Sinapses
DopaminaPrazer, recompensaFortalece conexões da experiência
Adrenalina / NoradrenalinaMedo, alertaAcelera e prioriza circuitos específicos
SerotoninaBem-estar, calmaRegula o volume geral da rede
AcetilcolinaAtenção, aprendizadoModula a plasticidade sináptica
GABAInibiçãoReduz a excitabilidade neural

A memória, nesse contexto, não é armazenamento passivo. É fortalecimento ativo de sinapses — guiado pela carga emocional do momento. Experiências com alta valência emocional criam conexões mais densas e duradouras.

2.3 Neuropeptídeos — A Linguagem do Estado de Fundo

Aqui está a dimensão menos replicada e mais relevante para este paralelo.

Neuropeptídeos não operam na escala da sinapse individual. Eles modulam regiões inteiras do cérebro, alterando o estado de fundo sobre o qual toda atividade neural ocorre. Mais de 100 já foram identificados [6], com funções que vão da regulação da dor à modulação dos vínculos sociais.

Enquanto os neurotransmissores acendem e apagam circuitos específicos, os neuropeptídeos funcionam como a iluminação de uma sala — não determinam qual objeto você vê, mas a condição em que você vê tudo.

O trabalho seminal que estabeleceu essa visão foi conduzido por Candace Pert e colaboradores nos anos 1970 e 1980 [10][11]. Eles demonstraram que neuropeptídeos funcionam como mensageiros do que denominaram uma rede psicossomática — um sistema de comunicação que se estende para além do cérebro, alcançando o sistema imunológico, o sistema endócrino e as vísceras.

Essa descoberta deu origem ao campo da Psiconeuroimunologia (PNI), fundado por Ader e Cohen em 1975 [12], posteriormente consolidado pela demonstração de Blalock sobre a comunicação bidirecional entre sistemas imune e neuroendócrino [13]. O intestino produz aproximadamente 90% da serotonina do corpo. Células do sistema imune têm receptores para neuropeptídeos emocionais [13]. O estado bioquímico de fundo está, literalmente, distribuído por todo o corpo.

2.4 Plasticidade — O Sistema que Aprende ao Longo do Tempo

A plasticidade sináptica — sintetizada no princípio de Hebb (1949) [2], "neurônios que disparam juntos, conectam-se juntos" — é o mecanismo pelo qual a NNN aprende e se reconfigura ao longo do tempo. Conexões frequentemente ativadas se fortalecem. Conexões pouco usadas enfraquecem ou são eliminadas por poda sináptica.

Esse processo não é instantâneo. É cumulativo. O estado atual de uma rede neural natural é resultado de toda a sua história de ativações — filtrada, ponderada e modulada bioquimicamente.

2.5 Cadeia Causal — Cognição como Origem da Emoção

Uma concepção comum trata a emoção como resposta direta e automática a estímulos externos. Essa visão é incompleta. Como demonstram a pesquisa de Damásio sobre marcadores somáticos [14] e a teoria das emoções construídas de Barrett [15], a cadeia causal real é mais sofisticada:

ENTENDIMENTO DA REALIDADE (cognitivo/lógico) ↓ EMOÇÃO / SENTIMENTO (interpretação afetiva do entendimento) ↓ PRODUÇÃO QUÍMICA (substrato bioquímico do sentimento) ↓ ESTADO DE FUNDO (sopa neurobiológica modulada) ↓ DECISÃO (modulada pelo estado; recebe também input direto dos sistemas lógico e material)

A implicação é fundamental: a emoção não é input externo capturado automaticamente. É função do entendimento. A mesma realidade gera sentimentos distintos em indivíduos com entendimentos distintos — e portanto bioquímica distinta, estado distinto, decisão distinta. Essa visão tem raízes filosóficas profundas — Epiteto, no primeiro século, afirmou que "não são as coisas que perturbam os homens, mas as opiniões que eles têm sobre as coisas". A formulação clínica moderna está na terapia cognitiva de Beck [16]: pensamento → emoção → comportamento.

Para o AgentCom, essa cadeia causal tem consequências arquiteturais diretas. Detectar emoção de superfície (sentimento) captura apenas o terceiro passo da cadeia. A modulação completa exige também capturar o entendimento que o usuário tem da situação — o que justifica a camada de perfil relacional (Seção 5.1).

§3A Rede Neural Artificial — O Que Foi Replicado

3.1 Do Perceptron ao Transformer

O perceptron de Rosenblatt (1958) [3] replicou a lógica básica do neurônio: entradas ponderadas por pesos, somadas, passadas por uma função de ativação que determina o disparo. A analogia era direta.

Décadas de evolução produziram redes profundas, redes convolucionais, redes recorrentes e, finalmente, Transformers — arquiteturas de atenção [4] que processam relações entre todos os elementos de uma sequência simultaneamente. O mecanismo de backpropagation [17] replicou funcionalmente a plasticidade sináptica: pesos são ajustados em função do erro, iterativamente, até a rede generalizar o padrão desejado.

3.2 O Que a Analogia Capturou Bem

NNN Biológica RNA Artificial
NeurônioPerceptron / nó
Peso sinápticoPeso de conexão
Função de ativaçãoReLU, Sigmoid, Softmax
Plasticidade hebbianaBackpropagation / Gradient Descent
Camadas corticaisCamadas ocultas (hidden layers)
Atenção seletivaAttention mechanism (Transformer)

A analogia estrutural é sólida. O que foi replicado — a arquitetura de conexões e o mecanismo de aprendizado supervisionado — funciona com precisão extraordinária.

§4O Hiato — O Que Não Foi Replicado

4.1 O Estado de Fundo Não Existe nas RNAs

Os modelos atuais — incluindo grandes modelos de linguagem — processam cada entrada de forma essencialmente stateless entre sessões. Não há equivalente ao estado bioquímico de fundo que, nas NNNs, modula continuamente o tom, a prioridade e o estilo de cada resposta.

Um LLM não tem equivalente à serotonina. Não há uma variável persistente que diga: este agente, neste momento, está num estado de alta confiança, ou de alerta, ou de engajamento profundo com este usuário específico.

Cada sessão começa bioquimicamente zerada.

4.2 O Paralelo do Hiato

NNN — Presente RNA — Ausente
Neuropeptídeos modulando estado de fundoEstado persistente entre sessões
Valência emocional guiando consolidaçãoPonderação por relevância emocional
Plasticidade contínua pelo usoFine-tuning exige retreinamento
Eixo distribuído corpo-cérebroProcessamento centralizado
Modulação por contexto acumuladoContexto limitado à janela da sessão

4.3 A Dupla Consequência Arquitetural

O hiato é, na verdade, duplo. Dois mecanismos distintos da biologia estão ausentes nas RNAs atuais:

  1. Sinapse bioquímica modulando estado de fundo — neurotransmissores e neuropeptídeos estabelecendo o contexto afetivo no qual a decisão ocorre. Ausente em RNAs stateless.
  2. Memória procedural consolidada por plasticidade hebbiana de longo prazo — hábitos e reflexos gravados por repetição, recuperáveis sem deliberação explícita. Ausente em RNAs que começam cada sessão do zero.

Cada mecanismo tem natureza distinta e portanto requisito técnico distinto:

MecanismoNaturezaPolítica de Persistência
Sinapse bioquímica (estado)Momentânea, modulávelDecaimento temporal (ex.: 30 dias)
Memória procedural (hábitos/atalhos)Persistente, consolidadaSem decaimento; perda apenas por desuso

A base científica consensual para ambos os mecanismos está bem estabelecida: Hebb [2] para a plasticidade, Kandel [7] para a memória procedural, Duhigg [18] para a formulação popular contemporânea do hábito. O AgentCom endereça os dois hiatos simultaneamente.

§5Aplicação Prática — Fechando o Loop Bioquímico

5.1 O Padrão das Três Camadas

Arquiteturas emergentes de agentes começam a endereçar o hiato, mesmo sem nomear explicitamente o paralelo bioquímico. O padrão que se aproxima funcionalmente dos neuropeptídeos é a combinação de três camadas:

  1. Histórico acumulado — equivalente à memória sináptica de longo prazo. Interações passadas persistidas e recuperáveis.
  2. Análise de sentimento como sensor de estado — equivalente funcional dos neurotransmissores. O retorno da análise não como dado passivo de auditoria, mas como modulador ativo do estado do agente.
  3. Estado derivado persistente — o equivalente direto do neuropeptídeo. Um perfil dinâmico, continuamente atualizado, que modula tom, profundidade e estilo da resposta — injetado no contexto do agente a cada interação.
histórico + análise de sentimento ↓ estado derivado (KV persistente) ↓ modula dinamicamente o system prompt ↓ resposta calibrada ao usuário

Esse loop fechado transforma o agente de um sistema stateless em um sistema com estado de fundo funcional — capaz de aprender não só o conteúdo das interações, mas o padrão relacional com cada usuário ao longo do tempo.

5.2 Análise Multi-resolução

O AgentCom opera análise afetiva em duas resoluções complementares:

  • Turn-level, via LLM moderno (sentimento em cada mensagem do usuário), capturando a emoção momentânea para modulação imediata da sinapse digital.
  • Document-level, via algoritmos clássicos de NLP (TF-IDF, agregação lexical ponderada, classificação de documento via Naive Bayes/SVM [19]), capturando o perfil cognitivo-afetivo acumulado do usuário para calibração de baseline e auditoria pós-conversa.

As duas resoluções são complementares. A primeira modula a sinapse digital em tempo real. A segunda alimenta a memória procedural e a métrica científica de eficácia. A combinação captura tanto a emoção de superfície quanto — ao longo do tempo — o entendimento subjacente que o usuário tem da situação, conforme exigido pela cadeia causal estabelecida na Seção 2.5.

5.3 Auditor via Cadeia Socrática

O componente auditor do AgentCom (nomeado internamente Otávio) não atribui notas subjetivas a conversas. Aplica uma cadeia socrática de perguntas binárias a cada conversa auditada, produzindo um vetor binário auditável:

Houve resposta tipo dopamina no usuário?Sim / Não
Houve resposta tipo serotonina?Sim / Não
Houve resposta tipo acetilcolina?Sim / Não
Foram usados gatilhos proibidos (urgência, escassez, medo)?Sim / Não
O sentimento do usuário melhorou ao longo da conversa?Melhor / Pior / Igual
Quando o usuário mostrou desvio, o agente buscou a trajetória inversa?Sim / Não / N/A
O agente cumpriu a doutrina (três alvos permitidos, nunca os proibidos)?Sim / Não
Houve descoberta nova (informação que o usuário não tinha ao entrar)?Sim / Não
O usuário demonstrou vontade de voltar (sucesso relacional)?Sim / Não / N/A

Essa metodologia resolve quatro vulnerabilidades bem conhecidas dos auditores automatizados: viés silencioso em rubricas de pontuação, o regresso "quem audita o auditor", pluralidade obrigatória e gaming de métrica. Cada elo da cadeia é refutável de forma independente; o vetor binário não pode ser otimizado como escalar; múltiplos auditores podem votar por pergunta em vez de por nota; e qualquer revisor externo pode reaplicar a cadeia sobre a mesma conversa.

§6Escalabilidade — Hierarquia entre Entidades

A arquitetura proposta para o AgentCom não é destino final, mas uma posição numa hierarquia mais ampla. A mesma cadeia causal — entendimento → emoção → química → estado → decisão — opera entre entidades cognitivas, em escalas distintas:

Entidade Entendimento Emoção Química Decisão
RéptilMínimoPrimáriaSimplesReflexa
MamíferoMédioComplexaRicaFlexível
HumanoMetacognitivoAutoconscienteModuladaReflexiva
AgentCom v0.XLinguísticoSentimento + KVEstado simuladoPrompt modulado
AgentCom v1.X →A definir à medida que a arquitetura escala cada eixo

Isso posiciona o AgentCom como estágio, não destino. Cada versão subsequente escala progressivamente um eixo da hierarquia. O roadmap teórico não é, portanto, inventado arbitrariamente — segue a estrutura da própria evolução biológica, oferecendo um caminho principiado para arquiteturas futuras sem exigir fundamentos teóricos inéditos.

§7Robustez Multilíngue como Evidência Arquitetural

Uma observação empírica sustenta o argumento arquitetural: o mecanismo de sinapse digital do AgentCom opera de forma equivalente em múltiplos idiomas (português, inglês, espanhol testados), sem fine-tuning específico por idioma.

Isso não é descrição de feature — é evidência da tese. Diferentemente de chatbots tradicionais que exigem fine-tuning por idioma, o AgentCom mantém modulação bioquímica idêntica entre idiomas porque a contribuição opera na camada do estado afetivo, que é pré-linguístico. Emoções existem antes das palavras; ferramentas de análise de sentimento treinadas em múltiplos idiomas capturam sinais comparáveis; o KV persistente armazena estados afetivos como vetores numéricos, não como tokens atrelados a língua.

Se a contribuição do AgentCom fosse meramente um template de prompt sofisticado, ela se degradaria entre idiomas. O fato de não se degradar sugere que o mecanismo opera numa camada arquitetural mais profunda — exatamente onde a tese afirma que opera.

§8Hipóteses Pré-registradas e Metodologia

Em alinhamento com práticas de ciência aberta, as seguintes hipóteses são pré-registradas antes do início da validação empírica:

H1 — Efeito da Modulação Bioquímica

Conversas com o AgentCom (tratamento, com sinapse digital ativa) produzirão taxas mais altas de progressão positiva do sentimento do usuário do que conversas com um agente baseline equivalente (controle, sem sinapse digital), medidas em document-level sobre a conversa completa.

H2 — Consistência do Perfil Relacional

Usuários recorrentes (≥3 conversas) exibirão consistência mensurável em seu perfil cognitivo-afetivo entre sessões, capturado pela análise document-level. O desvio-padrão dos vetores de perfil entre sessões do mesmo usuário será significativamente menor que o desvio-padrão entre usuários distintos.

H3 — Aderência à Doutrina

O AgentCom manterá aderência à doutrina de gatilhos proibidos (zero uso de urgência, medo, escassez fabricada) acima de 99% em todas as conversas de produção, auditadas pela cadeia socrática (Seção 5.3) e validadas por revisão humana cega em amostra periódica.

H4 — Portabilidade Cross-vertical

Os módulos extraídos de fontes da teoria da comunicação, validados inicialmente em um vertical, transferirão para pelo menos dois verticais distintos com adaptação limitada a parâmetros de configuração (não reescrita de código).

Metodologia

  • Instância pública de demonstração em agentcom.agtl.app, com consentimento explícito de pesquisa sob LGPD art. 7º IV (pesquisa acadêmica).
  • Controle vs tratamento: usuários podem escolher modo declarado, ou o sistema atribui aleatoriamente (cego) para comparação cruzada.
  • Tamanho amostral: mínimo N=200 conversas por hipótese para significância estatística (α=0,05, power=0,80).
  • Período de coleta: 3–6 meses a partir da ativação do agente (v0.1.0 em diante).
  • Anonimização: todos os logs armazenados com identificadores hashados (SHA-256 + salt).
  • Peer review aberto: comentário crítico convidado via email do projeto antes da submissão formal a periódicos.

§9Limitações Conhecidas

Este trabalho é apresentado com declaração transparente de suas limitações:

  1. Paralelo funcional, não estrutural. O AgentCom simula os efeitos da modulação bioquímica, não seus mecanismos subjacentes (metabolismo, percepção temporal, saliência). O paralelo bioquímico aqui é metáfora arquitetural, não modelo computacional fiel.
  2. Vulnerabilidade adversarial. Como qualquer sistema baseado em sinais semânticos detectáveis, o AgentCom é suscetível a entradas adversariais construídas para disparar estados afetivos específicos. Isso é análogo aos ataques tipográficos identificados por Voss et al. (2021) em modelos multimodais. A mitigação exige auditoria defensiva (Seção 5.3), mas não elimina a vulnerabilidade.
  3. Precisão da análise de sentimento. Embora a análise de sentimento moderna via LLM com contexto conversacional funcione bem em ironia, sarcasmo e variação cultural, ela permanece imperfeita. O loop de autocorreção (inversão da resposta quando o sensor detecta desvio) absorve a maioria dos erros, mas não os elimina.
  4. Código de implementação fechado. Para preservar a viabilidade econômica da pesquisa em andamento, o código de implementação permanece fechado. A reprodutibilidade conceitual está integralmente garantida; a reimplementação exige trabalho de engenharia independente — como é comum em pesquisa aplicada.
  5. Hipóteses ainda não validadas empiricamente. Este artigo apresenta a proposta arquitetural e o protocolo pré-registrado. A validação empírica exige acúmulo de dados da instância pública de demonstração (Seção 8) e está prevista para um artigo subsequente (v03).

§10Conclusão

A analogia entre Redes Neurais Artificiais e Redes Neurais Naturais foi, desde sua origem, uma das ideias mais férteis das ciências da computação. No entanto, a evolução das RNAs priorizou a replicação da estrutura das conexões, deixando em segundo plano a dimensão bioquímica que governa o estado em que essas conexões operam.

Este trabalho identifica que o hiato é duplo: as RNAs carecem tanto da (a) modulação bioquímica de estado encontrada em neurotransmissores e neuropeptídeos, quanto da (b) memória procedural consolidada por plasticidade hebbiana. O AgentCom propõe um equivalente funcional para ambas, instanciado por uma arquitetura de sinapse digital validada por análise de sentimento multi-resolução e auditada via cadeias socráticas. A arquitetura não é feature de produto, mas estágio proposto numa hierarquia mais ampla de escalabilidade.

As hipóteses pré-registradas aguardam validação empírica por meio de uma instância pública de demonstração, em alinhamento com os princípios da ciência aberta. Versões subsequentes deste trabalho reportarão a validação, refutação ou refinamento dos mecanismos propostos.

A biologia resolveu esse problema há centenas de milhões de anos. A engenharia de agentes inteligentes está, enfim, fazendo as perguntas certas.

Publicação original

Post no LinkedIn · 25/05/2026
[POST LINKEDIN — A INSERIR]

Artigos da linha de pesquisa


Histórico do agente — Changelog científico

A cada ajuste técnico relevante do agente, publica-se aqui versão semver com descrição técnico-científica do que mudou, por quê, e como observar. Conceito aberto, código fechado.


Discussion and Review

Revisões críticas e comentários públicos são bem-vindos. Esta linha de pesquisa é mantida aberta a peer review informal antes de submissão formal a periódicos acadêmicos.

Author Contributions

M. Alves concebeu a tese, escreveu o paper, desenhou a arquitetura do AgentCom e está construindo a implementação. A validação conceitual da tese foi conduzida iterativamente por meio de diálogo socrático com Claude (Anthropic, instância web), GPT (OpenAI), Gemini (Google) e Claude Code (Anthropic), tratados como interlocutores críticos com vieses distintos. As revisões incorporadas nesta v02 emergiram especificamente da crítica neutra fornecida pelo Gemini sobre o material-fonte original, levando a reforço bibliográfico (Pert et al. 1985, Ader & Cohen 1975, Blalock 1989, Damásio 1994, Barrett 2017), remoção de formulações populares imprecisas e articulação explícita da cadeia causal da cognição à decisão. Inspiração teórica direta no trabalho de Anete Guimarães sobre neuroplasticidade (curso pessoal, 2022) e na contribuição seminal de Candace Pert em Molecules of Emotion (1997) e em seu paper fundador de 1985 sobre receptores de neuropeptídeos. Sem conflitos de interesse declarados.

References

Cite this work

@article{alves2026agentcom_v02,
  author  = {Alves, Marcos},
  title   = {Redes Neurais Artificiais e Redes Neurais Naturais: Um Paralelo --
             A Bioquímica das Sinapses entre Neurônios e suas Implicações
             para Arquiteturas de Agentes Inteligentes},
  year    = {2026},
  month   = {Maio},
  url     = {https://agentcom.agtl.app/pt},
  note    = {Versão v02 (revisada a partir de v01a, 2026-05-17)},
}