Empresas de grande porte têm enfrentado dificuldades para escalar agentes de Inteligência Artificial, mesmo após investir em modelos avançados e integrações sofisticadas. Para André Fossa, cofundador da Cogni2, empresa brasileira especializada em motores cognitivos para atendimento automatizado em larga escala, o problema não está na tecnologia em si, mas em falhas estratégicas de arquitetura, gestão de memória e controle de custos. Com mais de 15 anos de experiência em transformação de atendimento nos setores de telecomunicações, bancos e utilities, o executivo afirma que muitos projetos fracassam porque tentam adaptar estruturas antigas a uma lógica que exige redesenho completo do stack.
A Cogni2 processa milhões de mensagens por mês e registra casos com até 95% de automação e mais de 90% de satisfação, segundo dados internos. Ainda assim, o cenário geral do mercado mostra que escalar IA não é trivial. De acordo com a Gartner, pelo menos 30% dos projetos de IA generativa devem ser abandonados após a fase de prova de conceito até o fim de 2025, principalmente por problemas ligados à qualidade de dados, governança, controle de custos e dificuldade em comprovar valor de negócio.
Diante desse contexto, Fossa elenca três razões centrais que explicam por que agentes de IA não funcionam como esperado.
- Arquitetura em árvore disfarçada de IA – Grande parte das empresas mantém estruturas baseadas em fluxos lineares e árvores de decisão, herdadas dos chatbots tradicionais. Embora ferramentas no-code estruturadas em nodes sejam intuitivas para desenvolvimento, elas limitam o potencial dos Large Language Models e comprometem a experiência do usuário.
- Segundo Fossa, substituir o motor não significa mudar o modelo mental. “Em vez de perguntar qual é o próximo nó do fluxo, o sistema precisa perguntar qual é o próximo melhor passo para resolver a necessidade do cliente”, afirma. Na prática, isso implica iniciar a conversa com grande parte do contexto já disponível, como dados cadastrais, histórico de pagamentos e interações anteriores, permitindo que o agente atue orientado à resolução, e não à navegação rígida.
- Obsessão por RAG e descuido com memória de curto prazo – Outro erro recorrente é tratar RAG como solução completa. A técnica é relevante para recuperar informações de bases documentais, mas atua de forma reativa, respondendo ao que foi perguntado.
Conforme o executivo, jornadas transacionais exigem gestão estratégica da memória de curto prazo. Informações estruturais críticas, como plano contratado, status financeiro e histórico recente, precisam estar presentes antes mesmo de determinadas perguntas surgirem. O RAG, nesse cenário, deve complementar a operação, cobrindo dúvidas menos frequentes e enriquecendo respostas.
Segundo Fossa, qualidade em escala depende da combinação entre memória estruturada e busca contextual bem calibrada. “Sem orquestração semântica, a tendência é aumentar alucinação ou empobrecer respostas”, explica. - Falta de estratégia para otimização de custo – O terceiro fator envolve ausência de engenharia voltada à eficiência financeira. À medida que mais contexto é incorporado às interações, cresce a preocupação com o impacto da inferência de modelos.
O custo de processamento de modelos vem caindo de forma consistente nos últimos anos. Ainda assim, o volume de dados consumidos cresce na mesma proporção, pressionando estruturas mal desenhadas. Para manter viabilidade econômica, a Cogni2 utiliza orquestração dinâmica, alternando modelos mais robustos quando a complexidade cognitiva exige e versões mais leves em tarefas simples, além de combinar etapas determinísticas com acionamento inteligente de LLM apenas quando necessário.
Segundo o executivo, eficiência não está em criar um modelo proprietário a qualquer custo, mas em extrair o máximo desempenho dos recursos disponíveis com arquitetura adequada. “Projetos que ignoram essa engenharia acabam enfrentando um dilema: ou o custo explode, ou a qualidade cai”, afirma.
O mercado global de IA generativa deve ultrapassar US$ 60 bilhões até 2028, segundo estimativas da MarketsandMarkets, o que amplia a pressão para que empresas deixem a fase experimental e capturem valor concreto. Para o cofundador da Cogni2, a tecnologia já provou sua capacidade técnica. O desafio agora é estrutural. “A diferença entre frustração e eficiência real não está no modelo escolhido, mas na capacidade de construir o sistema certo ao redor dele”, conclui.




