Três motivos pelos quais seu agente de IA não funciona

Empresas de grande porte têm enfrentado dificuldades para escalar agentes de Inteligência Artificial, mesmo após investir em modelos avançados e integrações sofisticadas. Para André Fossa, cofundador da Cogni2, empresa brasileira especializada em motores cognitivos para atendimento automatizado em larga escala, o problema não está na tecnologia em si, mas em falhas estratégicas de arquitetura, gestão de memória e controle de custos. Com mais de 15 anos de experiência em transformação de atendimento nos setores de telecomunicações, bancos e utilities, o executivo afirma que muitos projetos fracassam porque tentam adaptar estruturas antigas a uma lógica que exige redesenho completo do stack.

A Cogni2 processa milhões de mensagens por mês e registra casos com até 95% de automação e mais de 90% de satisfação, segundo dados internos. Ainda assim, o cenário geral do mercado mostra que escalar IA não é trivial. De acordo com a Gartner, pelo menos 30% dos projetos de IA generativa devem ser abandonados após a fase de prova de conceito até o fim de 2025, principalmente por problemas ligados à qualidade de dados, governança, controle de custos e dificuldade em comprovar valor de negócio.
Diante desse contexto, Fossa elenca três razões centrais que explicam por que agentes de IA não funcionam como esperado.

Arquitetura em árvore disfarçada de IA – Grande parte das empresas mantém estruturas baseadas em fluxos lineares e árvores de decisão, herdadas dos chatbots tradicionais. Embora ferramentas no-code estruturadas em nodes sejam intuitivas para desenvolvimento, elas limitam o potencial dos Large Language Models e comprometem a experiência do usuário.
Segundo Fossa, substituir o motor não significa mudar o modelo mental. “Em vez de perguntar qual é o próximo nó do fluxo, o sistema precisa perguntar qual é o próximo melhor passo para resolver a necessidade do cliente”, afirma. Na prática, isso implica iniciar a conversa com grande parte do contexto já disponível, como dados cadastrais, histórico de pagamentos e interações anteriores, permitindo que o agente atue orientado à resolução, e não à navegação rígida.
Obsessão por RAG e descuido com memória de curto prazo – Outro erro recorrente é tratar RAG como solução completa. A técnica é relevante para recuperar informações de bases documentais, mas atua de forma reativa, respondendo ao que foi perguntado.
Conforme o executivo, jornadas transacionais exigem gestão estratégica da memória de curto prazo. Informações estruturais críticas, como plano contratado, status financeiro e histórico recente, precisam estar presentes antes mesmo de determinadas perguntas surgirem. O RAG, nesse cenário, deve complementar a operação, cobrindo dúvidas menos frequentes e enriquecendo respostas.
Segundo Fossa, qualidade em escala depende da combinação entre memória estruturada e busca contextual bem calibrada. “Sem orquestração semântica, a tendência é aumentar alucinação ou empobrecer respostas”, explica.
Falta de estratégia para otimização de custo – O terceiro fator envolve ausência de engenharia voltada à eficiência financeira. À medida que mais contexto é incorporado às interações, cresce a preocupação com o impacto da inferência de modelos.
O custo de processamento de modelos vem caindo de forma consistente nos últimos anos. Ainda assim, o volume de dados consumidos cresce na mesma proporção, pressionando estruturas mal desenhadas. Para manter viabilidade econômica, a Cogni2 utiliza orquestração dinâmica, alternando modelos mais robustos quando a complexidade cognitiva exige e versões mais leves em tarefas simples, além de combinar etapas determinísticas com acionamento inteligente de LLM apenas quando necessário.
Segundo o executivo, eficiência não está em criar um modelo proprietário a qualquer custo, mas em extrair o máximo desempenho dos recursos disponíveis com arquitetura adequada. “Projetos que ignoram essa engenharia acabam enfrentando um dilema: ou o custo explode, ou a qualidade cai”, afirma.
O mercado global de IA generativa deve ultrapassar US$ 60 bilhões até 2028, segundo estimativas da MarketsandMarkets, o que amplia a pressão para que empresas deixem a fase experimental e capturem valor concreto. Para o cofundador da Cogni2, a tecnologia já provou sua capacidade técnica. O desafio agora é estrutural. “A diferença entre frustração e eficiência real não está no modelo escolhido, mas na capacidade de construir o sistema certo ao redor dele”, conclui.

Agentes de IA: como se beneficiar desses “trabalhadores virtuais autônomos”

Related Post

Investimento em tecnologia impulsiona agenda ESG na indústria

Por que os SSDs têm sofrido aumentos sucessivos no Brasil?

Skeelo se consolida entre os aplicativos mais baixados dentro da categoria Livros

Como a venda de smartphones usados pode gerar lucro?

Leave a Reply