Esta documentação tem como objetivo apresentar os conceitos fundamentais utilizados na avaliação e recomendação de modelos de linguagem (LLMs) para diferentes tipos de agentes e cenários de uso. 

Logo abaixo temos a tabela comparativa de LLMs, que consolida as principais características e critérios de análise dos modelos. Logo após a tabela, são apresentadas explicações conceituais que apoiam a correta interpretação de critérios como: 

  • Complexidade 
  • Volume Esperado 
  • Risco de Erro 
  • Características gerais dos modelos de linguagem 

O propósito é garantir uma leitura mais consciente e alinhada da tabela, reduzindo interpretações equivocadas e apoiando decisões técnicas, de produto e de negócio. 

IMPORTANTE: As diretrizes apresentadas neste material não representam regras fixas ou imutáveis. Elas devem ser utilizadas como referência, podendo ser ajustadas conforme o contexto, o nível de maturidade do projeto, testes práticos e a evolução dos próprios modelos de linguagem.


Tabela Comparativa - LLMs
Tipo de AgenteDescrição do CenárioComplexidadeVolume EsperadoRisco de ErroLLM RecomendadoJustificativaExemplos por Nicho (Saúde, ISP, Varejo, Educação, Financeiro)
Agente de suporte técnico avançadoDiagnóstico e análise técnicaAltaBaixoAltoGPT-4.1 FullErro custa caroISP: falha de link 
Saúde: erro em sistema clínico
Agente jurídico ou contratualContratos e pareceresAltaBaixoAltoGPT-4.1 FullPrecisão e contextoFinanceiro: contratos 
Educação: termos acadêmicos
Copilot internoApoio a equipes internasAltaBaixoAltoGPT-4.1 FullConversas longasSaúde: apoio a recepção 
ISP: suporte N2 
Financeiro: backoffice
Agente com conversa longa e não linearUsuário muda muito de assuntoAltaMédioAltoGPT-4.1 FullMantém coerênciaSaúde: paciente confuso Financeiro: dúvidas complexas
Agente de pré-triagem clínicaEntende sintomas e direciona corretamenteAltaBaixoAltoGPT-4.1 FullRaciocínio encadeado e contextoSaúde: triagem de pacientes antes do atendimento
Agente de interpretação de examesExplica laudos em linguagem simplesAltaBaixoAltoGPT-4.1 FullAlta precisão e cuidado com contextoSaúde: explicação de exames laboratoriais
Agente de diagnóstico técnico avançadoAnalisa histórico, logs e cenáriosAltaBaixoAltoGPT-4.1 FullErro técnico gera alto impactoISP: falhas complexas de link
Agente de retenção avançadaConversa longa para evitar churnAltaBaixoAltoGPT-4.1 FullConversas não lineares e sensíveisISP: retenção de clientes insatisfeitos
Agente de exceções logísticasCasos fora do fluxo padrãoAltaBaixoAltoGPT-4.1 FullExige julgamento contextualVarejo: pedidos extraviados ou atrasos graves
Copilot comercialApoio à argumentação de vendasAltaBaixoMédio/AltoGPT-4.1 FullPersonalização profundaVarejo: apoio a vendedores
Agente acadêmico avançadoRegras complexas e exceçõesAltaBaixoAltoGPT-4.1 FullMuitas variáveis e normasEducação: trancamento, bolsas, aproveitamento
Copilot para coordenaçãoApoia decisões administrativasAltaBaixoAltoGPT-4.1 FullContexto longo e precisãoEducação: coordenação acadêmica
Agente de renegociação complexaAvalia propostas e contrapropostasAltaBaixoAltoGPT-4.1 FullRisco financeiro elevadoFinanceiro: renegociação de dívidas
Agente jurídico-financeiroAnálise de contratos e cláusulasAltaBaixoAltoGPT-4.1 FullTexto crítico e sensívelFinanceiro: contratos e termos
Agente de rastreio de pedidoConsulta status de pedido via VTEX / Tray/E-commerceBaixaMédioBaixoGPT-4.1 Mini/ 5 MiniIntegração simples e objetivaVarejo: “Meu pedido chega hoje?” 
Educação: status de material didático 
Financeiro: status de cartão ou boleto
Agente de FAQ simplesHorários, políticas, perguntas frequentesBaixaAltoBaixoGPT-4.1 Mini/ 5 MiniBaixa latência e custo idealSaúde: horários de clínica
ISP: segunda via de fatura 

Educação: calendário escolar
Agente de FAQ com PDF estruturadoBase de conhecimento organizada (RAG simples)BaixaMédio/AltoBaixoGPT-4.1 Mini/ 5 MiniRespostas padronizadasSaúde: convênios aceitos (PDF) 
Financeiro: regras de produto 

Educação: regimento escolar
Agente de apresentação de preçosResponde valores e condiçõesBaixaMédioMédioGPT-4.1 Mini/ 5 MiniClareza e consistênciaSaúde: valores de exames 
ISP: planos de internet Educação: mensalidades
Agente de confirmação de consultaConfirma data, hora e localBaixaMuito altoBaixoGemini 2.5 FlashResposta instantâneaSaúde: confirmação automática
Agente de lembretes automáticosEnvia lembretes recorrentesBaixaMuito altoBaixoGemini 2.5 FlashEscala e baixo custoSaúde: exames e retornos
Agente de instabilidade regionalInforma status da redeBaixaMuito altoBaixoGemini 2.5 FlashLatência mínimaISP: internet fora da região
Agente de abertura simples de chamadoColeta dados e cria ticketBaixaAltoBaixoGemini 2.5 FlashFluxo rápido e diretoISP: abertura de suporte
Agente de status rápido de pedidoInforma entrega e trocaBaixaMuito altoBaixoGemini 2.5 FlashConsulta simplesVarejo: status do pedido
Agente de matrículaInformações básicas de inscriçãoBaixaAltoBaixoGemini 2.5 FlashSimplicidadeEducação: matrícula
Agente de comunicadosAvisos rápidos e recorrentesBaixaMuito altoBaixoGemini 2.5 FlashResposta diretaEducação: comunicados
Agente de saldo e vencimentoConsulta objetivaBaixaMuito altoBaixoGemini 2.5 FlashCusto críticoFinanceiro: saldo, vencimento
Agente de FAQ com múltiplos PDFsPDFs grandes e variadosMédiaMédioMédioGPT-4.1 Mini/ 5 MiniMelhor compreensão contextualSaúde: protocolos médicos 
Financeiro: políticas internas 

Educação: normas acadêmicas
Agente de vendas inboundQualificação de leads e oferta inicialMédiaMédioMédioGPT-4.1 Mini/ 5 MiniBom equilíbrio custo × persuasãoISP: oferta de planos 
Varejo: recomendação 

de produtos 
Financeiro: abertura de conta
Agente de direcionamento para humanoEntende contexto e transfere corretamenteMédiaMédioMédioGPT-4.1 Mini/ 5 MiniBoa leitura de intençãoSaúde: triagem para atendente 
Financeiro: falar com gerente
Agente de consulta de estoqueIntegração com ERP/CRMMédiaMédioMédioGPT-4.1 Mini/ 5 MiniÓtimo para APIsVarejo: produto disponível? 
Educação: vagas em cursos
Agente omnichannel padrãoAtendimento geralMédiaMédioMédioGPT-4.1 Mini/ 5 MiniModelo default (80–90%)ISP: suporte geral Educação: secretaria virtual 
Financeiro: atendimento inicial



1. Conceitos Utilizados na Avaliação dos Cenários 

1.1. Complexidade 

complexidade representa o nível de esforço cognitivo exigido do modelo para executar corretamente um determinado cenário. 

Esse critério não está relacionado ao tamanho da resposta, mas principalmente à capacidade do modelo de: 

  • Interpretar contexto 
  • Aplicar regras de negócio 
  • Manter coerência ao longo da conversa 
  • Tomar decisões adequadas 

 

Classificação geral: 

  • Baixa 
  • Respostas diretas e objetivas 
  • Pouca ou nenhuma variação de contexto 
  • Regras simples ou informação estática 
    Ex.: status de pedido, horários de funcionamento, FAQs simples 

 

  • Média 
  • Necessidade de interpretar intenção do usuário 
  • Combinação de informações ou regras de negócio 
  • Contexto moderado ao longo da conversa 
    Ex.: vendas inbound, direcionamento para atendimento humano, suporte técnico básico 

 

  • Alta 
  • Raciocínio encadeado 
  • Análise de múltiplas variáveis 
  • Decisões com impacto direto no negócio ou no usuário 
    Ex.: jurídico, renegociação, diagnóstico técnico avançado 

 

1.2. Volume Esperado 

volume esperado indica a escala de uso prevista para determinado agente ou cenário. 

Esse critério é essencial para equilibrar custo operacional, performance, latência e estabilidade da solução. 

Classificação geral: 

  • Baixo 
  • Uso pontual ou interno 
  • Poucas interações simultâneas 
    Ex.: copilots internos, apoio administrativo, análises especializadas 

 

  • Médio 
  • Uso recorrente em produção 
  • Volume previsível de atendimentos 
    Ex.: suporte padrão, vendas inbound, atendimento omnichannel básico 

 

  • Alto 
  • Grande número de interações diárias 
  • Possíveis picos simultâneos 
    Ex.: status de pedido, FAQs, lembretes e notificações automáticos 

 

1.3. Risco de Erro  

risco de erro representa o impacto potencial caso o agente forneça uma resposta incorreta naquele cenário. 

Este conceito não mede a probabilidade do modelo errar, mas sim as consequências do erro para o negócio ou para o usuário final. 

Classificação geral: 

  • Baixo 
  • Erro não gera impacto relevante 
  • Pode ser facilmente corrigido ou ignorado 
    Ex.: informações gerais, comunicados simples, FAQS não críticas 

 

  • Médio 
  • Erro pode causar ruído operacional ou insatisfação 
  • Pode exigir retrabalho humano 
    Ex.: suporte técnico, vendas em fase de qualificação, direcionamentos incorretos 

 

  • Alto 
  • Erro pode gerar impacto financeiro, legal ou reputacional 
  • Exige maior controle e confiabilidade 
    Ex.: jurídico, financeiro, saúde, diagnósticos avançados 

 

2. Características Gerais das LLMs 

Cada modelo de linguagem possui características próprias, e nenhum deles é ideal para todos os cenários. 

A escolha adequada depende do equilíbrio entre capacidade de raciocínio, custo operacional e risco aceitável. 

De forma geral, os modelos podem ser classificados em: 

LLMs focados em eficiência 

  • Menor custo operacional 
  • Boa performance para tarefas simples e repetitivas 
  • Indicados para cenários de: 
  • Alto volume esperado 
  • Baixa complexidade 
  • Baixo risco de erro 

LLMs intermediários 

  • Bom equilíbrio entre custo e capacidade 
  • Suportam múltiplos contextos e regras de negócio 
  • Indicados para a maioria dos cenários operacionais 

LLMs avançados 

  • Alta capacidade de raciocínio e compreensão contextual 
  • Maior custo operacional 
  • Indicados para: 
  • Alta complexidade 
  • Alto risco de erro 
  • Cenários críticos para o negócio 

 

Essas características ajudam a entender por que determinados modelos são recomendados em certos cenários e evitados em outros. 

4. Relação com a Tabela Comparativa 

A tabela comparativa consolida esses conceitos de forma objetiva, permitindo: 

  • Visualizar rapidamente cada cenário 
  • Avaliar complexidadevolume esperado e risco de erro 
  • Identificar o LLM mais indicado para cada caso 
  • Comparar cenários semelhantes entre diferentes nichos 


5. Considerações Finais 

Este guia e a tabela comparativa devem ser utilizados como ferramentas de orientação, e não como regras rígidas. 

A escolha de um LLM deve sempre considerar: 

  • O contexto específico do cliente 
  • Testes práticos em ambiente controlado 
  • A evolução dos modelos e seus custos 
  • O nível de risco aceitável para o cenário 

 

Em resumo, as recomendações aqui apresentadas servem para apoiar decisões mais seguras e informadas, mantendo a flexibilidade necessária para adaptação e evolução contínua da plataforma.