Pular para o conteúdo
§ Notas Nota
Nota

Por que a IA boa some na operação

A IA que funciona não vira manchete — vira fluxo. A diferença entre demo brilhante e produto silencioso.

  • Autor: Kayo Ridolfi
  • Tempo de leitura: 5 min
Imagem de capa: Por que a IA boa some na operação
kayoridolfi.ai · 20 mai 2026

A demo que viraliza é a IA que ninguém vai usar

Toda semana sai um vídeo de IA fazendo algo impressionante: gerou aquele código, montou aquela apresentação, respondeu àquela pergunta. O vídeo viraliza, a thread bomba, e no Slack do time alguém posta "viu isso?".

Três meses depois, ninguém usa.

Isso não é acidente. É como demo e produto se separam por design — e por que entender essa separação é o que diferencia quem vai operar Gen AI de quem vai ficar admirando o roadmap dos outros.

Demos otimizam pra impressão. Produto otimiza pra fluxo.

Uma demo precisa caber em 90 segundos. Precisa ter um momento "uau". Precisa ser memorável o suficiente pra sobreviver ao algoritmo. Tudo isso empurra a demo pra:

  • Casos limítrofes ("olha o que ela consegue fazer!") em vez do caso médio.
  • Saída espetacular (vídeo, áudio, deck completo) em vez de saída boring (linha de tabela, e-mail enviado, status atualizado).
  • Pergunta única e bem formada em vez do contexto bagunçado em que o trabalho real acontece.

Produto é o inverso. Um produto precisa entregar valor sem precisar ser percebido. A melhor IA aplicada que entreguei em produção foi um pipeline que classifica e roteia chamados de atendimento — ninguém no time sabe que ela existe. Eles só sabem que o tempo médio de resposta caiu pela metade.

Onde gastei tempo errado

Quando comecei a operar Gen AI seriamente (lá em 2023), tentei replicar as demos. Pegava o caso que viralizou no Twitter e tentava encaixar no produto que eu tava construindo. Sempre dava ruim.

O que funcionou foi o oposto: pegar um fluxo do dia a dia, observar onde a fricção mora, e ver se LLM resolvia aquela fricção específica. As três decisões que mais economizaram tempo (e dinheiro):

  1. Trocar geração por roteamento. Em vez de "agente que responde o cliente", "agente que decide qual fila atende". Muito mais barato, muito mais previsível, e o impacto no SLA é igual ou maior.

  2. Eval primeiro, modelo depois. Antes de escolher Claude, GPT, Llama ou o modelo do mês, escrevi 30 casos de teste do que esperaria do output. Modelo passou no eval, vira candidato. Não passou, próximo.

  3. Observability como obrigação. Cada chamada com input/output/custo/latência logada num lugar acessível. Sem isso, eu não conseguia explicar pro CFO por que o gasto subiu — e quando você não consegue explicar, você não consegue defender o orçamento.

A pergunta que separa demo de produto

Quando alguém te mostra uma IA "incrível", pergunte:

Onde isso roda? Quem usa? Com que frequência?

Se a resposta for "ainda tô preparando pra mostrar", é demo. Se for "tá rodando no fluxo X desde Y, processa Z por dia", é produto.

A IA boa some na operação. Vira fluxo, não notícia. E quando você opera dentro disso, percebe que a régua nunca foi "ela impressiona?" — sempre foi "ela ficou ligada?".

Isso muda muita coisa na hora de decidir o que construir, com quem trabalhar, e o que rejeitar como ruído.

§ Categoria Nota

Iniciar projeto

§ próximo · p. ∞

Tem um problema parecido?