A demo que viraliza é a IA que ninguém vai usar
Toda semana sai um vídeo de IA fazendo algo impressionante: gerou aquele código, montou aquela apresentação, respondeu àquela pergunta. O vídeo viraliza, a thread bomba, e no Slack do time alguém posta "viu isso?".
Três meses depois, ninguém usa.
Isso não é acidente. É como demo e produto se separam por design — e por que entender essa separação é o que diferencia quem vai operar Gen AI de quem vai ficar admirando o roadmap dos outros.
Demos otimizam pra impressão. Produto otimiza pra fluxo.
Uma demo precisa caber em 90 segundos. Precisa ter um momento "uau". Precisa ser memorável o suficiente pra sobreviver ao algoritmo. Tudo isso empurra a demo pra:
- Casos limítrofes ("olha o que ela consegue fazer!") em vez do caso médio.
- Saída espetacular (vídeo, áudio, deck completo) em vez de saída boring (linha de tabela, e-mail enviado, status atualizado).
- Pergunta única e bem formada em vez do contexto bagunçado em que o trabalho real acontece.
Produto é o inverso. Um produto precisa entregar valor sem precisar ser percebido. A melhor IA aplicada que entreguei em produção foi um pipeline que classifica e roteia chamados de atendimento — ninguém no time sabe que ela existe. Eles só sabem que o tempo médio de resposta caiu pela metade.
Onde gastei tempo errado
Quando comecei a operar Gen AI seriamente (lá em 2023), tentei replicar as demos. Pegava o caso que viralizou no Twitter e tentava encaixar no produto que eu tava construindo. Sempre dava ruim.
O que funcionou foi o oposto: pegar um fluxo do dia a dia, observar onde a fricção mora, e ver se LLM resolvia aquela fricção específica. As três decisões que mais economizaram tempo (e dinheiro):
Trocar geração por roteamento. Em vez de "agente que responde o cliente", "agente que decide qual fila atende". Muito mais barato, muito mais previsível, e o impacto no SLA é igual ou maior.
Eval primeiro, modelo depois. Antes de escolher Claude, GPT, Llama ou o modelo do mês, escrevi 30 casos de teste do que esperaria do output. Modelo passou no eval, vira candidato. Não passou, próximo.
Observability como obrigação. Cada chamada com input/output/custo/latência logada num lugar acessível. Sem isso, eu não conseguia explicar pro CFO por que o gasto subiu — e quando você não consegue explicar, você não consegue defender o orçamento.
A pergunta que separa demo de produto
Quando alguém te mostra uma IA "incrível", pergunte:
Onde isso roda? Quem usa? Com que frequência?
Se a resposta for "ainda tô preparando pra mostrar", é demo. Se for "tá rodando no fluxo X desde Y, processa Z por dia", é produto.
A IA boa some na operação. Vira fluxo, não notícia. E quando você opera dentro disso, percebe que a régua nunca foi "ela impressiona?" — sempre foi "ela ficou ligada?".
Isso muda muita coisa na hora de decidir o que construir, com quem trabalhar, e o que rejeitar como ruído.