Em que canal o agente vai rodar?

WhatsApp (via Cloud API), Slack, Teams, Telegram, web embed, voice (Twilio), ou interno (API → seu app). Defino no discovery em função do usuário final. WhatsApp é o mais comum no Brasil.

Você hospeda o agente ou fica na minha infra?

Sua escolha. Faço deploy em AWS/GCP/Azure da sua conta ou em VPS gerenciado por mim (Hetzner, Railway, Fly.io) cobrando hosting separado a custo. Em empresa regulada normalmente faz mais sentido manter dentro da sua infra.

Vai funcionar com nossa base de conhecimento atual?

Provavelmente. Trabalho com PDFs, Notion, Confluence, banco SQL, Sharepoint, sites internos, APIs. Discovery valida quais fontes alimentam o agente e em que cadência sincronizam. Se a base for caótica, parte do projeto é normalizar.

Qual modelo você usa?

Avaliação caso a caso entre Claude (Anthropic), GPT (OpenAI), Gemini (Google) e open source (Llama, Mistral, Qwen) — em função de custo, latência, qualidade no eval e restrição regulatória. Em ~70% dos casos vai Claude por qualidade em tool use, mas não é dogma.

E depois dos 30 dias de estabilização? Sumiu?

Você fica com tudo: repo, doc, runbook, eval set, observability. Time interno deve ser capaz de iterar sozinho. Se quiser suporte continuado, ofereço retainer mensal opcional — mas não é default e não é necessário se o handoff foi bem feito.

Quanto tempo até ver o agente funcionando?

Versão de testes em staging na semana 3–4. Produção entre semanas 5 e 8 dependendo da complexidade. Discovery completo em 1 semana — você sai dele sabendo prazo e preço final com baixa margem de erro.

Atelier dark verde-floresta; à direita, BotBuzz interage com um terminal holográfico que emite código em verde-lima

AGENTES · UM CASO, UM AGENTE

Um caso, um agente. Em produção.

Agente de IA sob escopo fechado pra um caso específico do seu negócio. Entrega em 5–8 semanas, operando — não em demo.

Enviar briefing Ver escopo

Três princípios.
Do briefing ao deploy.

Princípio P1 01

Escopo fechado .

Cada engajamento começa por um caso definido — um fluxo, um processo, um ponto de dor. Sem briefing genérico. O que não cabe no escopo entra na próxima rodada.

Princípio P2 02

Entrega operável .

O agente vai a produção no fim do projeto — não fica em "demo eterna". Código próprio, deploy na sua infra ou na minha, runbook, eval inicial e plano de monitoramento.

Princípio P3 03

Handoff sem lock-in.

Você fica com o repo, a doc e o conhecimento. Seu time aprende a iterar — não fica refém do consultor. 30 dias de suporte de estabilização incluídos.

Escopo.
Tudo o que sai do contrato.

O contrato é uma página. O que entra, o que sai, prazo, entrega, stack. Sem letra miúda — transparência radical.

Casos típicos

Atendimento WhatsApp com lógica de domínio (case AUMAF 3D). Automação de processo interno. Vertical específico (legal, financeiro, ops). Agente RAG sobre base própria.
O que entrego

Agente operável, código próprio, deploy na sua infra ou na minha (consulte). Documentação, runbooks, evals iniciais, handoff técnico pro seu time.
Escopo padrão

Discovery 1 semana · Construção 3–6 semanas · Handoff 1 semana. Saída: agente em produção no caso definido + 30 dias de estabilização incluídos.
Stack típica

Claude/GPT como motor. RAG via Pinecone, Qdrant ou PgVector. Orquestração com LangGraph, n8n ou código próprio. WhatsApp via Z-API/Twilio. Frontend quando precisa.
Como começar

Envie um briefing pelo formulário: qual processo o agente cobre, volumes esperados, quem é o usuário final, integrações. Respondo em até 48h com proposta inicial.
Diferença pra consultoria

Aqui o escopo é fechado, fixo, um caso. Em /consultoria, o escopo é amplo — roadmap, várias frentes, transformação. Mesma cabeça, contratos diferentes.

O projeto em quatro números.

5–8

semanas até produção

do briefing ao agente operando
1

caso por projeto

escopo fechado, sem creeping
30

dias de estabilização

pós-deploy, incluídos
0

POC eterno

agente roda ou o projeto não fecha

Quatro fases.

01

Discovery
1 semana

Mergulho no processo atual, entrevistas com usuário final, mapeamento de integrações e dados. Saída: escopo técnico + métricas de sucesso.
02

Construção
3–6 semanas

Sprints curtos com entrega incremental. Você testa em ambiente staging desde a semana 2. Ajuste contínuo do prompt, da arquitetura e dos guardrails.
03

Deploy
1 semana

Subida em produção com monitoramento, evals automatizados e runbook completo. Handoff técnico pro time interno + documentação de produção.
04

Estabilização
30 dias

Acompanhamento incluído: ajustes finos, casos edge, suporte ao time. Saída definitiva quando o time interno está autônomo pra iterar.

O que não entrego.

"Agente" virou termo guarda-chuva. Aqui ele tem definição estreita. O que está fora não cabe nesse contrato — pode caber em consultoria.

Não entrego chatbot de FAQ.

→ já existe FAQ.
Não entrego POC eterno.

→ agente vai a produção.
Não entrego agente sem evals.

→ sem medida é fé.
Não entrego manutenção contínua do produto.

→ entrega e seu time roda.

O que sai daqui.

Lista pública dos artefatos típicos. Cada engajamento ajusta — mas a tabela abaixo é ponto de partida.

Agente operável em produção
Não POC, não demo, não vídeo de LinkedIn. Agente respondendo ao usuário final no canal de produção, com latência aceitável e custo previsível.
Código próprio + repo no seu GitHub
Você fica com o repositório. Stack moderna (TypeScript ou Python), bem-testada, documentada. Sem vendor lock-in de plataforma proprietária.
Eval set versionado
Cada caso de uso entra com eval set declarado em código. CI roda eval em cada PR. Regressão quebra build. Sem eval, sem deploy.
Observability instrumentada
Tracing de chamadas de ferramenta, logs estruturados, dashboard de custo + latência. Você vê o que está acontecendo, em tempo real.
Runbook + handoff técnico
Runbook de produção pro seu time: como deployar, como rollback, como debuggar, métricas-chave, plano de incident response.
30 dias de estabilização
Incluso no escopo: ajustes finos pós-deploy, casos edge encontrados em produção, suporte ao time interno até autonomia.

Investimento.

Cada caso é caso. Sem tabela de site institucional — fechamos no WhatsApp, com escopo claro e condições alinhadas.

Faixa · Agente simples
Agente simples
- Caso bem definido (atendimento, qualificação).
- RAG sobre 1 base + 2-3 tools.
- 5–6 semanas até produção.
- 30 dias de estabilização.
Falar no WhatsApp
Faixa · Agente médio preferida
Agente médio
- Múltiplas tools, integração externa.
- Eval set + observability.
- 6–8 semanas até produção.
- 30 dias de estabilização.
Falar no WhatsApp
Faixa · Agente complexo
Agente complexo
- Multi-agente, processo crítico.
- Compliance / regulatório.
- Integração com legados sensíveis.
- SLA negociado.
Falar no WhatsApp

Antes de marcar.

Em que canal o agente vai rodar?: WhatsApp (via Cloud API), Slack, Teams, Telegram, web embed, voice (Twilio), ou interno (API → seu app). Defino no discovery em função do usuário final. WhatsApp é o mais comum no Brasil.
Você hospeda o agente ou fica na minha infra?: Sua escolha. Faço deploy em AWS/GCP/Azure da sua conta ou em VPS gerenciado por mim (Hetzner, Railway, Fly.io) cobrando hosting separado a custo. Em empresa regulada normalmente faz mais sentido manter dentro da sua infra.
Vai funcionar com nossa base de conhecimento atual?: Provavelmente. Trabalho com PDFs, Notion, Confluence, banco SQL, Sharepoint, sites internos, APIs. Discovery valida quais fontes alimentam o agente e em que cadência sincronizam. Se a base for caótica, parte do projeto é normalizar.
Qual modelo você usa?: Avaliação caso a caso entre Claude (Anthropic), GPT (OpenAI), Gemini (Google) e open source (Llama, Mistral, Qwen) — em função de custo, latência, qualidade no eval e restrição regulatória. Em ~70% dos casos vai Claude por qualidade em tool use, mas não é dogma.
E depois dos 30 dias de estabilização? Sumiu?: Você fica com tudo: repo, doc, runbook, eval set, observability. Time interno deve ser capaz de iterar sozinho. Se quiser suporte continuado, ofereço retainer mensal opcional — mas não é default e não é necessário se o handoff foi bem feito.
Quanto tempo até ver o agente funcionando?: Versão de testes em staging na semana 3–4. Produção entre semanas 5 e 8 dependendo da complexidade. Discovery completo em 1 semana — você sai dele sabendo prazo e preço final com baixa margem de erro.

Tem um caso
pra um agente?

Mande o briefing: processo, volumes, usuário final, integrações. Respondo em até 48h com proposta inicial — ou indicação se não for caso pra cá.

Enviar briefing

Um caso, um agente. Em produção.

Três princípios. Do briefing ao deploy.

Escopo fechado .

Entrega operável .

Handoff sem lock-in.

Escopo. Tudo o que sai do contrato.

Casos típicos

O que entrego

Escopo padrão

Stack típica

Como começar

Diferença pra consultoria

O projeto em quatro números.

Quatro fases.

Discovery

Construção

Deploy

Estabilização

O que não entrego.

O que sai daqui.

Agente operável em produção

Código próprio + repo no seu GitHub

Eval set versionado

Observability instrumentada

Runbook + handoff técnico

30 dias de estabilização

Investimento.

Antes de marcar.

Tem um caso pra um agente?

Três princípios.
Do briefing ao deploy.

Escopo.
Tudo o que sai do contrato.

Tem um caso
pra um agente?