Atelier dark verde-floresta; à direita, BotBuzz interage com um terminal holográfico que emite código em verde-lima
AGENTES · UM CASO, UM AGENTE

Um caso, um agente. Em produção.

Agente de IA sob escopo fechado pra um caso específico do seu negócio. Entrega em 5–8 semanas, operando — não em demo.

Três princípios.
Do briefing ao deploy.

Princípio P1 01

Escopo fechado .

Cada engajamento começa por um caso definido — um fluxo, um processo, um ponto de dor. Sem briefing genérico. O que não cabe no escopo entra na próxima rodada.

Princípio P2 02

Entrega operável .

O agente vai a produção no fim do projeto — não fica em "demo eterna". Código próprio, deploy na sua infra ou na minha, runbook, eval inicial e plano de monitoramento.

Princípio P3 03

Handoff sem lock-in.

Você fica com o repo, a doc e o conhecimento. Seu time aprende a iterar — não fica refém do consultor. 30 dias de suporte de estabilização incluídos.

Escopo.
Tudo o que sai do contrato.

O contrato é uma página. O que entra, o que sai, prazo, entrega, stack. Sem letra miúda — transparência radical.

  1. Casos típicos

    Atendimento WhatsApp com lógica de domínio (case AUMAF 3D). Automação de processo interno. Vertical específico (legal, financeiro, ops). Agente RAG sobre base própria.

  2. O que entrego

    Agente operável, código próprio, deploy na sua infra ou na minha (consulte). Documentação, runbooks, evals iniciais, handoff técnico pro seu time.

  3. Escopo padrão

    Discovery 1 semana · Construção 3–6 semanas · Handoff 1 semana. Saída: agente em produção no caso definido + 30 dias de estabilização incluídos.

  4. Stack típica

    Claude/GPT como motor. RAG via Pinecone, Qdrant ou PgVector. Orquestração com LangGraph, n8n ou código próprio. WhatsApp via Z-API/Twilio. Frontend quando precisa.

  5. Como começar

    Envie um briefing pelo formulário: qual processo o agente cobre, volumes esperados, quem é o usuário final, integrações. Respondo em até 48h com proposta inicial.

  6. Diferença pra consultoria

    Aqui o escopo é fechado, fixo, um caso. Em /consultoria, o escopo é amplo — roadmap, várias frentes, transformação. Mesma cabeça, contratos diferentes.

O projeto em quatro números.

  1. 5–8

    semanas até produção

    do briefing ao agente operando

  2. 1

    caso por projeto

    escopo fechado, sem creeping

  3. 30

    dias de estabilização

    pós-deploy, incluídos

  4. 0

    POC eterno

    agente roda ou o projeto não fecha

Quatro fases.

  1. 01

    Discovery

    1 semana

    Mergulho no processo atual, entrevistas com usuário final, mapeamento de integrações e dados. Saída: escopo técnico + métricas de sucesso.

  2. 02

    Construção

    3–6 semanas

    Sprints curtos com entrega incremental. Você testa em ambiente staging desde a semana 2. Ajuste contínuo do prompt, da arquitetura e dos guardrails.

  3. 03

    Deploy

    1 semana

    Subida em produção com monitoramento, evals automatizados e runbook completo. Handoff técnico pro time interno + documentação de produção.

  4. 04

    Estabilização

    30 dias

    Acompanhamento incluído: ajustes finos, casos edge, suporte ao time. Saída definitiva quando o time interno está autônomo pra iterar.

O que não entrego.

"Agente" virou termo guarda-chuva. Aqui ele tem definição estreita. O que está fora não cabe nesse contrato — pode caber em consultoria.

  • Não entrego chatbot de FAQ.

    já existe FAQ.

  • Não entrego POC eterno.

    agente vai a produção.

  • Não entrego agente sem evals.

    sem medida é fé.

  • Não entrego manutenção contínua do produto.

    entrega e seu time roda.

O que sai daqui.

Lista pública dos artefatos típicos. Cada engajamento ajusta — mas a tabela abaixo é ponto de partida.

  • Agente operável em produção

    Não POC, não demo, não vídeo de LinkedIn. Agente respondendo ao usuário final no canal de produção, com latência aceitável e custo previsível.

  • Código próprio + repo no seu GitHub

    Você fica com o repositório. Stack moderna (TypeScript ou Python), bem-testada, documentada. Sem vendor lock-in de plataforma proprietária.

  • Eval set versionado

    Cada caso de uso entra com eval set declarado em código. CI roda eval em cada PR. Regressão quebra build. Sem eval, sem deploy.

  • Observability instrumentada

    Tracing de chamadas de ferramenta, logs estruturados, dashboard de custo + latência. Você vê o que está acontecendo, em tempo real.

  • Runbook + handoff técnico

    Runbook de produção pro seu time: como deployar, como rollback, como debuggar, métricas-chave, plano de incident response.

  • 30 dias de estabilização

    Incluso no escopo: ajustes finos pós-deploy, casos edge encontrados em produção, suporte ao time interno até autonomia.

Investimento.

Cada caso é caso. Sem tabela de site institucional — fechamos no WhatsApp, com escopo claro e condições alinhadas.

  • Faixa · Agente simples

    Agente simples

    • Caso bem definido (atendimento, qualificação).
    • RAG sobre 1 base + 2-3 tools.
    • 5–6 semanas até produção.
    • 30 dias de estabilização.
    Falar no WhatsApp
  • Faixa · Agente médio preferida

    Agente médio

    • Múltiplas tools, integração externa.
    • Eval set + observability.
    • 6–8 semanas até produção.
    • 30 dias de estabilização.
    Falar no WhatsApp
  • Faixa · Agente complexo

    Agente complexo

    • Multi-agente, processo crítico.
    • Compliance / regulatório.
    • Integração com legados sensíveis.
    • SLA negociado.
    Falar no WhatsApp

Antes de marcar.

Em que canal o agente vai rodar?

WhatsApp (via Cloud API), Slack, Teams, Telegram, web embed, voice (Twilio), ou interno (API → seu app). Defino no discovery em função do usuário final. WhatsApp é o mais comum no Brasil.

Você hospeda o agente ou fica na minha infra?

Sua escolha. Faço deploy em AWS/GCP/Azure da sua conta ou em VPS gerenciado por mim (Hetzner, Railway, Fly.io) cobrando hosting separado a custo. Em empresa regulada normalmente faz mais sentido manter dentro da sua infra.

Vai funcionar com nossa base de conhecimento atual?

Provavelmente. Trabalho com PDFs, Notion, Confluence, banco SQL, Sharepoint, sites internos, APIs. Discovery valida quais fontes alimentam o agente e em que cadência sincronizam. Se a base for caótica, parte do projeto é normalizar.

Qual modelo você usa?

Avaliação caso a caso entre Claude (Anthropic), GPT (OpenAI), Gemini (Google) e open source (Llama, Mistral, Qwen) — em função de custo, latência, qualidade no eval e restrição regulatória. Em ~70% dos casos vai Claude por qualidade em tool use, mas não é dogma.

E depois dos 30 dias de estabilização? Sumiu?

Você fica com tudo: repo, doc, runbook, eval set, observability. Time interno deve ser capaz de iterar sozinho. Se quiser suporte continuado, ofereço retainer mensal opcional — mas não é default e não é necessário se o handoff foi bem feito.

Quanto tempo até ver o agente funcionando?

Versão de testes em staging na semana 3–4. Produção entre semanas 5 e 8 dependendo da complexidade. Discovery completo em 1 semana — você sai dele sabendo prazo e preço final com baixa margem de erro.

Tem um caso
pra um agente?

Mande o briefing: processo, volumes, usuário final, integrações. Respondo em até 48h com proposta inicial — ou indicação se não for caso pra cá.

Enviar briefing