Pular para o conteúdo

Um caso. Um agente. Em produção.

Construção packageada de agente de IA pra um caso específico do seu negócio. Escopo fechado, entrega em 5–8 semanas, agente operando — não em demo.

Três princípios.
Do briefing ao deploy.

Princípio P1 01

Escopo fechado .

Cada engajamento começa por um caso definido — uma operação, um processo, um ponto de dor. Sem briefing genérico. O que não cabe no escopo entra na próxima rodada.

Princípio P2 02

Entrega operável .

O agente vai a produção no fim do projeto — não fica em "demo eterna". Código próprio, deploy na sua infra ou na minha, runbook, eval inicial e plano de monitoramento.

Princípio P3 03

Handoff sem lock-in.

Você fica com o repo, a doc e o conhecimento. Seu time aprende a iterar — não fica refém do consultor. 30 dias de suporte de estabilização incluídos.

Escopo.
Tudo o que sai do contrato.

O contrato é uma página. O que entra, o que sai, prazo, entrega, stack. Sem letra miúda — transparência radical.

  1. A-01

    Casos típicos

    Atendimento WhatsApp com lógica de domínio (case AUMAF). Automação de processo interno. Vertical específico (legal, financeiro, ops). Agente RAG sobre base própria.

  2. A-02

    O que entrego

    Agente operável, código próprio, deploy na sua infra ou na minha (consulte). Documentação, runbooks, evals iniciais, handoff técnico pro seu time.

  3. A-03

    Escopo padrão

    Discovery 1 semana · Construção 3–6 semanas · Handoff 1 semana. Saída: agente em produção no caso definido + 30 dias de estabilização incluídos.

  4. A-04

    Stack típica

    Claude/GPT como motor. RAG via Pinecone, Qdrant ou PgVector. Orquestração com LangGraph, n8n ou código próprio. WhatsApp via Z-API/Twilio. Frontend quando precisa.

  5. A-05

    Como começar

    Envie um briefing pelo formulário: qual processo o agente cobre, volumes esperados, quem é o usuário final, integrações. Respondo em até 48h com proposta inicial.

  6. A-06

    Diferença pra consultoria

    Aqui o escopo é packageado, fixo, um caso. Em /consultoria, o escopo é amplo — roadmap, várias frentes, transformação. Mesma operação, contratos diferentes.

O projeto em quatro números.

  1. N01
    5–8

    semanas até produção

    do briefing ao agente operando

  2. N02
    1

    caso por projeto

    escopo fechado, sem creeping

  3. N03
    30

    dias de estabilização

    pós-deploy, incluídos

  4. N04
    0

    POC eterno

    agente opera ou o projeto não fecha

Quatro fases.

  1. 01

    Discovery

    1 semana

    Mergulho no processo atual, entrevistas com usuário final, mapeamento de integrações e dados. Saída: escopo técnico + métricas de sucesso.

  2. 02

    Construção

    3–6 semanas

    Sprints curtos com entrega incremental. Você testa em ambiente staging desde a semana 2. Ajuste contínuo do prompt, da arquitetura e dos guardrails.

  3. 03

    Deploy

    1 semana

    Subida em produção com monitoramento, evals automatizados e runbook completo. Handoff técnico pro time interno + documentação operacional.

  4. 04

    Estabilização

    30 dias

    Acompanhamento incluído: ajustes finos, casos edge, suporte ao time. Saída definitiva quando o time interno está autônomo pra iterar.

O que não entrego.

"Agente" virou termo guarda-chuva. Aqui ele tem definição estreita. O que está fora não cabe nesse contrato — pode caber em consultoria.

  • N-01

    Não entrego chatbot de FAQ.

    já existe FAQ.

  • N-02

    Não entrego POC eterno.

    agente vai a produção.

  • N-03

    Não entrego agente sem evals.

    sem medida é fé.

  • N-04

    Não entrego operação contínua do produto.

    entrega e seu time roda.

O que sai daqui.

Lista pública dos artefatos típicos. Cada engajamento ajusta — mas a tabela abaixo é ponto de partida.

  • D-01

    Agente operável em produção

    Não POC, não demo, não vídeo de LinkedIn. Agente respondendo ao usuário final no canal de produção, com latência aceitável e custo previsível.

  • D-02

    Código próprio + repo no seu GitHub

    Você fica com o repositório. Stack moderna (TypeScript ou Python), bem-testada, documentada. Sem vendor lock-in de plataforma proprietária.

  • D-03

    Eval set versionado

    Cada caso de uso entra com eval set declarado em código. CI roda eval em cada PR. Regressão quebra build. Sem eval, sem deploy.

  • D-04

    Observability instrumentada

    Tracing de chamadas de ferramenta, logs estruturados, dashboard de custo + latência. Você vê o que está acontecendo, em tempo real.

  • D-05

    Runbook + handoff técnico

    Documento operacional pro seu time: como deployar, como rollback, como debuggar, métricas-chave, plano de incident response.

  • D-06

    30 dias de estabilização

    Incluso no escopo: ajustes finos pós-deploy, casos edge encontrados em produção, suporte ao time interno até autonomia.

Investimento.

Cada caso é caso. Sem tabela de site institucional — fechamos no WhatsApp, com escopo claro e condições alinhadas.

  • Faixa · Agente simples

    Agente simples

    • Caso bem definido (atendimento, qualificação).
    • RAG sobre 1 base + 2-3 tools.
    • 5–6 semanas até produção.
    • 30 dias de estabilização.
    Falar no WhatsApp
  • Faixa · Agente médio preferida

    Agente médio

    • Múltiplas tools, integração externa.
    • Eval set + observability.
    • 6–8 semanas até produção.
    • 30 dias de estabilização.
    Falar no WhatsApp
  • Faixa · Agente complexo

    Agente complexo

    • Multi-agente, processo crítico.
    • Compliance / regulatório.
    • Integração com legados sensíveis.
    • SLA negociado.
    Falar no WhatsApp

Antes de marcar.

Q01

Em que canal o agente vai operar?

WhatsApp (via Cloud API), Slack, Teams, Telegram, web embed, voice (Twilio), ou interno (API → seu app). Defino no discovery em função do usuário final. WhatsApp é o mais comum no Brasil.
Q02

Você hospeda o agente ou fica na minha infra?

Sua escolha. Faço deploy em AWS/GCP/Azure da sua conta ou em VPS gerenciado por mim (Hetzner, Railway, Fly.io) cobrando hosting separado a custo. Em empresa regulada normalmente faz mais sentido manter dentro da sua infra.
Q03

Vai funcionar com nossa base de conhecimento atual?

Provavelmente. Trabalho com PDFs, Notion, Confluence, banco SQL, Sharepoint, sites internos, APIs. Discovery valida quais fontes alimentam o agente e em que cadência sincronizam. Se a base for caótica, parte do projeto é normalizar.
Q04

Qual modelo você usa?

Avaliação caso a caso entre Claude (Anthropic), GPT (OpenAI), Gemini (Google) e open source (Llama, Mistral, Qwen) — em função de custo, latência, qualidade no eval e restrição regulatória. Em ~70% dos casos vai Claude por qualidade em tool use, mas não é dogma.
Q05

E depois dos 30 dias de estabilização? Sumiu?

Você fica com tudo: repo, doc, runbook, eval set, observability. Time interno deve ser capaz de iterar sozinho. Se quiser suporte continuado, ofereço retainer mensal opcional — mas não é default e não é necessário se o handoff foi bem feito.
Q06

Quanto tempo até ver o agente funcionando?

Versão de testes em staging na semana 3–4. Produção entre semanas 5 e 8 dependendo da complexidade. Discovery completo em 1 semana — você sai dele sabendo prazo e preço final com baixa margem de erro.

Tem um caso
pra um agente?

Mande o briefing: processo, volumes, usuário final, integrações. Respondo em até 48h com proposta inicial — ou indicação se não for caso pra cá.

Enviar briefing