Glossário curto.
Os termos que aparecem em /sobre, /agentes, /consultoria e nos posts. Cada definição cabe em uma frase. Quando virar duas, é porque vale o contexto.
Prática · jeito de trabalhar
- § harness-engineering Harness engineering
-
Disciplina de construir o ferramental que cerca o LLM — orquestração, retry, eval, observability — em vez de só prompts.
É o que separa um agente que "funciona na demo" de um agente que vive em produção sem precisar de babá.
Como aplico em agentes → - § vibe-coding Vibe coding
-
Programar com IA no loop como par — descrevendo a intenção em linguagem natural enquanto a IA materializa o código.
Não é "code generation". É um modo de trabalho onde o engenheiro lidera a direção e a IA cobre a digitação.
Mentoria em vibe coding → - § prompt-engineering Prompt engineering
-
Prática de desenhar a instrução do LLM — system prompt, few-shot, formato de saída — para extrair comportamento confiável.
Está virando "context engineering": menos sobre frase perfeita, mais sobre orquestrar contexto, exemplos e ferramentas.
Técnico · componentes do stack
- § agente Agente
-
Sistema autônomo baseado em LLM que decide, age e itera num loop — chama ferramentas, observa resultados, ajusta.
Diferente de chatbot, agente tem ferramentas (tool use), memória e loop de decisão até atingir um objetivo.
Ofertas em agentes → - § rag RAG · Retrieval-Augmented Generation
-
Padrão onde o LLM consulta uma base externa (vetor, SQL, API) antes de gerar a resposta, em vez de "inventar".
É o jeito mais comum de dar conhecimento privado a um LLM sem precisar treinar. Vector DB é o pedaço mais visível, mas a engenharia de chunks e re-ranking pesa mais.
- § eval Eval · evaluation harness
-
Suíte automatizada que mede a qualidade das respostas do LLM contra um dataset de referência — equivalente aos testes unitários do software tradicional.
Sem eval, "ficou melhor" vira sensação. Com eval, vira número. É o que torna iteração de prompt mensurável.
Eval em consultoria → - § guardrail Guardrail
-
Camada de validação determinística em volta do LLM que bloqueia respostas fora do escopo (off-topic, tóxicas, vazamento de PII).
Pode ser regex, classificador ML, outro LLM julgando, ou as três. Guardrail bom é invisível — só aparece quando algo dá errado.
- § mcp MCP · Model Context Protocol
-
Protocolo aberto (Anthropic, 2024) que padroniza como um LLM descobre e chama ferramentas externas — tipo "USB-C de tool use".
Substitui o boilerplate de função-por-função por servidores reutilizáveis: GitHub, Postgres, filesystem, qualquer API vira um MCP server.
- § tool-use Tool use · function calling
-
Capacidade do LLM de chamar funções definidas pelo desenvolvedor — pesquisar na web, ler arquivos, postar em API.
Diferente de "o LLM responde", é "o LLM decide qual ferramenta usar, monta os argumentos, e age". A base de todo agente.
- § observability-llm Observability de LLM
-
Instrumentação que captura cada chamada (prompt, resposta, tokens, latência, custo, ferramenta usada) para diagnosticar bugs e regressões em produção.
Stack típica: Langfuse, Helicone ou OpenTelemetry com convenções gen_ai.*. Sem isso, debug em produção vira chute.
- § agent-loop Agent loop
-
Ciclo think → act → observe → repeat que o agente executa até cumprir o objetivo (ou bater num limite de iterações).
Padrão clássico: ReAct. Hoje, frameworks como LangGraph, Anthropic Agents SDK e CrewAI implementam variações desse loop.
Papel · função no time
- § chapter-lead Chapter Lead
-
Liderança técnica horizontal de uma capability (Gen AI, no meu caso) — define padrões, mentora, e mantém qualidade entre squads.
Vem do modelo Spotify. Diferente de Tech Lead (vertical, dentro do squad), é cross-time e responde por uma disciplina inteira.
Sobre o Kayo →