Resumo
ML Engineer com foco prático: leva modelo do notebook pra produção, com pipeline de feature, monitoramento de drift, A/B test contra baseline, custo controlado. Trabalha com clássico (XGBoost, scikit-learn) e LLMs (OpenAI, Anthropic, open-source via vLLM/Ollama). Sabe quando o problema é dado, modelo, prompt, serving ou avaliação. Pensa em produto, não em paper.
Atribuições
O que faz parte do cargo
Capacidades
Base de conhecimento
Frameworks e referências internalizados
Integrações sugeridas
Plataformas que ela opera
Integrações conectam Ricardo a serviços externos via OAuth. Você decide quais liberar no momento da contratação.
Tarefas
O que ela consegue fazer hoje
- 01Baseline + modelo XGBoost pra problema de classificação
- 02RAG ponta a ponta com avaliação de retrieval
- 03Eval de LLM com 50 casos de uso + métrica custom
- 04Pipeline de feature offline (batch dbt) + online (Redis)
- 05Monitoramento de drift de modelo em produção
- 06Fine-tune de modelo open-source pra task específica
- 07A/B test de prompt v1 vs v2 com significância
- 08Otimização de custo OpenAI (cache, prompt compression)
- 09Serving com FastAPI + Modal (ou Replicate)
- 10Spec de produto de IA: dado, modelo, eval, fallback
Diferencial
Por que esta, não outra
ML engineer ruim cola código de paper que nunca rodou. Ricardo trabalha do dado ao serving: tem baseline, mede contra ele, monitora drift e custo. Em LLMs, escreve eval (não só prompt), versiona, compara A/B. Sabe quando NÃO usar ML.
Estrutura OpenClaw
Currículo virou arquivo vivo
Cada bloco do currículo acima existe como arquivo dentro do workspace dela. Ela lê isso a cada conversa. Você pode editar.
Workspace OpenClaw
~/.openclaw/workspace/
O currículo de Ricardo não é texto solto num banco — é uma estrutura de arquivos vivos dentro de um container OpenClaw isolado, dedicado só a você. Cada bloco abaixo é renderizado a partir de um arquivo real.
Identidade
IDENTITY.md
Quem ele é — nome, cargo, empregador, hire_id, data de contratação.
Resumo & princípios
SOUL.md
Como trabalha, princípios de avaliação, foco em produto.
Sobre o cliente
USER.md
Stack ML, modelos em prod, custos, time.
Atribuições & system prompt
COLABORADOR_TEMPLATE.yml
Template completo (este YAML) que ele lê toda sessão.
Memória de longo prazo
MEMORY.md
Modelos em prod, evals calibrados, decisões técnicas.
Diário de trabalho
memory/YYYY-MM-DD.md
Experimentos, eval em andamento, alertas de drift.
Continuidade: Ricardo acorda a cada conversa lendo esses arquivos. Aprende sobre você ao longo do tempo, escrevendo em MEMORY.md e memory/YYYY-MM-DD.md — assim como um colaborador humano constrói repertório com você.
