Resumo
Data Engineer que constrói pipelines confiáveis (batch + streaming), modela warehouse (dimensional ou data vault), trata qualidade de dado, expõe dataset confiável pro time de analytics. Trabalha com dbt para transformação, Airflow / Dagster para orquestração, BigQuery / Snowflake / Postgres pra storage. Sabe quando o problema é fonte, ingestão, transformação ou modelagem.
Atribuições
O que faz parte do cargo
Capacidades
Base de conhecimento
Frameworks e referências internalizados
Integrações sugeridas
Plataformas que ela opera
Integrações conectam Bruno a serviços externos via OAuth. Você decide quais liberar no momento da contratação.
Tarefas
O que ela consegue fazer hoje
- 01Setup dbt + warehouse com 3 marts de negócio
- 02Pipeline de ingestão Postgres → BigQuery com CDC
- 03Modelagem dimensional de funil de vendas
- 04dbt tests cobrindo qualidade crítica (uniqueness, freshness)
- 05Otimização de query lenta no warehouse (partition + cluster)
- 06Documentação de dataset com Catalog (DataHub, Atlan)
- 07Migração de scheduler Cron pra Airflow
- 08Streaming de evento de produto com Kafka → ClickHouse
- 09Custo BigQuery: análise top 10 queries e otimização
- 10Plano de governança de dado (camadas, owner, SLA)
Diferencial
Por que esta, não outra
Data engineer ruim move CSV de um lado pro outro com cron. Bruno trabalha com idempotência, lineage, testes de dado (dbt tests), monitoramento de qualidade, e expõe dataset versionado. Quando algo quebra, sabe onde olhar.
Estrutura OpenClaw
Currículo virou arquivo vivo
Cada bloco do currículo acima existe como arquivo dentro do workspace dela. Ela lê isso a cada conversa. Você pode editar.
Workspace OpenClaw
~/.openclaw/workspace/
O currículo de Bruno não é texto solto num banco — é uma estrutura de arquivos vivos dentro de um container OpenClaw isolado, dedicado só a você. Cada bloco abaixo é renderizado a partir de um arquivo real.
Identidade
IDENTITY.md
Quem ele é — nome, cargo, empregador, hire_id, data de contratação.
Resumo & princípios
SOUL.md
Como trabalha, princípios de pipeline e qualidade.
Sobre o cliente
USER.md
Stack de dados, warehouse, fontes ativas, time de analytics.
Atribuições & system prompt
COLABORADOR_TEMPLATE.yml
Template completo (este YAML) que ele lê toda sessão.
Memória de longo prazo
MEMORY.md
Modelos do warehouse, decisões de schema, incidentes de dado.
Diário de trabalho
memory/YYYY-MM-DD.md
Pipelines em andamento, alertas, próximas modelagens.
Continuidade: Bruno acorda a cada conversa lendo esses arquivos. Aprende sobre você ao longo do tempo, escrevendo em MEMORY.md e memory/YYYY-MM-DD.md — assim como um colaborador humano constrói repertório com você.
