Felipe Coutinho
@dataunicornio.bsky.social
Se você está começando em data science, foque nisso desde o início.
Vai te economizar anos de frustração.
Comente 👇
Vai te economizar anos de frustração.
Comente 👇
November 10, 2025 at 1:22 PM
Se você está começando em data science, foque nisso desde o início.
Vai te economizar anos de frustração.
Comente 👇
Vai te economizar anos de frustração.
Comente 👇
Dados e algoritmos são importantes.
Mas entender o contexto de negócio e comunicar bem são essenciais.
O melhor profissional não é quem domina as técnicas mais avançadas. É quem equilibra habilidade técnica com uma visão de negócio implacável.
Mas entender o contexto de negócio e comunicar bem são essenciais.
O melhor profissional não é quem domina as técnicas mais avançadas. É quem equilibra habilidade técnica com uma visão de negócio implacável.
November 10, 2025 at 1:22 PM
Dados e algoritmos são importantes.
Mas entender o contexto de negócio e comunicar bem são essenciais.
O melhor profissional não é quem domina as técnicas mais avançadas. É quem equilibra habilidade técnica com uma visão de negócio implacável.
Mas entender o contexto de negócio e comunicar bem são essenciais.
O melhor profissional não é quem domina as técnicas mais avançadas. É quem equilibra habilidade técnica com uma visão de negócio implacável.
Entrego MVPs simples para feedback. Um modelo que gera valor hoje vence um modelo perfeito que chega tarde demais.
A verdade é essa:
Um modelo com 85% de acurácia que as pessoas usam gera mais impacto que um modelo com 98% de precisão que ninguém entende e não usa.
A verdade é essa:
Um modelo com 85% de acurácia que as pessoas usam gera mais impacto que um modelo com 98% de precisão que ninguém entende e não usa.
November 10, 2025 at 1:22 PM
Entrego MVPs simples para feedback. Um modelo que gera valor hoje vence um modelo perfeito que chega tarde demais.
A verdade é essa:
Um modelo com 85% de acurácia que as pessoas usam gera mais impacto que um modelo com 98% de precisão que ninguém entende e não usa.
A verdade é essa:
Um modelo com 85% de acurácia que as pessoas usam gera mais impacto que um modelo com 98% de precisão que ninguém entende e não usa.
Converso com quem vai USAR o modelo. Não uma reunião de kickoff, mas uma parceria constante durante todo o projeto.
2. Problema de Negócio > Problema Técnico
Valido se o que me pediram é o que eles realmente precisam. (Quase nunca é).
3. Valor Rápido > Perfeição Lenta
2. Problema de Negócio > Problema Técnico
Valido se o que me pediram é o que eles realmente precisam. (Quase nunca é).
3. Valor Rápido > Perfeição Lenta
November 10, 2025 at 1:22 PM
Converso com quem vai USAR o modelo. Não uma reunião de kickoff, mas uma parceria constante durante todo o projeto.
2. Problema de Negócio > Problema Técnico
Valido se o que me pediram é o que eles realmente precisam. (Quase nunca é).
3. Valor Rápido > Perfeição Lenta
2. Problema de Negócio > Problema Técnico
Valido se o que me pediram é o que eles realmente precisam. (Quase nunca é).
3. Valor Rápido > Perfeição Lenta
Aprendi da pior forma: excelência técnica sem adoção é desperdício.
Hoje, minha abordagem mudou completamente.
Antes de escrever a primeira linha de `import pandas`, meu processo é:
1. Contexto > Código
Hoje, minha abordagem mudou completamente.
Antes de escrever a primeira linha de `import pandas`, meu processo é:
1. Contexto > Código
November 10, 2025 at 1:22 PM
Aprendi da pior forma: excelência técnica sem adoção é desperdício.
Hoje, minha abordagem mudou completamente.
Antes de escrever a primeira linha de `import pandas`, meu processo é:
1. Contexto > Código
Hoje, minha abordagem mudou completamente.
Antes de escrever a primeira linha de `import pandas`, meu processo é:
1. Contexto > Código
O problema não era técnico. Era de entendimento.
Enquanto eu me isolava para construir o "modelo perfeito", a área de negócios tinha dúvidas que eu nem sabia que existiam.
Eles não precisavam de um algoritmo sofisticado.
Precisavam de respostas rápidas.
Enquanto eu me isolava para construir o "modelo perfeito", a área de negócios tinha dúvidas que eu nem sabia que existiam.
Eles não precisavam de um algoritmo sofisticado.
Precisavam de respostas rápidas.
November 10, 2025 at 1:22 PM
O problema não era técnico. Era de entendimento.
Enquanto eu me isolava para construir o "modelo perfeito", a área de negócios tinha dúvidas que eu nem sabia que existiam.
Eles não precisavam de um algoritmo sofisticado.
Precisavam de respostas rápidas.
Enquanto eu me isolava para construir o "modelo perfeito", a área de negócios tinha dúvidas que eu nem sabia que existiam.
Eles não precisavam de um algoritmo sofisticado.
Precisavam de respostas rápidas.
Times de dados que escalam fazem escolhas certas, não escolhas fáceis. Essa disciplina faz toda a diferença.
Padronize ferramentas. Use SQL quando SQL resolve. Use Python quando faz sentido. Documente suas decisões.
Padronize ferramentas. Use SQL quando SQL resolve. Use Python quando faz sentido. Documente suas decisões.
November 8, 2025 at 4:28 PM
Times de dados que escalam fazem escolhas certas, não escolhas fáceis. Essa disciplina faz toda a diferença.
Padronize ferramentas. Use SQL quando SQL resolve. Use Python quando faz sentido. Documente suas decisões.
Padronize ferramentas. Use SQL quando SQL resolve. Use Python quando faz sentido. Documente suas decisões.
Dados ruins na visualização significam problemas no pipeline. Corrigir só no dashboard esconde o problema real e ele volta pior.
Suba o nível. Conserte na fonte. Faça logging adequado desde o início.
Suba o nível. Conserte na fonte. Faça logging adequado desde o início.
November 8, 2025 at 4:28 PM
Dados ruins na visualização significam problemas no pipeline. Corrigir só no dashboard esconde o problema real e ele volta pior.
Suba o nível. Conserte na fonte. Faça logging adequado desde o início.
Suba o nível. Conserte na fonte. Faça logging adequado desde o início.
Escolha o modelo mais simples que atinge a performance necessária. Você pode complexificar depois se precisar.
3. Resolvem problemas na origem, não no sintoma
3. Resolvem problemas na origem, não no sintoma
November 8, 2025 at 4:28 PM
Escolha o modelo mais simples que atinge a performance necessária. Você pode complexificar depois se precisar.
3. Resolvem problemas na origem, não no sintoma
3. Resolvem problemas na origem, não no sintoma
Streaming só quando você realmente precisa de dados em tempo real. E isso é mais raro do que parece.
2. Começam simples e escalam quando necessário
Regressão linear resolve muitos problemas. Random forests também. Você não precisa de deep learning para tudo.
2. Começam simples e escalam quando necessário
Regressão linear resolve muitos problemas. Random forests também. Você não precisa de deep learning para tudo.
November 8, 2025 at 4:28 PM
Streaming só quando você realmente precisa de dados em tempo real. E isso é mais raro do que parece.
2. Começam simples e escalam quando necessário
Regressão linear resolve muitos problemas. Random forests também. Você não precisa de deep learning para tudo.
2. Começam simples e escalam quando necessário
Regressão linear resolve muitos problemas. Random forests também. Você não precisa de deep learning para tudo.
1. Escolhem ferramentas pelo problema, não pela novidade
Batch resolve 90% dos casos de uso corporativos. É mais simples de debugar, mais barato de rodar, mais fácil de manter.
Batch resolve 90% dos casos de uso corporativos. É mais simples de debugar, mais barato de rodar, mais fácil de manter.
November 8, 2025 at 4:28 PM
1. Escolhem ferramentas pelo problema, não pela novidade
Batch resolve 90% dos casos de uso corporativos. É mais simples de debugar, mais barato de rodar, mais fácil de manter.
Batch resolve 90% dos casos de uso corporativos. É mais simples de debugar, mais barato de rodar, mais fácil de manter.
A tentação da tecnologia nova é forte. Mas cada escolha dessas cria débito técnico (aquela dívida que você paga depois com bugs e manutenção cara).
O verdadeiro problema não é técnico. É cultural.
Times de dados que escalam fazem três coisas diferentes:
O verdadeiro problema não é técnico. É cultural.
Times de dados que escalam fazem três coisas diferentes:
November 8, 2025 at 4:28 PM
A tentação da tecnologia nova é forte. Mas cada escolha dessas cria débito técnico (aquela dívida que você paga depois com bugs e manutenção cara).
O verdadeiro problema não é técnico. É cultural.
Times de dados que escalam fazem três coisas diferentes:
O verdadeiro problema não é técnico. É cultural.
Times de dados que escalam fazem três coisas diferentes:
Trabalhei com um time que escolheu Kafka para processar relatórios diários. O resultado: Três meses debugando problemas que não existiriam com batch simples.
November 8, 2025 at 4:28 PM
Trabalhei com um time que escolheu Kafka para processar relatórios diários. O resultado: Três meses debugando problemas que não existiriam com batch simples.
Comente abaixo qual desses desafios você já enfrentou. 👇
November 7, 2025 at 2:10 PM
Comente abaixo qual desses desafios você já enfrentou. 👇
A diferença entre equipes que entregam modelos rápido e equipes que travam não está no talento. Está no processo.
Esses desafios são oportunidades de melhoria. Cada passo que você dá na direção certa fortalece seu trabalho e o da sua equipe.
Esses desafios são oportunidades de melhoria. Cada passo que você dá na direção certa fortalece seu trabalho e o da sua equipe.
November 7, 2025 at 2:10 PM
A diferença entre equipes que entregam modelos rápido e equipes que travam não está no talento. Está no processo.
Esses desafios são oportunidades de melhoria. Cada passo que você dá na direção certa fortalece seu trabalho e o da sua equipe.
Esses desafios são oportunidades de melhoria. Cada passo que você dá na direção certa fortalece seu trabalho e o da sua equipe.
- Migrar de notebooks para scripts Python modulares
- Configurar pipelines de CI/CD desde o início
- Usar ferramentas de MLOps consolidadas
- Tratar código de ML como engenharia de software
- Configurar pipelines de CI/CD desde o início
- Usar ferramentas de MLOps consolidadas
- Tratar código de ML como engenharia de software
November 7, 2025 at 2:10 PM
- Migrar de notebooks para scripts Python modulares
- Configurar pipelines de CI/CD desde o início
- Usar ferramentas de MLOps consolidadas
- Tratar código de ML como engenharia de software
- Configurar pipelines de CI/CD desde o início
- Usar ferramentas de MLOps consolidadas
- Tratar código de ML como engenharia de software
Conectar no servidor via SSH e rodar um script não é estratégia de deployment. Automação economiza tempo e reduz erros.
A realidade: equipes de ciência de dados gastam 60-80% do tempo lidando com esses desafios.
A solução não é complicada, mas exige disciplina:
A realidade: equipes de ciência de dados gastam 60-80% do tempo lidando com esses desafios.
A solução não é complicada, mas exige disciplina:
November 7, 2025 at 2:10 PM
Conectar no servidor via SSH e rodar um script não é estratégia de deployment. Automação economiza tempo e reduz erros.
A realidade: equipes de ciência de dados gastam 60-80% do tempo lidando com esses desafios.
A solução não é complicada, mas exige disciplina:
A realidade: equipes de ciência de dados gastam 60-80% do tempo lidando com esses desafios.
A solução não é complicada, mas exige disciplina:
Seu modelo funciona diferente em produção e você não sabe o porquê. Ferramentas como DVC ajudam a entender se foi o código ou os dados que mudaram.
5. Processos manuais de deployment
5. Processos manuais de deployment
November 7, 2025 at 2:10 PM
Seu modelo funciona diferente em produção e você não sabe o porquê. Ferramentas como DVC ajudam a entender se foi o código ou os dados que mudaram.
5. Processos manuais de deployment
5. Processos manuais de deployment
Caminhos, parâmetros, credenciais dentro do código. Uma mudança de ambiente e tudo quebra. Arquivos de configuração e variáveis de ambiente resolvem isso.
4. Ignorar versionamento de dados
4. Ignorar versionamento de dados
November 7, 2025 at 2:10 PM
Caminhos, parâmetros, credenciais dentro do código. Uma mudança de ambiente e tudo quebra. Arquivos de configuração e variáveis de ambiente resolvem isso.
4. Ignorar versionamento de dados
4. Ignorar versionamento de dados
2. Não rastrear experimentos adequadamente
Sem ferramentas como MLflow ou Weights & Biases, você perde o histórico do que funcionou. Aquele modelo que deu ótimos resultados ontem? Boa sorte tentando replicar.
3. Fazer hardcode de tudo
Sem ferramentas como MLflow ou Weights & Biases, você perde o histórico do que funcionou. Aquele modelo que deu ótimos resultados ontem? Boa sorte tentando replicar.
3. Fazer hardcode de tudo
November 7, 2025 at 2:10 PM
2. Não rastrear experimentos adequadamente
Sem ferramentas como MLflow ou Weights & Biases, você perde o histórico do que funcionou. Aquele modelo que deu ótimos resultados ontem? Boa sorte tentando replicar.
3. Fazer hardcode de tudo
Sem ferramentas como MLflow ou Weights & Biases, você perde o histórico do que funcionou. Aquele modelo que deu ótimos resultados ontem? Boa sorte tentando replicar.
3. Fazer hardcode de tudo
Aqui estão 5 desafios comuns que podem travar seu progresso:
1. Rodar pipelines de produção em Notebooks
Notebooks são ótimos para exploração e prototipagem. Mas em produção, falta controle de versão, testes automatizados e reprodutibilidade.
1. Rodar pipelines de produção em Notebooks
Notebooks são ótimos para exploração e prototipagem. Mas em produção, falta controle de versão, testes automatizados e reprodutibilidade.
November 7, 2025 at 2:10 PM
Aqui estão 5 desafios comuns que podem travar seu progresso:
1. Rodar pipelines de produção em Notebooks
Notebooks são ótimos para exploração e prototipagem. Mas em produção, falta controle de versão, testes automatizados e reprodutibilidade.
1. Rodar pipelines de produção em Notebooks
Notebooks são ótimos para exploração e prototipagem. Mas em produção, falta controle de versão, testes automatizados e reprodutibilidade.
É possível sim construir projetos incríveis de IA. Mas só quando acertamos as fundações primeiro. Todo o resto vem depois.
Comente sua experiência com esse desafio nos comentários. 👇
Comente sua experiência com esse desafio nos comentários. 👇
November 6, 2025 at 12:47 PM
É possível sim construir projetos incríveis de IA. Mas só quando acertamos as fundações primeiro. Todo o resto vem depois.
Comente sua experiência com esse desafio nos comentários. 👇
Comente sua experiência com esse desafio nos comentários. 👇