Mario Filho | Machine Learning

Calculando Importância de Features em Random Forests

Interpretar e identificar as features cruciais em modelos de machine learning pode ser um desafio e tanto, especialmente ao lidar com modelos black-box. Neste tutorial, vamos mergulhar fundo no entendimento da importância global e local das features em Random Forests. Exploraremos várias técnicas e ferramentas para analisar e interpretar essas importâncias, tornando nossos modelos mais transparentes e confiáveis. Para ilustrar as técnicas, utilizaremos o conjunto de dados “Red Wine Quality” do Repositório de Machine Learning da UCI....

Chain-of-Thought Prompting: O Que é e Como Usar?

Chain-of-Thought (CoT) Prompting é uma técnica avançada de engenharia de prompts que incentiva o modelo a “pensar em voz alta”, decompondo problemas em etapas intermediárias antes de chegar a uma conclusão. Isso não apenas melhora a precisão das respostas, mas também torna o processo de “raciocínio” do modelo mais transparente e interpretável. Depois do sucesso demonstrado pelo CoT, as empresas que treinam LLMs começaram a incluir exemplos de raciocínio passo a passo em seus dados, justamente para melhorar a interpretabilidade e a precisão dos modelos....

Como Tunar Hiperparâmetros do LightGBM com Optuna

Como um Grandmaster do Kaggle, eu adoro trabalhar com o LightGBM, uma biblioteca fantástica de machine learning que se tornou uma das minhas ferramentas preferidas. Eu sempre foco em tunar os hiperparâmetros do modelo antes de mergulhar na engenharia de features. Ao ajustar seus hiperparâmetros primeiro, você vai espremer cada gota de desempenho do seu modelo com os dados que já tem. Depois que você tiver os hiperparâmetros ideais, você passa para a engenharia de features....

Tutorial: CatBoost Para Classificação Binária Em Python

Muitas pessoas acham a configuração inicial do CatBoost um pouco intimidante. Talvez você tenha ouvido falar sobre sua capacidade de trabalhar com features categóricas sem nenhum pré-processamento, mas não sabe por onde começar. Neste tutorial passo a passo, vou simplificar as coisas para você. Afinal, esta é apenas mais uma biblioteca de gradient boosting para ter em sua caixa de ferramentas. Vou guiá-lo pelo processo de instalação do CatBoost, carregamento dos seus dados e configuração de um classificador CatBoost....

Como Calcular a Importância das Features no XGBoost

A “importância de features” (feature importance) nos ajuda a identificar quais features nos seus dados são mais influentes quando se trata das previsões do seu modelo. Compreender a importância das features pode ajudar você a interpretar seu modelo de forma mais eficaz. Por exemplo: Você pode descobrir uma feature surpreendentemente importante que não esperava. Ou perceber que uma feature que você considerava crucial na verdade não está fazendo muita diferença....

Usando XGBoost para Learning to Rank

XGBoost é uma ferramenta essencial para muitas aplicações Learning to Rank, desde a previsão de taxas de cliques até o aprimoramento de sistemas de recomendação. Usei muito ele quando era responsável pelo sistema de ranking de freelancers na Upwork. Neste tutorial, vamos explorar o potencial do XGBoost para suas tarefas de LTR. Vamos explorar várias funções objetivo, passos da preparação de dados e ilustrar como treinar seu modelo. Ao final deste guia, você estará totalmente equipado para construir seus próprios modelos LTR usando XGBoost....

Regressão Multi-Output com XGBoost em Python

A regressão multi-output é uma tarefa de machine learning onde precisamos prever múltiplos valores para cada amostra de entrada. Imagine que você é um analista financeiro em uma empresa de investimentos. Seu trabalho é prever o desempenho futuro de várias ações para orientar decisões de investimento. Para cada ação, você quer prever vários alvos, como o retorno esperado, a volatilidade (risco) e a correlação com outras ações ou índices de mercado....

Como Salvar e Carregar Modelos XGBoost em Python

Você passou incontáveis horas pesquisando, ajustando e treinando o modelo XGBoost perfeito. Seu modelo está performando excepcionalmente bem e você está pronto para comemorar. Mas espere, agora você precisa implementá-lo, e de repente, você se depara com um problema. Como salvar seu modelo para uso futuro? Neste artigo, vou ensiná-lo a salvar e carregar seus modelos XGBoost. Isso significa que você pode treinar seu modelo uma vez, salvá-lo e depois recarregá-lo sempre que precisar fazer previsões....

Como Tunar Hiperparâmetros do XGBoost com Optuna

Encontrar os hiperparâmetros certos para o XGBoost pode parecer como procurar uma agulha em um palheiro. Acredite, eu já passei por isso. O XGBoost foi um modelo crucial para vencer pelo menos duas das competições do Kaggle das quais participei. Ao final deste tutorial, você estará equipado com as mesmas técnicas que usei para otimizar meus modelos e alcançar essas vitórias. Vamos começar! Instalando XGBoost e Optuna Instalar o XGBoost é fácil, basta executar:...

Regressão com XGBoost em Python

Você está tendo dificuldades para fazer seus modelos de regressão performarem bem? Talvez você tenha tentado vários algoritmos, ajustado seus parâmetros e até coletado mais dados, mas as previsões do seu modelo ainda estão imprecisas. Neste tutorial, vou apresentar a você o XGBoost, um poderoso algoritmo de machine learning que, além de vencer competições no Kaggle, é muito utilizado em produção por empresas como Uber, Airbnb e Netflix. Vou guiá-lo passo a passo sobre como usar o XGBoost para tarefas de regressão em Python....