Trabalhando com Dados Categóricos no XGBoost

O XGBoost, apesar de ser uma biblioteca de gradient boosting poderosa e eficiente, é feito para trabalhar com dados numéricos. Isso significa que você precisa encontrar uma maneira de transformar dados categóricos em um formato que o XGBoost possa entender. Esse processo pode ser demorado e complexo, especialmente se você estiver lidando com um grande número de variáveis categóricas ou categorias. O problema se torna ainda mais desafiador quando você considera as armadilhas potenciais da transformação de variáveis categóricas....

June 24, 2024 · 5 min · Mario Filho

XGBoost para Classificação Binária em Python

A classificação binária é um tipo de tarefa de machine learning onde a saída é um resultado binário, ou seja, pertence a uma de duas classes. Por exemplo, um e-mail pode ser classificado como ‘spam’ ou ’não spam’, ou um tumor pode ser ‘maligno’ ou ‘benigno’. Quando você tem mais de duas classes, é chamado de classificação multiclasse. Podemos usar vários algoritmos para resolver estes tipos de problemas. Esses algoritmos incluem regressão logística, árvores de decisão, random forest, SVM e algoritmos de gradient boosting como o XGBoost....

June 22, 2024 · 9 min · Mario Filho

Tunando Hiperparâmetros do CatBoost com Optuna

Você já se perguntou como tunar os hiperparâmetros do CatBoost para obter o melhor desempenho possível? O ajuste de hiperparâmetros é a chave para desbloquear todo o potencial do seu modelo. Mas olhando a documentação do CatBoost, você pode se sentir sobrecarregado com a quantidade de hiperparâmetros disponíveis. Isso acaba hoje! A Optuna é uma biblioteca de otimização de hiperparâmetros poderosa e fácil de usar que pode ajudar a encontrar os melhores hiperparâmetros para o seu modelo CatBoost....

June 21, 2024 · 7 min · Mario Filho

Classificação Multiclasse com XGBoost em Python

Classificação multiclasse é uma tarefa de machine learning onde o resultado pode pertencer a mais de duas classes ou categorias. Por exemplo, uma fruta pode ser classificada como ‘maçã’, ‘banana’ ou ‘cereja’. Ou um carro pode ser classificado como ‘sedan’, ‘SUV’ ou ‘caminhonete’. Assim como na classificação binária, podemos usar uma variedade de algoritmos para classificar os pontos de dados nessas múltiplas categorias. Esses algoritmos incluem regressão logística, árvores de decisão, random forests, SVMs e algoritmos de gradient boosting como XGBoost....

June 20, 2024 · 9 min · Mario Filho

Calculando Importância De Features Na Regressão Logística

Está enfrentando dificuldades para interpretar seu modelo de regressão logística e identificar quais features realmente influenciam na previsão da sua variável alvo? Determinar quais features estão influenciando as previsões do seu modelo pode ser frustrante, especialmente quando lidamos com um grande número de variáveis. A situação pode se complicar ainda mais com a presença de features correlacionadas. Neste tutorial, exploraremos diversos métodos para avaliar a importância das features em modelos de regressão logística, tanto para classificação binária quanto para classificação multiclasse....

June 19, 2024 · 10 min · Mario Filho

Como Prever Séries Temporais Com NBEATS em Python

Índice O Que é NBEATS? Como Instalar a NeuralForecast Com e Sem Suporte a GPU Como Preparar a Série Temporal Para o NBEATS Hiperparâmetros do NBEATS n_harmonics n_polynomials stack_types input_size_multiplier learning_rate scaler_type max_steps Como Treinar NBEATS em Python Como Adicionar Variáveis Externas ao NBEATS Baseline Simples Com Sazonalidade Função Objetivo WMAPE no PyTorch O Que é NBEATS? A NBEATS é uma arquitetura de rede neural capaz de prever séries temporais sem depender da criação de features específicas por um especialista....

February 7, 2023 · 11 min · Mario Filho

Como Prever Séries Temporais com Scikit-learn

Prever séries temporais é uma tarefa muito comum no dia a dia de um cientista de dados. Seja prever a demanda futura de um produto, o tráfego de uma cidade ou até mesmo o clima. Com previsões precisas de séries temporais, as empresas podem ajustar suas estratégias de produção, gerenciamento de estoque, alocação de recursos e outras decisões importantes, levando a uma redução significativa de custos e aumento da eficiência....

February 4, 2023 · 14 min · Mario Filho

Como Prever Séries Temporais Com Transformers em Python

Índice O Que São Transformers em Deep Learning? Temporal Fusion Transformers Como Instalar a NeuralForecast Com e Sem Suporte a GPU Como Preparar a Série Temporal Para o TFT Hiperparâmetros do Temporal Fusion Transformer input_size_multiplier hidden_size n_head learning_rate scaler_type max_steps batch_size windows_batch_size Como Treinar Temporal Fusion Transformers em Python Como Adicionar Variáveis Externas ao TFT Baseline Simples Com Sazonalidade Função Objetivo WMAPE no PyTorch O Que São Transformers em Deep Learning?...

February 2, 2023 · 14 min · Mario Filho

Como Prever Séries Temporais Com Redes Neurais Convolucionais em Python

Índice O Que São Redes Neurais Convolucionais? Redes Convolucionais Temporais Como Instalar a NeuralForecast Com e Sem Suporte a GPU Como Preparar a Série Temporal Para A Rede Neural Convolucional Hiperparâmetros e Arquitetura da TCN kernel_size dilations input_size_multiplier encoder_hidden_size context_size decoder_hidden_size learning_rate max_steps batch_size Treinamento da Rede Neural Como Adicionar Variáveis Externas à Rede Neural Convolucional Baseline Simples Com Sazonalidade Função Objetivo WMAPE no PyTorch O Que São Redes Neurais Convolucionais?...

February 1, 2023 · 13 min · Mario Filho

Como Prever Séries Temporais Com Redes Neurais em Python

A modelagem de séries temporais com deep learning (redes neurais) é uma área em constante evolução. Falar de “redes neurais” pode se referir a vários tipos diferentes de técnicas como redes neurais convolucionais, redes neurais recorrentes, redes neurais tradicionais (MLP) e redes neurais com mecanismo de atenção (transformer). Por isso, primeiro vou te dar uma visão geral dessas técnicas, indicando artigos mais detalhados sobre cada uma e depois vou te mostrar como aplicar uma rede neural tradicional (MLP) para prever séries temporais....

January 30, 2023 · 19 min · Mario Filho