Guia Completo da Log Loss (Perda Logarítmica) em Machine Learning

Índice O Que é Log Loss (Perda Logarítmica) e Como Interpretá-la? Qual a Fórmula da Log Loss? Classificação Binária Classificação Multiclasse Log Loss Durante o Treino vs Validação Como Calcular Log Loss Usando Scikit-learn em Python Como Calcular Log Loss Em R Diferenças Entre Log Loss e ROC AUC O Que é Log Loss (Perda Logarítmica) e Como Interpretá-la? Log loss (ou perda logarítmica) é uma métrica de avaliação de modelos de classificação em machine learning, tanto binários quanto multiclasse....

January 5, 2023 · 7 min · Mario Filho

Guia Completo Sobre ROC AUC Em Machine Learning

Índice O Que É ROC AUC? Como Interpretar ROC AUC? Como Calcular ROC AUC Com Scikit-learn Em Python? Como Calcular ROC AUC Em R? Como Usar ROC AUC Com Mais de Duas Classes? Diferença Entre ROC AUC e Acurácia Diferença Entre ROC AUC e F1 Score Diferença Entre ROC AUC e Log Loss O Que É ROC AUC? ROC AUC é uma métrica de avaliação em machine learning usada para avaliar o desempenho de modelos de classificação....

January 4, 2023 · 10 min · Mario Filho

Precisão, Recall e F1 Score Em Machine Learning

Se você está começando a trabalhar com machine learning, é importante saber como avaliar o desempenho dos seus modelos. Existe uma infinidade de métricas de avaliação e neste artigo, vamos nos concentrar em três das mais populares para avaliar modelos de classificação: precisão, recall e F1 score. A precisão mede a quantidade de vezes que o seu modelo acerta em relação ao total de vezes que ele tenta acertar. O recall mede a quantidade de vezes que o seu modelo acerta em relação ao total de vezes que ele deveria ter acertado....

January 3, 2023 · 8 min · Mario Filho

O Que É Acurácia Em Machine Learning?

Acurácia é uma métrica de avaliação muito popular para descobrir a performance de um modelo de machine learning em uma tarefa de classificação. Costumo pensar nela como “taxa de acerto” do modelo. Ela é calculada dividindo o número de previsões corretas pelo número total de previsões. Por exemplo, imagine que você treinou um modelo de machine learning para prever se uma pessoa tem uma doença ou não, com base em alguns sintomas....

January 1, 2023 · 8 min · Mario Filho

Plano Completo Para Aprender Matemática De Data Science Grátis

Muita gente acha que a matemática para data science é um bicho de sete cabeças. Alguns acadêmicos dizem que você precisa passar 4 anos numa faculdade de matemática antes de aprender data science, mas isso não é verdade. Eu e vários colegas de profissão, que também escolheram estudar por conta própria, mesmo sem ter feito uma faculdade de exatas, somos a prova disso. Eu fui fazer faculdade de Direito para ter certeza que nunca mais ia ver matemática na vida (ah, a ironia)!...

December 26, 2022 · 13 min · Mario Filho

Can Gradient Boosting Learn Simple Arithmetic?

During a technical meeting a few weeks ago, we had a discussion about feature interactions, and how far we have to go with them so that we can capture possible relationships with our targets. Should we create (and select) arithmetic interactions between our features? A few years ago I remember visiting a website that showed how different models approximated these simple operations. It went from linear models to a complex Random Forest....

January 20, 2020 · 4 min · Mario Filho

Como Fazer Stacking de Modelos de Machine Learning

Quem acompanha competições sabe que uma das coisas mais importantes é saber juntar vários modelos para criar uma solução poderosa. Várias pessoas já me perguntaram, por e-mail ou nas apresentações que fiz, sobre ensembles. Este é um assunto importante não apenas para competições, mas também para casos reais onde se quer extrair o máximo possível de performance dos modelos. Ensembles são conjuntos de modelos que oferecem uma performance melhor do que cada modelo que o compõe....

December 1, 2019 · 12 min · Mario Filho

Como Criar um Modelo Simples para Prever Séries Temporais Usando Machine Learning em Python

Quando tratamos da previsão de séries temporais um modelo amplamente utilizado é a regressão linear. Apesar de simples, ele tem se mostrado bastante útil em aplicações reais. Uma forma muito simples de criar um modelo para este caso é usar os dados anteriores da própria variável de interesse para prever o atual. É possível criar modelos que buscam prever estas séries utilizando outros atributos, o que em alguns casos vai melhorar a precisão dos mesmos....

November 29, 2019 · 8 min · Mario Filho

As Métricas Mais Populares para Avaliar Modelos de Machine Learning

Durante o processo de criação de um modelo de machine learning nós precisamos medir a qualidade dele de acordo com o objetivo da tarefa. Existem funções matemáticas que nos ajudam a avaliar a capacidade de erro e acerto dos nossos modelos, e agora você conhecerá algumas das mais utilizadas. Neste artigo, usarei a palavra métrica para me referir a essas funções. Tão importante quanto saber escolher um bom modelo, é saber escolher a métrica correta para decidir qual é o melhor entre eles....

May 6, 2018 · 11 min · Mario Filho

How To Predict Multiple Time Series At Once With Scikit-Learn (With a Sales Forecasting Example)

You got a lot of time series data points and want to predict the next step (or steps). What should you do now? Train a model for each series? Is there a way to fit a model for all the series together? Which is better? I have seen many data scientists think about approaching this problem by creating a single model for each product. Although this is one of the possible solutions, it’s not likely to be the best....

January 1, 2018 · 14 min · Mario Filho