Como Prever Séries Temporais Com LSTM em Python

O Que é LSTM (Long Short-Term Memory)? LSTM é um tipo de rede neural recorrente (RNN). Ela é capaz de manter um vetor interno de informações (o “estado”) por períodos de tempo mais longos que as redes neurais recorrentes primitivas. Montar as estruturas dessas redes neurais do zero é muito trabalhoso, mas temos bibliotecas que nos ajudam fazendo a maior parte do trabalho. Vamos usar a biblioteca NeuralForecast, que além de implementar as estruturas mais comuns de redes neurais recorrentes, também implementa a busca automática por hiperparâmetros....

January 25, 2023 · 16 min · Mario Filho

Como Prever Séries Temporais Univariadas Usando Python

De todos os tipos de previsão, prever o que ocorrerá no futuro com base em eventos passados pode ser uma das tarefas mais interessantes e desafiadoras. É aí que entra a previsão de séries temporais. Prever uma série temporal começa por supor que os padrões de comportamento observados no passado serão replicados no futuro. Uma das maneiras de fazer estas previsões é usando modelos estatísticos sobre séries univariadas, que é o que você vai aprender neste artigo usando Python....

January 23, 2023 · 16 min · Mario Filho

Validação de Séries Temporais Em Machine Learning Usando Python

Ao usar machine learning para prever séries temporais, você não pode simplesmente dividir seus dados entre treino e validação com um split aleatório. Se você fizer isso, seu modelo vai aprender a prever o passado com base no futuro e te dar uma estimativa altamente otimista (e errada) da performance em dados nunca vistos. Em praticamente todos os projetos reais de machine learning você terá uma dimensão temporal e jamais deve ignorá-la....

January 20, 2023 · 6 min · Mario Filho

Mean Average Precision (MAP) em Machine Learning

O Que é Mean Average Precision? Mean Average Precision (MAP) é uma métrica de avaliação em machine learning comumente usada para medir a performance de sistemas de recomendação e busca. Um outro caso de uso interessante é na avaliação de modelos de segmentação de imagem, onde você precisa detectar e segmentar vários objetos em uma mesma imagem. Uma analogia mais divertida para lembrar o que é a MAP é a seguinte:...

January 17, 2023 · 6 min · Mario Filho

NDCG (Normalized Discounted Cumulative Gain) em Machine Learning

O Que é NDCG? O NDCG é uma métrica de avaliação de desempenho que é especialmente útil para modelos de machine learning de ranking. Ela é muito usada em sistemas de busca e recomendação. Eu mesmo a usava para avaliar os sistemas de ranking de freelancers quando trabalhei na Upwork. Ele mede a qualidade de uma lista de resultados retornada pelo modelo em relação aos itens que o usuário realmente indicou como relevantes....

January 14, 2023 · 9 min · Mario Filho

MAPE (Erro Absoluto Percentual Médio) em Machine Learning

O Que é Erro Absoluto Percentual Médio ou MAPE? Erro absoluto percentual médio (MAPE) é uma métrica para avaliar modelos de regressão em machine learning. Ela é bastante utilizada na previsão de séries temporais, como previsão de demanda e precificação de ativos financeiros. O MAPE é expressado em porcentagem, que é fácil de entender para a maioria das pessoas e ajuda na comunicação de resultados para pessoas que não têm conhecimento técnico em machine learning....

January 11, 2023 · 8 min · Mario Filho

MAE (Erro Médio Absoluto) Em Machine Learning

O Que é Erro Médio Absoluto ou MAE? O erro médio absoluto (MAE) é uma métrica utilizada para avaliar o desempenho de modelos de regressão em machine learning. Ela mede a média da diferença absoluta entre os valores previstos pelo modelo e os valores observados. Imagine que você tenha um modelo de machine learning que foi treinado para prever o consumo de combustível de uma frota de veículos. Se o modelo prevê que um determinado veículo vai consumir 10 litros de combustível para percorrer 100 quilômetros, mas o consumo real foi de 12 litros, o erro absoluto da previsão seria de 2 litros....

January 10, 2023 · 5 min · Mario Filho

RMSE (Raiz Do Erro Quadrático Médio) Em Machine Learning

O Que é RMSE? A raiz do erro quadrático médio (RMSE ou root mean-square error em inglês) é uma métrica de avaliação amplamente utilizada e reconhecida na comunidade de machine learning para medir o desempenho de modelos de regressão. Ela é muito útil quando você precisa explicar o desempenho de um modelo para outras pessoas do time, pois elas já estarão acostumadas a trabalhar com essa métrica. Ela é calculada tomando-se a raiz quadrada da média dos quadrados dos erros, onde o erro bruto é a diferença entre o valor previsto pelo modelo e o valor real....

January 9, 2023 · 9 min · Mario Filho

Guia Completo da Log Loss (Perda Logarítmica) em Machine Learning

Índice O Que é Log Loss (Perda Logarítmica) e Como Interpretá-la? Qual a Fórmula da Log Loss? Classificação Binária Classificação Multiclasse Log Loss Durante o Treino vs Validação Como Calcular Log Loss Usando Scikit-learn em Python Como Calcular Log Loss Em R Diferenças Entre Log Loss e ROC AUC O Que é Log Loss (Perda Logarítmica) e Como Interpretá-la? Log loss (ou perda logarítmica) é uma métrica de avaliação de modelos de classificação em machine learning, tanto binários quanto multiclasse....

January 5, 2023 · 7 min · Mario Filho

Guia Completo Sobre ROC AUC Em Machine Learning

O Que É ROC AUC? ROC AUC é uma métrica de avaliação em machine learning usada para avaliar o desempenho de modelos de classificação. Seu nome significa Área Sob A Curva Característica de Operação do Receptor. Parece complicada, mas vou te explicar de maneira simples. Pense nesta curva como um gráfico que mostra a fração de positivos verdadeiros no eixo Y e a fração de falsos positivos no eixo X para diferentes pontos de corte da previsão atribuída pelo modelo aos exemplos....

January 4, 2023 · 10 min · Mario Filho