Bem-vindo ao desafio de projeto "Previsão de Estoque Inteligente na AWS com SageMaker Canvas. Neste Lab DIO, você aprenderá a usar o SageMaker Canvas para criar previsões de estoque baseadas em Machine Learning (ML). Siga os passos abaixo para completar o desafio!
- Navegue até a pasta
datasets
deste repositório. Esta pasta contém os datasets que você poderá escolher para treinar e testar seu modelo de ML. Sinta-se à vontade para gerar/enriquecer seus próprios datasets, quanto mais você se engajar, mais relevante esse projeto será em seu portfólio. - Escolha o dataset que você usará para treinar seu modelo de previsão de estoque.
- Faça o upload do dataset no SageMaker Canvas.
- No SageMaker Canvas, importe o dataset que você selecionou.
- Configure as variáveis de entrada e saída de acordo com os dados.
- Inicie o treinamento do modelo. Isso pode levar algum tempo, dependendo do tamanho do dataset.
- Após o treinamento, examine as métricas de performance do modelo.
- Verifique as principais características que influenciam as previsões.
- Faça ajustes no modelo se necessário e re-treine até obter um desempenho satisfatório.
- Use o modelo treinado para fazer previsões de estoque.
- Exporte os resultados e analise as previsões geradas.
- Documente suas conclusões e qualquer insight obtido a partir das previsões.
Para executar o SageMaker é necessário criar um Domínio, porém a Amazon não havia adicionado nenhuma cota para criação de domínio na minha conta.
Foi necessário solicitar o aumento da cota e aguardar a resposta da Amazon:
Utilizei o dataset: dataset-1000-com-preco-variavel-e-renovacao-estoque
. Esse dataset possui a ID do produto, preço, quantidade em estoque e data.
Seguindo a sugestão do SageMaker Canvas, escolhi para substituir os valores faltantes de preço pela média e de estoque por 0.
Selecionei como target a quantidade em estoque. Para o modelo o Time Series com predição para os próximos 3 dias.
Então executou-se o treino do modelo.
Terminado o treino foram retornadas as métricas
Segundo o guia do desenvolvedor do Amazon Forecast, a métrica Weighted Quantile Loss (wQL) mede a precisão de um modelo em um quantil especificado. É particularmente útil quando há custos diferentes de subprevisão e superprevisão.
-
P10 (0.1): espera-se que o valor verdadeiro seja menor do que o valor previsto 10% do tempo.
-
P50 (0.5): espera-se que o valor verdadeiro seja menor do que o valor previsto 50% do tempo. Isso também é conhecido como previsão mediana.
-
P90 (0.9): espera-se que o valor verdadeiro seja menor do que o valor previsto 90% do tempo.
O preço possui quase 49% de influência na previsão. O SageMaker Canvas marcou a coluna preço como faltando valores futuros.
Isso indica que, caso os valores futuros de preço sejam fornecidos o modelo pode ter uma melhor performance.
São retornadas as curvas (de cima para baixo) P90, P50 e P10.
A curva P50, que está mais próxima da média, parece ser mais recomendata para previsão. Porém esse dataset é bem pequeno. Tendo apenas valores para 3 datas. Um dataset maior levaria a uma melhor performance do modelo.