Previsão de Vendas

Análise de Dados

1. Introdução

Este projeto de análise de dados consiste em realizar uma previsão de vendas através de 3 variáveis que são os investimentos da empresa em propagandas para TV, rádio e jornal.

Para isso eu usei um arquivo .ipynb e utilizei as bibliotecas Pandas, Seaborn, MatPlot e SKLearn.

2. Analisando a Base de Dados

De início eu apenas importei o arquivo csv, contendo dados anteriores, analisei seu display e suas informações.

A base veio sem erros para serem corrigidos, o que facilitou bastante o trabalho pois já que não havia erros na tabela eu pude partir direto para a fase de análise exploratória.

3. Análise Exploratória

Criando um heatmap da correlação entre os itens na tabela já ficou óbvio que a relação de TV com vendas sendo a mais correlação mais estável, seguida por rádio e jornal.

Heatmap de Correlação na Base de Dados

4. Criando as Máquinas Preditivas

Para realizar a previsão de vendas eu criei duas máquinas, uma utilizando o método de Regressão Linear que chegou a uma acurácia de 90,71% e outra máquina utilizando o método de Árvore de Decisão que chegou a uma acurácia de 96,35%

Gráfico de linha comparando resultado de teste com respostas das máquinas preditivas

5. Testando a Máquina Preditiva

Já que a máquina preditiva de árvore de decisão obteve o maior nível de acurácia eu utilizei ela para testar uma segunda base de dados contendo apenas os valores de investimento em TV, rádio e jornal, no fim da previsão eu obtive os seguintes resultados para as vendas:

TV Rádio Jornal Vendas
23.1k 3.8k 69.2k 7.6M
44.5k 0 5.1k 8.9M
170.2k 45.9k 0 19.9M
Ver Análise Completa