1. Introdução
Este projeto de análise de dados consiste em realizar uma previsão de vendas através de 3 variáveis que são os investimentos da empresa em propagandas para TV, rádio e jornal.
Para isso eu usei um arquivo .ipynb e utilizei as bibliotecas Pandas, Seaborn, MatPlot e SKLearn.
2. Analisando a Base de Dados
De início eu apenas importei o arquivo csv, contendo dados anteriores, analisei seu display e suas informações.
A base veio sem erros para serem corrigidos, o que facilitou bastante o trabalho pois já que não havia erros na tabela eu pude partir direto para a fase de análise exploratória.
3. Análise Exploratória
Criando um heatmap da correlação entre os itens na tabela já ficou óbvio que a relação de TV com vendas sendo a mais correlação mais estável, seguida por rádio e jornal.
4. Criando as Máquinas Preditivas
Para realizar a previsão de vendas eu criei duas máquinas, uma utilizando o método de Regressão Linear que chegou a uma acurácia de 90,71% e outra máquina utilizando o método de Árvore de Decisão que chegou a uma acurácia de 96,35%
5. Testando a Máquina Preditiva
Já que a máquina preditiva de árvore de decisão obteve o maior nível de acurácia eu utilizei ela para testar uma segunda base de dados contendo apenas os valores de investimento em TV, rádio e jornal, no fim da previsão eu obtive os seguintes resultados para as vendas:
TV | Rádio | Jornal | Vendas |
23.1k | 3.8k | 69.2k | 7.6M |
44.5k | 0 | 5.1k | 8.9M |
170.2k | 45.9k | 0 | 19.9M |