SOBRE NÓS
data-science
Simples como uma reta: A regressão no MMM
August 22, 2025
words by  
Uncover
  1. Matemática no Marketing: A estatística é essencial para decifrar padrões e prever vendas com base em dados de campanhas.
  2. Regressão Linear Simples: Utiliza uma variável independente (como gastos em marketing) para prever uma variável dependente (vendas), representada por uma linha reta.
  3. Regressão Linear Múltipla: Considera múltiplos fatores, como preço e economia, para criar previsões mais precisas e robustas, capturando a complexidade do mercado.

Matemática como Linguagem do Marketing

Desde os tempos antigos, a matemática é vista como a linguagem do universo, capaz de descrever desde o movimento dos planetas até o crescimento das plantas. No contexto do marketing, a matemática nos permite decifrar padrões ocultos nas quantidades infindáveis de dados geradas pelas campanhas publicitárias, principalmente por meio da estatística. A seguir, explicamos uma das principais ferramentas numéricas que estruturam uma análise de Marketing Mix Modeling, a Regressão.

Regressão Linear: A Simplicidade da Reta

O MMM é tanto uma análise quanto uma previsão. No fim das contas, o que estamos querendo fazer é estimar valores que inicialmente não poderiam ser previstos. Na estatística, a ferramenta mais simples e didática para fazer esse trabalho é a regressão linear. A regressão é uma equação para se estimar o valor esperado de uma variável y, dados os valores de algumas outras variáveis x.

Vamos, a título de exemplo, criar um modelo muito elementar, onde utilizamos dados de gastos em marketing para prever vendas futuras com uma regressão linear simples.

Exemplo: Uma relação entre investimento e vendas

Usando dados fictícios de 12 meses podemos tentar prever as vendas para os próximos 3 meses com base nos gastos em marketing.

Mês Gastos em Marketing (R$)
Vendas (R$)
1 1,000 15,000
2 2,000 18,000
3 3,000 25,000
4 4,000 27,000
5 5,000 30,000
6 6,000 32,000
7 7,000 33,000
8 8,000 34,000
9 9,000 36,000
10 10,000 37,000
11 11,000 38,000
12 12,000 39,000


E agora vamos supor os seguintes gastos em marketing para os próximos 3 meses:

Mês Vendas (R$)
13 13,000
14 14,000
15 15,000


Finalmente, usamos a regressão linear para prever as vendas para os meses 13, 14 e 15


Pontos Azuis
: Representam os dados reais de gastos em marketing e vendas dos 12 meses iniciais.


Linha
: Representa a linha de regressão linear ajustada aos dados.


Pontos Roxos
: Representam as previsões de vendas para os meses 13, 14 e 15 com base nos gastos em marketing previstos.

A regressão linear simples segue a fórmula:


Y = β0​ + β1​X


Onde:

Y é o valor das vendas previstas
β0 é a constante

β1 é o coeficiente de inclinação

X é a variável independente (gastos em marketing)

Você pode experimentar fazer uma regressão simples com os seus dados de marketing e vendas, usando o comando PREVISÃO.LINEAR no excel.

Incorporando Múltiplos Fatores

Embora a regressão linear simples seja útil para prever uma variável dependente (como vendas) com base em uma única variável independente (como gastos em marketing), na realidade, no MMM calculamos a influência de múltiplos fatores. Para capturar essa complexidade, utilizamos a regressão linear múltipla.

Na regressão linear múltipla, consideramos várias variáveis independentes (por exemplo, gastos em marketing, preço do produto, condições econômicas) para prever a variável dependente (vendas). A fórmula da regressão linear múltipla é uma extensão da fórmula da regressão linear simples e pode ser escrita assim:

Y = β0 ​+ β1​X1 + β2​X2 + β3​X3 + ϵ


Onde:

Y são as vendas previstas
X1 são os gastos em marketing
X2 é o preço do produto
X3 é a taxa de crescimento econômico
β0​, β1​, β2​, β3​ são os coeficientes do modeloϵ é o erro

Ao usar a regressão linear múltipla, podemos prever as vendas levando em consideração não apenas os gastos em marketing, mas também outros fatores que podem influenciar o resultado. Isso torna as previsões mais robustas e precisas, refletindo melhor a realidade complexa do mercado.

Exemplo Prático de Regressão Linear Múltipla:

Suponha que, além dos gastos em marketing, também tenhamos dados sobre o preço do produto e a taxa de crescimento econômico nos últimos 12 meses. Podemos usar esses três fatores para criar um modelo de regressão linear múltipla que preveja as vendas para os próximos 3 meses. A fórmula ajustada seria:

Y = β0 ​+ β1​(Gastos em Marketing) + β2​(Preço do Produto) + β3​(Crescimento Econômico) + ϵ


Vamos então criar mais um conjunto de dados fictícios para as variáveis mencionadas, considerando três variáveis independentes (gastos em marketing, preço do produto e taxa de crescimento econômico) para prever uma variável dependente (vendas).

Mês Gastos em Marketing (X1) Preço do Produto (X2) Taxa de Crescimento Econômico (X3) Vendas (Y)
1 2.5 100 2 30
2 3 95 2.5 35
3 3.5 98 3 38
4 4 90 3.5 40
5 2 105 1.5 28
6 2.2 110 1 27
7 3.8 97 2.8 39
8 4.2 93 3.2 42
9 3 100 2.4 34
10 3.5 102 2.7 37
11 4 94 3.6 41
12 2.8 107 1.8 29


Gastos em Marketing (X1): Em milhões de reais

Preço do Produto (X2): Em reais

Taxa de Crescimento Econômico (X3): Em porcentagem

Vendas (Y): Em milhões de unidades

Como os Coeficientes da fórmula são Calculados?

Os coeficientes são calculados usando o método dos mínimos quadrados. Esse método ajusta a linha que minimiza a soma dos quadrados das diferenças entre os valores reais e os valores previstos pelo modelo. O cálculo dos coeficientes envolve os seguintes passos:

Organizar os dados em uma matriz.

Multiplicar a matriz de dados pela sua transposta.

Calcular a inversa da matriz resultante.

Multiplicar o resultado pelo vetor de valores observados (vendas).

A função de regressão linear do Excel faz esse cálculo automaticamente. Ver PROJ.LIN

Coeficientes Calculados

Com base nos cálculos, os coeficientes da equação de regressão linear múltipla são:

β0 ​= 28.04

β1 ​= 4.58 (para Gastos em Marketing)

β2​ = −0.12 (para Preço do Produto)

β3 ​= 1.64 (para Taxa de Crescimento Econômico)

Assim, a equação de regressão para prever as vendas (Y) é:

Y = 28.04 + 4.58×X1 −0.12×X2 + 1.64×X3

Previsão para os Próximos 3 Meses

Agora, vamos prever as vendas para os próximos 3 meses, supondo que temos as seguintes condições futuras:

Mês Gastos em Marketing (X1) Preço do Produto (X2) Taxa de Crescimento Econômico (X3)
13 3.2 101 2.9
14 3.6 98 3.1
15 3.8 100 3

Resultados das Previsões

As previsões para as vendas nos próximos 3 meses são:

Mês 13: 35.41 milhões de unidades

Mês 14: 37.93 milhões de unidades

Mês 15: 38.44 milhões de unidades

Incorporando o Erro

O termo de erro ϵ representa a diferença entre o valor real observado das vendas Y e o valor previsto pelo modelo de regressão. O erro captura as variações nos dados que não são explicadas pelas variáveis independentes incluídas no modelo.

ϵ = Y(real) - Y


O erro pode ser causado por:

Fatores não incluídos no modelo: Como o modelo só leva em conta os gastos em marketing, preço do produto e taxa de crescimento econômico, qualquer outro fator que influencie as vendas (como sazonalidade, mudanças de comportamento do consumidor, etc.) será capturado no erro.

Ruído aleatório: Pequenas variações que ocorrem naturalmente nos dados e não seguem um padrão específico.

Previsão e Cálculo do Erro

Suponha que para o mês 13, os valores das variáveis sejam:

Gastos em Marketing (X1) = 3.2

Preço do Produto (X2) = 101

Taxa de Crescimento Econômico (X3) = 2.9

Usando a equação, a previsão seria:

Y13​ = 25+3.5(3.2) − 0.2(101) +1.8(2.9) = 34.46 unidades

Se as vendas reais no mês 13 foram 36 unidades, o erro seria:

ϵ13​ = Yreal ​− Y = 36 − 34.46 = 1.54 unidades

Conclusão

O erro ϵ é uma parte fundamental da análise de regressão, pois representa as variações que o modelo não conseguiu capturar. Ele nos ajuda a entender a precisão do modelo e a identificar áreas onde ele pode ser melhorado. Ao analisar os erros de forma sistemática, a empresa pode ajustar suas estratégias e melhorar suas previsões futuras.

TAGS
data-science