Sistemas de Recomendação: A Engenharia Invisível que Move o Mundo Digital

me de um resumo e palavras chaves Se você usa Netflix, Spotify ou Amazon, você já está sob influência direta de um sistema de recomendação.

Eles não apenas sugerem conteúdo.
Eles moldam comportamento, consumo e descoberta.

E quem domina isso, domina retenção.

O que é um Sistema de Recomendação?

É um conjunto de algoritmos que prevê o que um usuário provavelmente deseja consumir com base em:

Histórico de interações
Similaridade entre usuários
Similaridade entre itens
Contexto
Dados implícitos (tempo de permanência, skips, repetição)
Dados explícitos (likes, avaliações)

Não é “mágica”. É estatística aplicada com inteligência estratégica.

Os 3 Modelos Clássicos 1.Filtragem Colaborativa (Collaborative Filtering)

Baseia-se no comportamento coletivo. “Usuários parecidos com você gostaram disso.” Muito usada por plataformas como Netflix. Problema clássico: ao iniciar, a pessoa não vai ter nenhuma recomendação

Filtragem Baseada em Conteúdo

Recomenda com base nas características do item.

Exemplo em música:

BPM
Tom
Gênero
Timbre
Energia

O Spotify combina isso com análise acústica profunda.

Modelos Híbridos

Combinação dos dois anteriores. Porque comportamento + semântica = precisão real. O Verdadeiro Diferencial Não Está no Algoritmo

Está em três fatores:

✔ Coleta de dados bem estruturada: Sem evento bem definido, não existe IA.

✔ Engenharia de Features: O modelo aprende apenas o que você permite que ele enxergue.

✔ Objetivo claro Você quer:

Maximizar tempo de uso?
Descoberta?
Diversificação?
Receita?

Cada objetivo gera um modelo diferente.

O teorema de Bayes

A fórmula é:

$$ P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)} $$

Onde:

$P(A|B)$ → Probabilidade de A dado B (probabilidade posterior)
$P(B|A)$ → Probabilidade de observar B se A for verdadeiro
$P(A)$ → Probabilidade inicial (prior)
$P(B)$ → Probabilidade total de B ocorrer

Por que Bayes é usado em recomendação?

Porque recomendação é um problema probabilístico.

Queremos responder: Qual é a probabilidade de um usuário gostar de um item, dado seu comportamento?

Isso é exatamente:

$$ P(\text{Gostar} \mid \text{Histórico}) $$

Bayes permite atualizar essa probabilidade continuamente conforme novos dados surgem. Assim aumentando a precisão da recomendação cada vez mais.

Aplicando Bayes em Cada Modelo

1. Filtragem Colaborativa

Pergunta central:

$$ P(\text{Usuário U gostar da Música M} \mid \text{Usuários semelhantes gostaram}) $$

Entende-se:

P(A) → Probabilidade média de U gostar de músicas similares
P(B|A) → Probabilidade de usuários parecidos gostarem de M
Atualizamos a chance com base no comportamento coletivo

Isso transforma similaridade em inferência probabilística.

2. Filtragem Baseada em Conteúdo

Agora a pergunta muda:

$$ P(\text{Gostar da Música M} \mid \text{Características da Música}) $$

Se um usuário consome majoritariamente:

Metal técnico
BPM alto
Tonalidade menor
Alta distorção

Podemos calcular:

$$ P(\text{Gostar} \mid \text{Alta energia, tom menor, 180 BPM}) $$

Cada métrica atua como um peso, e podemos calcular isso.

3. Modelos Híbridos

Aqui temos múltiplas métricas:

Similaridade de usuários
Similaridade de conteúdo
Tempo de escuta
Skip rate
Repetição

O modelo calcula:

$$ P(\text{Engajamento Alto} \mid \text{Dados Colaborativos + Conteúdo + Comportamento}) $$

Isso é inferência bayesiana aplicada em múltiplas variáveis.

Exemplo Aplicado no meu TCC, o Starting Music

No sistema, o objetivo não é apenas recomendar o que o usuário já consome. É diversificar de forma inteligente, fazendo artistas iniciantes serem divulgados. Vamos estruturar isso matematicamente:

Problema:

Recomendar artistas iniciantes com base no gosto do usuário, mas incentivando descoberta.

Definimos:

A = Usuário gostar de um artista iniciante X B = Histórico musical do usuário

Queremos:

$P(A|B)$

Mas agora adicionamos um fator estratégico:

C = Similaridade estrutural entre artista conhecido e artista iniciante

Então:

$P(A|B, C)$

Ou seja: Probabilidade de o usuário gostar de um artista novo dado seu histórico e dado que esse artista compartilha padrões musicais semelhantes aos já consumidos.

Isso permite:

Reduzir risco de rejeição
Aumentar descoberta
Diversificar catálogo
Evitar bolha extrema

Aqui estamos aplicando inferência probabilística para expandir o horizonte musical do usuário, baseado no gosto dele e sempre em artistas novos.

Link para repo: https://github.com/SameDev/StartingMusicAI