me de um resumo e palavras chaves Se você usa Netflix, Spotify ou Amazon, você já está sob influência direta de um sistema de recomendação.
- Eles não apenas sugerem conteúdo.
- Eles moldam comportamento, consumo e descoberta.
E quem domina isso, domina retenção.
O que é um Sistema de Recomendação?
É um conjunto de algoritmos que prevê o que um usuário provavelmente deseja consumir com base em:
- Histórico de interações
- Similaridade entre usuários
- Similaridade entre itens
- Contexto
- Dados implícitos (tempo de permanência, skips, repetição)
- Dados explícitos (likes, avaliações)
Não é “mágica”. É estatística aplicada com inteligência estratégica.
Os 3 Modelos Clássicos
1.Filtragem Colaborativa (Collaborative Filtering)
Baseia-se no comportamento coletivo. “Usuários parecidos com você gostaram disso.” Muito usada por plataformas como Netflix. Problema clássico: ao iniciar, a pessoa não vai ter nenhuma recomendação
- Filtragem Baseada em Conteúdo
Recomenda com base nas características do item.
Exemplo em música:
- BPM
- Tom
- Gênero
- Timbre
- Energia
O Spotify combina isso com análise acústica profunda.
- Modelos Híbridos
Combinação dos dois anteriores. Porque comportamento + semântica = precisão real. O Verdadeiro Diferencial Não Está no Algoritmo
Está em três fatores:
✔ Coleta de dados bem estruturada: Sem evento bem definido, não existe IA.
✔ Engenharia de Features: O modelo aprende apenas o que você permite que ele enxergue.
✔ Objetivo claro Você quer:
- Maximizar tempo de uso?
- Descoberta?
- Diversificação?
- Receita?
Cada objetivo gera um modelo diferente.
O teorema de Bayes
A fórmula é:
$$ P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)} $$
Onde:
- $P(A|B)$ → Probabilidade de A dado B (probabilidade posterior)
- $P(B|A)$ → Probabilidade de observar B se A for verdadeiro
- $P(A)$ → Probabilidade inicial (prior)
- $P(B)$ → Probabilidade total de B ocorrer
Por que Bayes é usado em recomendação?
Porque recomendação é um problema probabilístico.
Queremos responder: Qual é a probabilidade de um usuário gostar de um item, dado seu comportamento?
Isso é exatamente:
$$ P(\text{Gostar} \mid \text{Histórico}) $$
Bayes permite atualizar essa probabilidade continuamente conforme novos dados surgem. Assim aumentando a precisão da recomendação cada vez mais.
Aplicando Bayes em Cada Modelo
1. Filtragem Colaborativa
Pergunta central:
$$ P(\text{Usuário U gostar da Música M} \mid \text{Usuários semelhantes gostaram}) $$
Entende-se:
- P(A) → Probabilidade média de U gostar de músicas similares
- P(B|A) → Probabilidade de usuários parecidos gostarem de M
- Atualizamos a chance com base no comportamento coletivo
Isso transforma similaridade em inferência probabilística.
2. Filtragem Baseada em Conteúdo
Agora a pergunta muda:
$$ P(\text{Gostar da Música M} \mid \text{Características da Música}) $$
Se um usuário consome majoritariamente:
- Metal técnico
- BPM alto
- Tonalidade menor
- Alta distorção
Podemos calcular:
$$ P(\text{Gostar} \mid \text{Alta energia, tom menor, 180 BPM}) $$
Cada métrica atua como um peso, e podemos calcular isso.
3. Modelos Híbridos
Aqui temos múltiplas métricas:
- Similaridade de usuários
- Similaridade de conteúdo
- Tempo de escuta
- Skip rate
- Repetição
O modelo calcula:
$$ P(\text{Engajamento Alto} \mid \text{Dados Colaborativos + Conteúdo + Comportamento}) $$
Isso é inferência bayesiana aplicada em múltiplas variáveis.
Exemplo Aplicado no meu TCC, o Starting Music
No sistema, o objetivo não é apenas recomendar o que o usuário já consome. É diversificar de forma inteligente, fazendo artistas iniciantes serem divulgados. Vamos estruturar isso matematicamente:
Problema:
Recomendar artistas iniciantes com base no gosto do usuário, mas incentivando descoberta.
Definimos:
A = Usuário gostar de um artista iniciante X B = Histórico musical do usuário
Queremos:
$P(A|B)$
Mas agora adicionamos um fator estratégico:
C = Similaridade estrutural entre artista conhecido e artista iniciante
Então:
$P(A|B, C)$
Ou seja: Probabilidade de o usuário gostar de um artista novo dado seu histórico e dado que esse artista compartilha padrões musicais semelhantes aos já consumidos.
Isso permite:
- Reduzir risco de rejeição
- Aumentar descoberta
- Diversificar catálogo
- Evitar bolha extrema
Aqui estamos aplicando inferência probabilística para expandir o horizonte musical do usuário, baseado no gosto dele e sempre em artistas novos.
Link para repo: https://github.com/SameDev/StartingMusicAI
