Você com certeza já entrou em algum site que te recomenda um produto que você está querendo muito comprar, nesse caso estamos falando de sistemas de recomendação.

Ou quem sabe você já utilizou o Spotify e não consegue entender como eles sabem aquela música que você gosta.

Em nosso post anterior aqui no blog, falamos sobre as diferenças entre business intelligence e data science, acesse aqui.

As pessoas em todos os campos operam com crenças e preconceitos. Na medida em que você pode eliminar ambos e substituí-los por dados, você obtém uma clara vantagem. Michael Lewis

Nesse post, que não é técnico, vou te esclarecer totalmente sobre como funcionam os sistemas de recomendação através de uma análise da utilização pelo Spotify.

Para tanto vou dividir esse post nas seguintes tópicos:

  • O que são sistemas de recomendação
  • Como o Spotify utiliza sistemas de recomendação
  • Como utilizar cultura data-driven em minha empresa

O que são sistemas de recomendação

Primeiramente você deve querer saber que relevância eu possuo para poder falar sobre esse assunto.

Na imagem abaixo você poderá me ver palestrando sobre algoritmos de recomendação em um dos meetups de Python que acontecem aqui em Belo Horizonte.

Meetup Python + Ruby

Um sistema de recomendação é um conjunto de técnicas e algoritmos que seleciona itens tendo como base os dados de interação e interesses dos usuários.

Segundo Melville e Sindhwani, 2010, os sistemas de recomendação surgem a partir da necessidade de filtrar a quantidade de opções disponíveis para o usuário, automatizando a geração de recomendações baseadas na análise dos dados.

Em um problema de recomendação, as principais entidades são o usuário e o item, o objetivo é recomendar os itens com melhores notas aos usuários.

São um tipo de sistema de aprendizagem computacional, e estamos falando de algumas aplicações mais singulares de machine learning.

São divididos em 3 grupos: Collaborative filtering, content-based filtering, hybrid recommender systems.

Content-based filtering

  • Cria recomendações de itens semelhantes aos já comprados / interagidos pelo usuário;
  • “Aprende” o perfil do usuário através dos itens anteriores;
  • Procura novos itens com “match” no perfil do usuário;
  • Recomenda os itens com a melhor taxa de “match”;

Collaborative Filtering

  • Quem comprou X também comprou Y;
  • Recomenda itens que usuários semelhantes já compraram / interagiram;
  • Através dos produtos já comprados / interagidos, procura usuários semelhantes;
  • Seleciona o produto com maior rating e que o usuário ainda não interagiu.
  • Hybrid Recommender Systems.

Hybrid Recommender Systems

  • Combina as abordagens de Content-based Filtering e Collaborative Filtering;

Formas de se trabalhar com Hybrid Recommender Systems:

  • Aplicação dos dois separados e juntá-los depois;
  • Adicionando capacidade de content-based a Collaborative Filtering (ou vice-versa);
  • Unificação das duas abordagens em um único modelo.

Context-aware Recommender Systems

  • Técnica muito recente e em desenvolvimento;
  • Gera recomendações muito mais personalizadas e abrangentes;
  • Abrange além de dados de usuários, dados do contexto que levaram ao acontecimento de determinado evento.

Como o Spotify utiliza sistemas de recomendação

Font: Spotify – www.spotify.com.br

No momento em que o Spotify faz recomendações de músicas ele utiliza um algoritmo de recomendação, este algoritmo tem o objetivo de criar análises através das músicas que você gosta e de diversas outras características específicas de cada usuário.

Para não ficar confuso um algoritmo consiste em uma sequência de instruções que deverão ser executadas especificamente em um intervalo de tempo.

Fonte: DevMedia – www.devmedia.com.br

O Spotify disponibilizou uma biblioteca para desenvolvedores, onde ele informa algumas características que utiliza e analisa em seus sistemas de recomendação, acesse aqui.

Seguem algumas dessas características.

Acústica – Uma medida de confiança de 0,0 a 1,0 que define se a música é acústica ou não.

Dançabilidade – Aqui temos um indicador se uma música é adequada para dança, o embasamento surge a partir da combinação de elementos musicais, onde é analisado tempo, estabilidade do ritmo, força da batida, também falamos de uma medida entre 0,0 e 1,0.

Duração – Tempo da música em milissegundos.

Energia – Outra medida entre 0,0 e 1,0 que representa uma medida perceptual de intensidade e atividades, músicas no estilo metal tem alta energia e pontuação alta, enquanto musicas classicas tem energia baixa nessa pontuação.

Identidade – O Spotify cria um número de identificação para todas as músicas.

Instrumentalidade – Identifica se uma faixa possui contêm sons vocais ou não.

Vivacidade – Aqui os algorítimos de recomendação do Spotify buscam detectar a se existe um público na gravação ou não.

Sonoridade – Entendimento do volume total de uma faixa em decibéis (dB). Durante toda a música são calculados valores da sonoridade daquela faixa.

Fala – Através da fonoaudiologia o Spotify consegue identificar se naquela faixa existem mais palavras faladas.

Tempo – Aqui falamos sobre a estimativa de batidas por minuto (BPM) dentro de uma música.

Essas são apenas algumas características que o próprio Spotify nos informa.

Basicamente, sistemas de recomendações buscam classificar determinadas características e após isso recomendar para um público específico, este público também é classificado, dessa forma é possível levar uma música certa para um usuário, baseado nas características das músicas e dos usuários.

Perceba que todas as características levantadas acimas, que são chamadas tecnicamente de features, possuem pesos específicos,  dessa forma é possível saber quais são as músicas que são mais indicadas para cada tipo de perfil de usuário.

No diagrama a seguir você entenderá melhor sobre o que acabo de falar.

 

Outra forma de você entender sobre os sistemas de recomendação é através da utilização da Amazon, quando recomenda produtos.

Aqui na PredictBox auxiliamos empresas a entenderem melhor sobre como trabalhar com seus dados, em nosso plano data driven inception você terá um braço para conseguir implementar sistemas de recomendação em sua empresa, fale com um de nossos consultores clicando aqui.

Dados interessantes sobre o Spotify

Peguei referências do Ali Sarrafi, VP of analytics da Combiant AB e anteriormente Product Development Lead, Data and Analytics da Spotify.

Serviço de streaming de música mais popular do mundo

  • Mais de 30 milhões de assinantes pagantes;
  • Mais de 100 milhões de usuários ativos;
  • Mais de 30 milhões de músicas;
  • Mais de 2 bilhões de playlists;
  • Disponível em 59 mercados;
  • Mais de 38 terabytes de dados recebidos por dia;
  • Mais de 70 petabytes de dados armazenados permanentemente sobre músicas, listas de reprodução.

Por que os dados são tão importantes para o Spotify?

Spotify entrega muito valor para a particularidade de cada usuário, além de gerar muitos dados para os artistas

O Spotify utiliza seus dados com as seguintes funções: Insights de produtos, insights de marketing, insights de conteúdo, informações sobre finanças.

Metodología essencial para o trabalho do Spotify

  • Dados;
  • Intuições;
  • Crenças;
  • Apostas;

Segundo Ali Sarrafi define: O aplicativo Spotify é um conjunto gigantesco de experimentos e perguntas que estamos fazendo a nossos usuários.

Em outro texto falamos: Porque as empresas devem usar análise preditiva nas decisões empresariais, clique aqui para ler.

Principal aprendizado com o Spotify: Aprenda rápido, falhe rápido, fique à frente

  1. Outras dicas sobre como criar a cultura data driven em sua empresa:
  2. Ter dados limpos e de alta qualidade é ineficaz se a equipe não puder acessá-los.
  3. As organizações orientadas por dados precisam promover uma cultura em que todos saibam quais dados estão disponíveis.
  4. Os dados não estão lá para reforçar (ou minar) as decisões existentes, mas para ajudar a informar as futuras.

Como utilizar cultura data-driven em minha empresa

Risco de não ser orientado por dados

Se você está focado no concorrente, você tem que esperar até que haja alguém fazendo algo, o foco no cliente permite que você seja mais pioneiro. – Jeff Bezos

Pense comigo.

Vamos estabelecer um cenário fictício:

  1. Um departamento de vendas tem que seguir com novos leads dentro de 24 horas;
  2. Um novo lead de R$ 10 mil vem na segunda feira, mas o gerente de vendas não teve tempo para revisar o relatório diário;
  3. Na terça feira, o gerente finalmente solicita ao dono do lead um status;
  4. O dono do lead admite que “não teve tempo” para entrar em contato com o cliente e, quando faz, descobre que o cliente fechou com o concorrente.

Por não ser orientado por dados, sua empresa:

  1. Vai perder R$ 10 mil em receita deste cliente;
  2. Perderá qualquer forma de vendas por recorrência deste possível cliente;

Se eles são orientados por dados:

A mágica, que não tem nada de mágica, acontece.

  • O dono do lead e o gerente são notificados automaticamente sobre o lead;
  • O cliente recebe um “e-mail marketing” na segunda feira mesmo;
  • O representante e o gerente são lembrados após 24 horas, se não houver contato;
  • Uma atividade de acompanhamento é agendada automaticamente para terça-feira;

Dados fazem com que você se concentre no cliente.

Portanto algumas dicas para tornar seu negócio data driven, assim como o Spotify.

  • Aposte na diferenciação.
  • Use dados no seu negócio. Use dados para saber como está sua empresa e ajuste o plano e a estratégia.
  • Personalize os seus dados.
  • Crie parcerias para conseguir mais dados, o que pode maximizar sua receita.

Perguntas para se fazer no processo

  • Você vai usar dados como um serviço ou produto?
  • Quão maduro você é? Coletor de dados, usuário de dados; orientado por dados, atento aos dados ou mestre de dados?
  • Que tipos de dados você tem à sua disposição?
  • Você definiu métricas antecipadamente?
  • O que você está medindo está correto?

No post que escrevi recentemente para o blog inteligencia da Rock Content, falei sobre a verdade por traz do big data, o grande problema do século 21, acesse aqui.

Conclusão

Organizações orientadas a dados conseguem um enorme diferencial competitivo das demais.

A tecnologia aliada a criatividade consegue fazer coisas realmente incríveis.

Para entender toda engenharia de valor levada a seus clientes e estruturar seus dados para receber algoritmos de recomendação, fique a vontade para entrar em contato com os consultores da PredictBox.

Basta clicar aqui.

Espero que tenham gostado do post.

Deixe suas dúvidas e sugestões nos comentários.