Algoritmos de recomendação: mais presente no dia a dia do que você pensa

Algoritmos de recomendação: mais presente no dia a dia do que você pensa

Por Matheus Morandino e Michelly Rodrigues

Não é incomum que uma série de anúncios filtrados tomem conta da sua tela após a busca de um produto na Internet ou ao criar uma rede social, surgem diversas sugestões de amizade de pessoas que você, de fato, conhece. Sem esquecer daquela música especial que foi recomendada pelo Youtube. Pode-se citar vários exemplos, mas todos possuem algo em comum: o uso de sistemas de recomendação.

Tais sistemas utilizam amplamente o conceito de “big data”, o maciço de informações geradas por todos os seus usuários. Essas informações são então estudadas para encontrar padrões de comportamento entre as ações antigas de um usuário e assim fornecer recomendações para novas compras, notícias, etc. Sabendo disso, todos esses sistemas de recomendação podem ser formalizados usando uma simples pergunta “Para um dado grupo de clientes e suas ações, quais são os produtos que forneceriam a melhor utilidade para cada cliente neste grupo?”. Uma motivação forte e suficiente para o uso desses sistemas são os ganhos reais, tanto financeiramente, pois com o melhor desempenho da plataforma as vendas aumentam, quanto socialmente, facilitando a vida dos consumidores na busca por produtos desejados.

Um sistema de recomendação é uma aplicação de aprendizado de máquina (do inglês machine learning) para negócios que, por meio de modelagem de dados e aplicação de algoritmos, tentam prever a nota (rating) ou preferência de um usuário a um determinado item. Assim, tais sistemas são classificados de acordo com o tipo de algoritmo usado, são eles os principais: Filtragem colaborativa, filtragem baseada em conteúdo e sistemas híbridos.

Filtragem colaborativa foca na interação entre o usuário e conteúdo, recomendando itens que usuários semelhantes compraram ou interagiram.  Dessa forma, a partir dos itens comprados ou interagidos pelo usuário A, o sistema busca por usuários semelhantes que tiveram um comportamento igual ou similar e seleciona itens que o usuário A ainda não interagiu. Por conseguinte, recomenda itens com a maior nota entre os usuários semelhantes (note que esse tipo de algoritmo segue a abordagem “quem comprou X também comprou Y”). No entanto, uma das suas desvantagens é que algoritmos de filtragem colaborativa exige uma quantidade considerável de dados e feedback dos usuários para gerar recomendação.

Filtragem baseada em conteúdo gera as recomendações com base na similaridade do conteúdo já consumido pelo usuário, seu processo consiste em cruzar os atributos do perfil do usuário (interesses e preferências) com os atributos dos itens, para recomendar ao usuário novos itens. Ou seja, o usuário é colocado numa bolha de preferência, onde tudo que é recomendado é semelhante ao que já foi consumido, o que pode ser uma desvantagem, uma vez que a longo prazo, essa bolha de preferência pode levar ao desinteresse do usuário nas recomendações.

Filtragem colaborativa e filtragem baseada em conteúdo
Fonte: https://medium.com/analytics-vidhya/collaborative-based-recommendation-system-using-svd-9adc5b6b3b8

Os sistemas híbridos são algoritmos que combinam filtragem colaborativa e filtragem baseada em conteúdo. Eles podem ser combinados de diversas formas, sendo que, aplicar os dois algoritmos e juntar seus resultados depois é o mais comum. Geralmente, sistemas híbridos possuem um resultado melhor, uma vez que as desvantagens dos tipos citados acima são amenizadas. Além disso, existem outros algoritmos mais complexos que necessitam de mais dados para gerar recomendações mais personalizadas e específicas possíveis.

De fato, sistemas de recomendação são extremamente valiosos no contexto atual, uma vez que o consumo de mídias digitais, comércio eletrônico e outros setores que viram o meio digital como alternativa cresceu exponencialmente nas últimas décadas. No entanto, outras questões também são levantadas: o uso dos dados e a privacidade do usuário. A precisão de algoritmos de recomendação depende de uma grande quantidade de dados, que é gerada todo dia, a todo instante. Um exemplo disso é o Facebook (que possui sistemas de recomendação extremamente robustos): estima-se que 4 petabytes de dados são gerados por dia.

O problema se encontra na forma com que esses dados são coletados, tratados e comercializados. Até que ponto recolher dados de hábitos de consumo, preferências e até mesmo informações consideradas sensíveis não entra em conflito com o direito à privacidade do usuário? Serviços até então gratuitos acabam coletando e comercializando dados de forma sutil, mas indiscriminada. Tudo isso em um contexto de incerteza quanto à vigência da Lei Geral de Proteção de Dados e um “li e aceito as políticas de privacidade e termos de uso” que, em muitos casos, não concordamos.

Por fim, é claro que tal tecnologia hoje é presente em quase todos os aspectos da vida digital, seja no âmbito social com redes sociais ou para o comercial e privado em sites de notícias e vendas. Com isso é inegável a realidade de que os sistemas de recomendação tem um enorme impacto, não apenas nas ações de simples sistemas como também no comportamento daqueles que os utilizam. Por isso, é essencial que usuários estejam cientes de como os seus dados pessoais estão sendo usados para modificar suas experiências online, além de como essas informações são capazes de influenciar seus próprios hábitos e opiniões.

Referências Bibliográficas

TAKAHASHI, Marcos M. Estudo comparativo de Algoritmos de Recomendação. 2015. Trabalho de Conclusão de Curso (Bacharelado em Ciências da Computação) – Universidade de São Paulo, São Paulo, 2015. p. 6-14. Disponível em: <https://bcc.ime.usp.br/tccs/2014/marcost/monografia_final.pdf>  Acesso em: 20 maio 2020.

YAO, Jianan; G. HAUPTMANN, Alexander. News Recommendation and Filter Bubble. 6th International Workshop on News Recommendation and Analytics, Proceedings of the CIKM 2018 Workshops, v. 2482, n. 11, 17 maio 2019. Disponível em: <http://ceur-ws.org/Vol-2482/paper11.pdf>. Acesso em: 20 maio 2020.

TUFEKCI, Zeynep. How Recommendation Algorithms Run the World. Wired, 22 abril 2019. Disponível em:<https://www.wired.com/story/how-recommendation-algorithms-run-the-world/>. Acesso em: 20 maio 2020.

SADAGOPAN, Swathi. Feedback loops and echo chambers: How algorithms amplify viewpoints. The Conversation. 4 fevereiro 2019. Disponível em: <https://theconversation.com/feedback-loops-and-echo-chambers-how-algorithms-amplify-viewpoints-107935>. Acesso em: 20 maio 2020.

KORDÍK, Pavel. Machine Learning for Recommender systems – part 1 (algorithms, evaluation and cold start). Medium, 3 junho 2018. Disponível em: <https://medium.com/recombee-blog/machine-learning-for-recommender-systems-part-1-algorithms-evaluation-and-cold-start-6f696683d0ed>. Acesso em: 28 maio 2020.

SANTANA, Marlesson. Deep Learning para Sistemas de Recomendação (Parte 1) – Introdução. Medium, 6 dezembro 2018. Disponível em: <https://medium.com/data-hackers/deep-learning-para-sistemas-de-recomenda%C3%A7%C3%A3o-parte-1-introdu%C3%A7%C3%A3o-b19a896c471e>. Acesso em: 28 maio 2020.

WIENER, Janet; BRONSON, Nathan. Facebook’s Top Open Data Problems. Facebook Research, 22 outubro 2014. Disponível em: <https://research.fb.com/blog/2014/10/facebook-s-top-open-data-problems/>. Acesso em: 13 de julho de 2020.

Fonte da imagem de capa: http://jogjacourse.com/kursus-spss-machine-learning-dan-ai-foundations-clustering-dan-association/