Investigadores de la Universidad de Toronto presentan un análisis profundo de los algoritmos avanzados que se utilizan en los sistemas modernos de recomendación de contenido y publicidad. Estos sistemas impulsan la participación de los usuarios y la generación de ingresos en las plataformas digitales. El estudio explora diversos algoritmos de recuperación y sus aplicaciones en la segmentación de anuncios y la recomendación de contenido, y arroja luz sobre los mecanismos que impulsan estos sistemas y los desafíos que enfrentan.
En el panorama digital actual, los contenidos y anuncios personalizados son esenciales para atraer a los usuarios y generar ingresos. Los sistemas de recomendación de anuncios utilizan perfiles detallados de los usuarios y datos de comportamiento para ofrecer anuncios personalizados, maximizando la participación de los usuarios y las tasas de conversión. Por el contrario, los sistemas de recomendación de contenido tienen como objetivo mejorar la experiencia del usuario sugiriendo contenido que se ajuste a sus preferencias. Esta encuesta examina los algoritmos de recuperación más eficaces de estos sistemas, destacando sus mecanismos subyacentes y sus desafíos.
Modelos de segmentación de anuncios
Los modelos de segmentación de anuncios están diseñados para ofrecer anuncios personalizados a audiencias específicas. Las metodologías clave incluyen el aprendizaje automático y el índice invertido, una estructura de datos que combina de manera eficiente los perfiles de los usuarios con los anuncios relevantes. Se emplean varias estrategias de segmentación, como la edad, el género, la reorientación, la segmentación por palabras clave y la segmentación por comportamiento.
- Índice invertido: Esta estructura asigna contenido a palabras clave o atributos, lo que permite operaciones de recuperación rápidas y eficientes. Implica la creación de un índice a partir de anuncios, la elaboración de perfiles de los usuarios en función de sus actividades en línea y la comparación de los perfiles de los usuarios con el índice para encontrar anuncios relevantes.
- Segmentación por edad y género: Los anuncios se muestran en función de información demográfica, como la edad y el sexo, que se recopila durante el registro del usuario o se infiere del comportamiento del usuario.
- Reorientación: Esta estrategia se centra en los usuarios que ya han interactuado con un sitio pero que aún no han completado una acción deseada, como una compra. Utiliza datos de cookies y tecnologías de seguimiento para mostrar anuncios relevantes.
- Segmentación por palabras clave: Utiliza palabras clave específicas de las consultas de búsqueda de los usuarios o del contenido que están viendo para ofrecer anuncios relevantes. Los modelos de lenguaje amplios (LLM) mejoran esto al generar diversas variaciones de palabras clave para que coincidan con la intención del usuario de manera más eficaz.
- Segmentación por comportamiento: Realiza un seguimiento de las actividades del usuario, como el historial de navegación y las interacciones en las redes sociales, para ofrecer anuncios personalizados. Este método se centra en los intereses y comportamientos demostrados por el usuario.
Sistemas de recuperación orgánica
Los sistemas de recuperación orgánica tienen como objetivo mejorar la experiencia del usuario recomendando contenido que coincida con sus preferencias sin influencia monetaria directa. Estos sistemas se utilizan en diversos ámbitos, como el comercio electrónico, los servicios de streaming y las plataformas de redes sociales. Los principales mecanismos de recuperación incluyen:
- Filtrado basado en contenido: Recomienda en función de las características de los artículos en los que un usuario ha mostrado interés.
- Filtración colaborativa: Sugiere elementos basados en las preferencias de usuarios similares, identificando patrones entre los comportamientos de los usuarios.
- Sistemas híbridos: Combine técnicas de filtrado colaborativo y basado en contenido para mejorar la precisión y relevancia de las recomendaciones.
Modelo de dos torres
El modelo de dos torres, también conocido como modelo de doble torre, es una arquitectura de aprendizaje profundo muy utilizada en sistemas de recomendación. Consta de dos redes neuronales independientes: una para codificar las características del usuario y la otra para codificar las características del elemento. El modelo proyecta a los usuarios y los elementos en un espacio latente compartido donde se puede medir su compatibilidad. Los componentes clave de este modelo incluyen:
- Torre de usuario: Captura y codifica características del usuario, como información demográfica y historial de navegación.
- Torre de objetos: Codifica características del elemento como metadatos, características del contenido e información contextual.
El proceso de entrenamiento implica optimizar las representaciones latentes para reflejar con precisión la compatibilidad entre los vectores de usuario y de elemento. El proceso de inferencia implica generar representaciones de vectores densos para usuarios y elementos y calcular su similitud para proporcionar recomendaciones en tiempo real.
Conclusión
La investigación concluye que el panorama de los algoritmos de recuperación en los sistemas de recomendación de contenido y publicidad evoluciona continuamente. Si bien estos sistemas mejoran la participación del usuario e impulsan los ingresos, también presentan desafíos como la calidad de los datos y las preocupaciones por la privacidad. Las investigaciones futuras deberían centrarse en el desarrollo de algoritmos de recuperación más sofisticados y éticos que equilibren la personalización con la privacidad del usuario y la integridad de los datos. Esta innovación continua es esencial para satisfacer las crecientes expectativas de los usuarios y expandir las plataformas digitales. Esta encuesta integral ofrece información valiosa sobre las direcciones actuales y futuras de los algoritmos de recuperación en los sistemas de recomendación de contenido y publicidad, destacando su papel fundamental en el marketing digital y las estrategias de participación del usuario.
Fuente: https://arxiv.org/pdf/2407.01712
Sana Hassan, pasante de consultoría en Marktechpost y estudiante de doble titulación en el IIT Madrás, es un apasionado de la aplicación de la tecnología y la IA para abordar los desafíos del mundo real. Con un gran interés en resolver problemas prácticos, aporta una perspectiva nueva a la intersección de la IA y las soluciones de la vida real.