La red social Twitter ha explicado recientemente en su blog oficial cómo funciona y cómo alimenta su algoritmo de recomendaciones, además de cómo filtra o destila los alrededor de 500 millones de tuits que se publican diariamente en la plataforma, para introducirlo en la línea de tiempo «Para ti», según tus gustos e intereses.
El comunicado explica que, «el objetivo de nuestro esfuerzo de código abierto es brindarles a ustedes, nuestros usuarios, total transparencia sobre cómo funcionan nuestros sistemas».
Si bien el algoritmo de recomendación de Twitter también se aplica en otras áreas de la plataforma, como las secciones de Buscar, Explorar y Anuncios, por ahora la empresa solamente ha decidido dar detalles del funcionamiento para las recomendaciones del feed en el apartado «Para ti».
Cómo se eligen los tuits
Los tuits que llegan a la página de inicio de «Para ti», pasan por un proceso de selección y filtración de tres etapas:
- abastecimiento de candidatos.
- clasificación de los tuits con modelos de aprendizaje automático.
- aplicación de métodos heurísticos.
En un proceso que se ejecuta unas 5.000 millones de veces al día, todo en un segundo y medio.
Diagrama que muestra los principales componentes con los que se construye una línea de tiempo
Abastecimiento de candidatos
Este es un proceso con el que la plataforma recibe los mejores tuits provenientes de 3 fuentes de recomendación que forman una base de datos gigante: FollowGraph (que estima quien sigue a quien), las métricas de interacción con los tweets, y otros datos de usuarios relevantes, como usuarios que has bloqueado o contenidos que te interesan.
Sobre esta base de datos, se aplican dos cálculos para obtener los tweets candidatos para cada usuario: RealGraph, que calcula la probabilidad de que te interese un tweet publicado por un usuario, aún si nunca antes has interactuado con él; y TweepCred, que determina tu autoridad en la plataforma, según la autoridad que tienen tus seguidores.
Gracias a estos cálculos, se extraen los mejores 1.500 tweets provenientes de un grupo de cientos de millones de tweets de las fuentes de recomendación, tomando en consideración tanto las cuentas que sigues como las que no sigues. «Hoy en día, la cronología de Para ti consiste en un 50% de tuits dentro de la red y un 50% de tuits fuera de la red en promedio, aunque esto puede variar de un usuario a otro», explica la red social.
Los tuits candidatos fuera de tu red se eligen mediante: Social Graph o gráficos sociales, que busca usuarios afines a ti, estudiando los tuits con los que han interactuado los usuarios que sigues y los usuarios que tienen gustos parecidos a los tuyos; y Embedding Spaces o espacios de incrustaciones, que también busca usuarios afines, pero por medio de números de cadenas de texto que determinan cuánto se parecen dos tweets o conjuntos de tweets.
Dentro de estos espacios de incrustación, existe SimCluster, con el que se pueden descubrir comunidades ancladas por un grupo de influencers. Existen alrededor de 145.000 comunidades, actualizadas cada tres semanas, que pueden variar en tamaños, desde unos pocos miles de usuarios hasta cientos de millones. Mientras más popularidad tenga un tuit dentro de una comunidad, más se asociará ese tipo de contenido a la comunidad.
Clasificación de cada tuit
En este punto del proceso, el sistema ya ha seleccionado aproximadamente 1.500 tuits candidatos que pueden ser relevantes. Estos son sometidos a modelos de aprendizaje automático, que predicen la importancia que tiene cada una de las publicaciones candidatas.
La encargada de esta clasificación es una red neuronal de 48 millones de parámetros, que se entrena constantemente en datos de interacciones de tweets (Me gusta, Retweets y Respuestas) para lograr obtener el mejor resultado de interacción posible. En este momento, el sistema genera diez etiquetas que dan una puntuación a cada tweet y se establece la probabilidad de que interactúes con estas publicaciones.
Heurísticas y filtros
Estando ya clasificada toda la información, se aplican filtros que permiten una recomendación más precisa, como eliminar las sugerencias de cuentas bloqueadas, evitar muchos tweets consecutivos del mismo usuario, reducir la puntuación de una publicación si has dejado comentarios negativos en ella, entre otras acciones.
Mezclar y servir
Con las publicaciones de sugerencias escogidas, Twitter activa el Home Mixer, «la columna vertebral del software que conecta diferentes fuentes candidatas, funciones de puntuación, heurísticas y filtros», según explican desde la misma empresa. Este servicio es el encargado de enviar las sugerencias a cada dispositivo, mientras que el sistema de clasificación las combina con otro tipo de contenido, como anuncios y recomendaciones de seguimiento de otras cuentas.
Si te quedan dudas sobre este proceso, puedes revisar el hilo que ha dejado Juan González Villa, especialista SEO, en su cuenta de Twitter.
https://twitter.com/seostratega/status/1641917597275811842
Imagen: Depositphotos.
Mantente informado de las noticias más relevantes en nuestro canal de Telegram