Twitter publica el código fuente de su algoritmo de recomendación

Twitter ha publicado en GitHub el código fuente de su algoritmo de recomendación, aquel que determina qué mensajes y de qué usuarios aparecen cuando consultamos los contenidos de la pestaña «Para ti». Está disponible bajo la licencia pública general de Affero y contiene pistas que dan a entender los factores que influyen para que un tuit tenga más o menos posibilidades de aparecer en la cronología de los usuarios.

En un artículo publicado en el blog oficial de Twitter, el equipo de ingeniería de la compañía ha ofrecido información muy interesante acerca del código y de su funcionamiento. Entre otras cosas, han remarcado que la mayor parte de los mensajes que ve cada usuario provienen de cuentas a las que sigue.

La función de este algoritmo es seleccionar los mejores tuits de esa red de contactos en función de la probabilidad de que el usuario al que le aparezcan acabe interactuando con ellos. Cuanto mayor sea ese número, más opciones tendrán esos tuits de salir en la cronología de otras personas.

Por lo que hace referencia a los mensajes de cuentas que no forman parte del círculo de contactos, Twitter tiene en cuenta aquellos tuits que atrajeron la atención de cuentas a las que sigue, así como mensajes que gustaron a personas a quienes habitualmente les interesan contenidos similares.

Dicho esto, se están descubriendo datos muy curiosos escondidos en el código a medida que pasan las horas desde que se publicó en GitHub y más programadores le van echando una ojeada. Por ejemplo, en el archivo HomeTweetTypePredicates.scala aparecen las siguientes líneas:

  • author_is_elon
  • author_is_power_user
  • author_is_democrat
  • author_is_republican

Al parecer, Twitter realiza un seguimiento de la frecuencia con la que se sirven mensajes de determinas cuentas y la reacción que provocan entre las personas que los leen. El objetivo, dicen, es asegurarse que no favorecen a determinados grupos por encima de otros.

Otras de las consideraciones que el algoritmo contabiliza para valorar la importancia de los mensajes son el tiempo transcurrido desde que se publicaron, si contienen imágenes y si provienen de cuentas con muchos seguidores o pocos.

La publicación voluntaria del algoritmo de recomendación de Twitter llega apenas unos días después de que se supiera que alguien (presumiblemente, un ex trabajador) había filtrado parte del código fuente del servicio y que, para más inri, había estado disponible durante meses en GitHub sin que nadie de la compañía lo supiera.

Un escándalo que está por ver las consecuencias que tendrá en el futuro para la seguridad tanto de Twitter como de sus usuarios. Y es que, el código ha estado al alcance cualquiera que lo haya querido examinar, de manera que no es descartable que algún experto haya podido encontrar una o más vulnerabilidades que más adelante se podrían utilizar para llevar a cabo ataques contra la plataforma o las personas que la utilizan.

FOTOGRAFÍA: MOHAMMAD RAHMANI

ETIQUETAS: Apps, , , ,