Twitter acaba de hacer público un fragmento de su código fuente. La compañía ha subido a GitHub parte de su algoritmo de recomendación, es decir, del sistema que decide qué mensajes acaban llegando a secciones como Para ti, Buscar y Explorar, y que también alimenta gran parte de la plataforma de anuncios de la red social.
La noticia ha sido dada a conocer por Elon Musk, quien desde antes de comprar la red social se mostraba a favor de que Twitter se convirtiera en una “red social de código abierto”. Este viernes después del anuncio, el empresario ha dicho que se descubrirán “muchos problemas vergonzosos”, pero ha prometido solucionarlos rápidamente.
Una parte del código de Twitter ahora es público
Como decimos, no estamos frente a todo el código de la red social, sino a solo un fragmento (“la mayor parte”, según Musk) del algoritmo de recomendación. Esto, como posiblemente imagines, sitúa lejos a Twitter de la idea de ser una red social de código abierto, pero desde la compañía aseguran que liberarán el resto del código en el futuro.
Al navegar por las carpetas de GitHub nos encontramos con código difícil de entender, incluso para los propios empleados de Twitter. “Nuestro ‘algoritmo’ es demasiado complejo y no se entiende completamente internamente, decía Musk a mediados de este mes. Sin embargo, una publicación de blog oficial puede servirnos de guía en algunos aspectos.
El equipo de Twitter ha explicado cómo funciona la sección Para ti. Según explican, los modelos de la red social intentan responder a preguntas como “¿Cuál es la probabilidad de que interactúes con otro usuario en el futuro?” o “¿Cuáles son las comunidades en Twitter y cuáles son los Tweets de moda dentro de ellas?” para dar recomendaciones relevantes.
Desde el punto de vista técnico, lo mencionado anteriormente se lleva a cabo en tres etapas principales. La obtención de los mejores Tweets en base a diferentes fuentes de recomendación, la clasificación de los Tweets utilizando un modelo de aprendizaje automático y la aplicación de filtros para eliminar cuentas bloqueadas, Tweets ya vistos e inseguros.
Si nos enfocamos en la primera de las tres etapas, Twitter dice que de cada solicitud extrae los 1.500 mejores Tweets de sus fuentes. Una vez que se completa el proceso y pasan por el modelo de aprendizaje automático, en la sección Para ti se presentan un 50% de mensajes “dentro de la red” del usuario y otro 50% “fuera de la red”, es decir, cuentas que no se siguen.
Tanto en la publicación de blog como en la página de GitHub se brindan muchos otros detalles técnicos que ahora cualquier persona puede consultar. En relación a este movimiento, desde la red social afirman que servirá para “brindar total transparencia” de cómo funcionan sus sistemas. Asimismo explican que ya están trabajando en varias que llegarán más adelante.
Portada: Captura de pantalla + logo de Twitter | Imágenes: Twitter
En Xataka: O pagas o desapareces: Musk confirma que el feed de Twitter cambiará a partir de abril
– La noticia “Se descubrirán muchos problemas vergonzosos”: Elon Musk publica parte del código fuente de Twitter en GitHub fue publicada originalmente en Xataka por Javier Marquez .