Facebook ha presentado M2M-100, una herramienta que se ha definido como el primer modelo de traducción automática multilingüe, que puede traducir entre cien idiomas diferentes sin necesidad de utilizar el inglés como paso intermedio, como sucede con la mayoría de traductores actuales.

M2M-100 consigue unos resultados hasta diez puntos superiores que los mecanismos basados en inglés utilizando la escala BLEU, empleada para evaluar la calidad de traducciones realizadas por sistemas de traducción automática, como ha informado Facebook en un comunicado.

La mayor parte de herramientas de traducción emplean el inglés como paso intermedio para traducir desde otros idiomas porque es el idioma con mayor cantidad de datos disponibles. El sistema de Facebook soluciona este problema introduciendo 2.200 tipos distintos de traducciones -conocidos como direcciones-, diez veces más que las que emplean los convencionales.

De esta manera, las traducciones de la nueva herramienta usan conjuntos de datos "de muchos a muchos", como los describe la empresa estadounidense, con 7.500 millones de frases para cien idiomas. Estos datos se han obtenido de fuentes de datos públicas como las bases de datos ccAligned, ccMatrix y LASER.

El nuevo sistema de traducción permitirá mejores interpretaciones culturales de ciertas palabras

Las razones de su uso

Para reducir la cantidad de datos necesarios, M2M-100 utiliza la base de datos LASER 2.0, con identificación del idioma mejorada, y además se enfoca en los idiomas con mayor cantidad de datos disponibles, pero no solo el inglés, sino obviando traducciones poco frecuentes como del islandés al nepalí.

Además, la estrategia de Facebook tiene en cuenta factores como la geografía y las similitudes culturales para priorizar las lenguas que más se traducen entre ellas, seleccionando 14 grupos de lenguas en las que cada uno se ha conectado con los idiomas de su grupo.

Para su funcionamiento, el sistema emplea varias técnicas de escalado para construir un modelo universal con 15.000 millones de parámetros, lo que captura información de idiomas relacionados y proporciona un resultado más preciso, informó Portaltic.

Otras noticias de Facebook

A unas semanas del estreno de El dilema de las redes sociales en Netflix, Facebook acusó al documental de caer en el sensacionalismo. A la empresa de Mark Zuckerberg no le gustó el modo como la película deja al descubierto las prácticas de manipulación y control de datos de sus usuarios.

A Facebook no le gustó nada el documental de Netflix, "el dilema de las redes"

La empresa publicó un documento titulado "En qué se equivoca 'El dilema de las redes sociales'" donde aborda siete puntos que considera erróneos en la película. Entre ellos se encuentra el problema de adicción, la forma como obtiene dinero la empresa con la información de usuarios, su famoso algoritmo y más.

Facebook menciona que los creadores del documental no incluyeron testimonios de empleados actuales de la empresa o de expertos con una visión diferente a la narrativa propuesta por el film. Esto es interesante, ya que si bien El dilema de las redes sociales presenta a Justin Rosenstein, co-creador del botón de Me Gusta, y otros expertos, el documental no contrasta testimonios.

Te puede interesar