Asombroso: crea 10 millones de artículos en Wikipedia con un bot para "contrarrestar los sesgos"

Asombroso: crea 10 millones de artículos en Wikipedia con un bot para "contrarrestar los sesgos"
Sverker Johansson agregó millones de artículos a través de un bot y convierte al cebuano en el segundo idioma con más artículos del sitio
Por iProUP
08.09.2021 18.53hs Economía Digital

Sverker Johansson es un programador sueco nacido en 1961 y tiene el récord de crear más artículos en Wikipedia que nadie: 10 millones de entre los 55 millones de artículos en todos los idiomas que existen.

El bot de Wikipedia

Hace unos 10 años Johansson diseñó Lsjbot, un programa que realiza tareas automatizadas, como escribir dichos textos, lo que llevó al sueco y al cebuano (la lengua materna de su esposa, originaria de Filipinas, utilizada por unos 20 millones de personas) en el segundo y tercer idioma con la mayor cantidad de artículos en la Enciclopedia Colaborativa, respectivamente. Se estima que el 99% de los artículos en cebuano fueron creados por el bot del programador sueco. 

Sin embargo, el trabajo de Johansson llevó a algunas controversias: en 2020, la comunidad de Wikipedia sueca decidió no utilizar más el bot Lsjbot para crear idiomas en sueco. Hasta ese momento el 80% de los contenidos en ese idioma fueron generados usando la inteligencia artificial. 

Si bien el sueco posee 45 años de experiencia como programador, también se doctoró en física de partículas hace tres décadas y desde esa época también estudia los orígenes del lenguaje. En 2021, publicó un libro llamado "En busca del origen del lenguaje", en el que investiga esta herramienta vital que utiliza el ser humano a cada segundo. A continuación una entrevista al programador hecha por el sitio El País. 

-Es físico y estudia los orígenes del lenguaje, ¿cómo acabó programando un bot?

Me doctoré en física de partículas hace 30 años, pero me cansé de las grandes investigaciones industrializadas en las que cada individuo es sólo una pequeña parte del engranaje. En esa época empezaron a fascinarme las lenguas, me di cuenta de que no se sabía nada de los orígenes del lenguaje y quise hacer algo al respecto. A programar empecé antes, por diversión, en el instituto. Disfrutaba de todo lo que se podía hacer con una computadora, aunque no hubiera internet todavía.

-¿Cómo se le ocurrió crear el Lsjbot? ¿Escribía artículos en Wikipedia antes de eso?

Sí, empecé a escribir en 2007. Elaboré artículos durante cinco años hasta que descubrí que, en los Países Bajos, alguien utilizaba un bot para escribir textos sencillos que contenían una sola oración, como: ‘’Esta especie es un tipo de insecto’’, sin más. Pensé que podía hacerlo mejor y lo tomé como un desafío. Para los artículos sobre geografía, mi bot analiza el terreno colindante, la altitud, calcula si está situado en las montañas o en una llanura, encuentra la ciudad más próxima…

-¿Cómo es capaz de realizar esa operación 10.000 veces al día?

El bot trabaja con bases de datos y con vocabulario. Contiene cientos de oraciones estándar que utiliza para empezar un artículo: X es un tipo de Y que pertenece a la familia Z, y así. Después, toma la información de la base de datos y sitúa en la X el nombre del animal y en la Y el tipo de especie. A partir de ahí construye el artículo. En ese sentido, es una programación bastante sencilla; la complejidad reside en indagar a través de toda la información y construir correctamente las estructuras.

-¿Cómo decide qué fuentes debe utilizar el programa para elaborar los textos?

Me encargo de buscar manualmente las bases de datos para asegurarme de que son de calidad, que tienen buena reputación y que son fiables.

-¿Hay alguna forma de programar el bot para que aquello que escribe parezca más humano?

Sí que las hay. Podrían introducirse variaciones en las frases y cambiar el orden o la elección de las palabras, pero no quiero aparentar nada. El contenido que crea el bot debe parecer creado por un bot.

-¿Por qué cree que Wikipedia en Suecia no quiso que su bot siguiera en marcha?

Es una larga historia llena de discrepancias: ¿Deberíamos tener textos sobre todas las colinas de todos los países o no? ¿Y sobre todos los pueblos? También preocupaba la calidad de los textos y los errores. Además, a algunos no les gustan los artículos escritos por bots. Uno de los creadores de Wikipedia en sueco tenía como pasatiempos escribir artículos sobre Albania y se puso furioso cuando mi bot se encargó de toda su geografía en un solo día. Desde mi punto de vista, Wikipedia es para los lectores y su propósito es aportar la información que la gente busca, no servir de afición a aquellos que la escriben.

Artículo de Wikipedia en Cebuano
Artículo de Wikipedia en Cebuano

-¿Planea incluir más áreas del conocimiento en los artículos?

Lo tengo en mente, pero no pretendo imponerlos en ningún país. Me gustaría crear artículos sobre todas las lenguas del mundo y, de hecho, dispongo del software necesario para ello. También sobre literatura y autores, porque Wikipedia está muy sesgada: hay muchos más artículos sobre escritores varones que sobre escritoras y, en el área de la geografía, muchos más textos sobre pueblos y ciudades de España, por ejemplo, que de África.

-¿Y su bot puede solucionar eso?

Sí, porque el bot toma todos los lugares. Si escribiera artículos sobre autores, básicamente descargaría el catálogo completo de la Biblioteca Nacional de España, lo analizaría y crearía textos sobre todos ellos, tanto de hombres como de mujeres. Wikipedia está en gran parte escrita por varones jóvenes y los artículos que elaboran son sobre aquello que les interesa a ellos. Wikipedia está haciendo un esfuerzo para contrarrestarlo y creo que mi bot ha contribuido a ello. Los bots no están sesgados.

-Desde que creó este sistema automático en 2012, ¿ha escrito usted algún artículo?

Solo unos cuantos.

-¿El suyo?

No. Evité encargarme del que habla sobre mí, aunque, para que fuera preciso, aporté algunas fuentes y hablé en el foro que hay tras la página. Los artículos que suelo escribir están relacionados con el trabajo del propio bot: en una ocasión, escribió sobre una montaña y la palabra ‘’montaña’’ se enlazaba con un artículo de montañas en general, pero descubrí que ese artículo no existía en cebuano, así que lo escribí yo mismo.

-¿Le resulta más complicado programar el bot para que emplee el cebuano o el idioma no es relevante en la configuración?

Puedes crear contenido en cualquier lengua siempre y cuando un hablante nativo ayude con el vocabulario y las oraciones. El bot necesita unas 1.000 palabras y alguien debe proveérselas.

-El Lsjbot ha elaborado aproximadamente el 99% de los artículos de Wikipedia en cebuano. ¿Qué ocurriría si dejara de crear contenido en esa lengua?

Seguiría estando ese 1% y seguiría habiendo personas que escribieran en cebuano. Por supuesto, sin mi bot, Wikipedia en cebuano no sería la segunda de mayor tamaño en todo el mundo.

-¿Le gustaría crear contenido en otros idiomas?

Sí, siempre que la comunidad de Wikipedia en otros países me invite. Necesitaría su cooperación, la ayuda de los hablantes nativos para poder crear las frases y palabras necesarias. También necesitaría apoyo, tendría que estar seguro de que están a favor del trabajo del bot.