¡Wikipedia cumple 20 años
y hay que celebrarlo!

PARTICIPA

Luis Ulzurrun cuenta cómo fue Arctic Knot 2021

Hola Luis. Este año has sido uno de los socios de WMES que han participado en la conferencia internacional Arctic Knot, ¿puedes contarnos de qué trata?

Aunque el tema ártico ha estado muy presente y muchos de los ejemplos e incluso presentaciones enteras se refieren a esa parte del mundo, la Arctic Knot Conference 2021 ha ido de forma más general sobre lenguas minoritarias o minorizadas.

¿Minoritarias o minorizadas? 

No es una disquisición filosófica. La famosa frase de «una lengua es un dialecto con ejército y marina propios» ya sirve para muy poco. Con ejército y marina propios hay un montón de lenguas que difícilmente tienen algún uso en la universidad, más allá de explicarse a sí mismas. Algunas tienen problemas hasta para la ESO o la antigua EGB. Hay lenguas en las que puedes comandar un tanque pero no hacer un pedido a Amazon.

Imagen de Frhdkazan, CC BY-SA 4.0, via Wikimedia Commons

¿Y eso cómo se gestiona en una conferencia internacional?

Hemos participado en un acto desarrollado fundamentalmente en inglés-lingua-franca. Algunas de las lenguas en los ejemplos tienen cientos de hablantes (esas serán las minoritarias), pero otras tienen cientos de millones de hablantes (que deben ser de las minorizadas). El asunto va más allá de las Wikipedias y de Wikimedia: por ejemplo, la Unión Europea reconoce 60 lenguas regionales y 24 nacionales. Pero al final la faena se hace en inglés y (quizá) alemán, castellano, francés o italiano. Hay veces que instituciones diversas como la Real Academia de la Lengua (caso del castellano) o la Deutsche Welle (caso del alemán) tratan a sus propias lenguas como sujetos a los que hay que proteger para que puedan sobrevivir.

¿Cómo se relaciona Arctic Knot con los proyectos sobre conocimiento libre?

Evidentemente, la conferencia también va sobre proyectos Wikimedia. Cierto énfasis en Wikipedia, pero también Wikcionario, Wikimedia Commons y Wikidata. Y algo nuevo que surge en el horizonte: «Wikifunctions«.

En este punto conviene recordar que nuestro objetivo no es «tener una enciclopedia maravillosa», es «facilitar todo el conocimiento a todas las personas». Es muy importante retener esto.

Wikifunctions es novedoso. ¿En qué consiste?

Muy brevemente, es una forma de generar textos enseñando la gramática de las lenguas “normales” a las máquinas. Hasta ahora hemos hablado de la semántica (de sentido de las frases) pero no de la gramática (la forma que las frases tienen). Por ejemplo, “I like coffee” y “Me gusta el café” son semánticamente iguales, pero gramaticalmente totalmente opuestas. Es un ejemplo sencillo pero cada idioma puede complicarse más y más. En castellano solo hay un par de formas para la palabra “café” (la otra es “cafés”). En estonio puede tener más de veinte formas. Eso que parece terriblemente difícil de manejar resulta que una persona estonia de tres años lo controla perfectamente ¿Cómo? Pues no aprendiendo veintitantas formas de cada cosa que ve, sino con una “función” que le dice qué aplicar en cada situación.

¿Cuáles han sido los puntos centrales de la conferencia en esta edición?

En un par de charlas se hacen menciones a problemas de adquisición del conocimiento que me sorprenden. En una lengua australiana, por ejemplo, no se puede mencionar el nombre de las personas fallecidas. ¿Cómo explicas en esa lengua la historia de Francia sin decir Carlomagno o De Gaulle? En otro caso, los miembros de una primera nación de Quebec deben de tener ciertos conocimientos que no deben salir de su comunidad, pero que forman parte del acerbo básico de su «enciclopedia mental» y por lo tanto los han incluido en la Wikipedia en su lengua. ¿Qué pasará el día que esto se traduzca, cómo se gestiona, qué tipo de licencias u otras normas, cómo se integra todo esto en el esquema global del conocimiento [nuestro objeto es todo el conocimiento] de la humanidad?

Tradicionalmente en el Movimiento Wikimedia, cuando se habla de diversidad lingüística también se habla de la preservación del conocimiento oral. ¿Ha sido el caso en Arctic Knot?

Claro. Otro punto en la adquisición del conocimiento es el tema de la oralidad. Nosotros, los españoles, tenemos el caso de gente como Joaquín Díaz, de gente que se recorrió el país recogiendo voces. Pues ponle a eso esteroides y tendrás la imagen de lo que pasa en otras partes. Por lo que hace al castellano, los fondos orales de gente como Joaquín Díaz son como un microfragmento de, digamos, los fondos escritos de la Biblioteca Nacional o incluso de cualquier centro de investigación. Hay lenguas, muchas de las 7000 que hay en el planeta, en las que es justo al revés: los escritos son tres folletos y un libro, la cultura oral es literalmente todo lo demás. 

¿Cómo se gestiona esto, cómo se valoran esas fuentes? 

Añado aquí una nota que en realidad corresponde a distribución del conocimiento: la oralidad ayuda a la recepción de los contenidos por parte de personas con diferentes circunstancias vitales, desde disléxicos a personas con dificultades de visión, pasando por comunidades cuya alfabetización en lengua propia es muy baja. La oralidad como fuente y como producto es un factor a tener presente.

Otro aspecto también importante es dejar constancia del origen  del conocimiento que proviene de grupos que usan fuentes orales o tradicionales. Hay gente trabajando en ese tipo de licencias.

 ¿Algún proyecto del que se haya hablado especialmente durante la conferencia?

Lingua Libre. Es un proyecto promovido por WMFR para grabar las palabras en diferentes idiomas y depositar las grabaciones en Wikimedia Commons. Es realmente sencillo. Algunos de nuestros voluntarios (Millars)  han colaborado. Para el castellano tiene una ventaja que habría que explotar a saco: cada participante indica de dónde es. Así se dispone de diferentes acentos y dialectos. Y el sistema ya está ahí. No hace falta buscar una entidad colaboradora para grabar en Caracas, otra en Buenos Aires, otra en Guayaquil. Te metes en el ordenador y adelante con ello. Obviamente para catalán y otras lenguas también vale, hablo del castellano porque es un tema que alguna vez hemos propuesto y siempre era «muy difícil». Excusa eliminada.

¿Qué aporta una lengua o acento a un proyecto global como este? 

Hay más en una lengua que la lengua en sí misma. Por ejemplo, una aportación de la lengua atikamekw. Esta gente no tenía palabras para los ordenadores y por tanto tampoco para el ratón. En teoría por calco deberían haber adquirido «mouse» o «souris», pero resulta que ya estamos en 2021, muchos ordenadores ya no tienen el clásico ratón con cable y, en conjunto, los atikamekw encontraron que comparar «eso» con unos roedores era absurdo. Así que su palabra para ratón (también trackpad) es «herramienta de hacer click». Cambio de lengua, cambio de carga cultural recibida, solución diferente al mismo problema.

Si no recibimos esa cultura no podremos distribuirla. [INSISTO: Nuestro objeto de trabajo es todo el conocimiento]. El hecho de que algunas ediciones de Wikipedia reúnan unos contenidos «hiperlocales» [alguien en la conferencia usó la expresión, es muy descriptiva] no implica que dichos contenidos no formen parte del acerbo del conocimiento humano.

Participantes por lengua en Arctic Knot. Imagen de Frhdkazan, CC BY-SA 4.0, via Wikimedia Commons

¿Y qué hay de la generación de contenidos entre la comunidad wikmedista?

Los wikimedistas, también llamados muchas veces wikipedistas, somos un grupo cultural minoritario. Suena a pitorreo, no lo han planteado en la reunión, pero hay que asumirlo. Al final el número de editores es reducido. Para una Wikipedia grande como Wikipedia en español tenemos unos 17 000 editores frecuentes. Sí, ya sé que hay tropecientos millones que pusieron una coma [¡gracias, peña, seguid con ello!] pero me refiero a sacar todos los castillos del Loira o todas las diputadas chilenas: necesita tiempo y dedicación. Si en vez de ser 17 000, son nueve, como en feroés, lo más probable es que acaben nunca o jamás. Y el feroés está muy ciclado: junto con el saja (también llamado yacuto)  que tiene quince, y el sami de Inari, que tiene ocho, son las tres lenguas árticas con más editores. Y esa peña tiene otras historias que resolver.  En castellano o catalán no sé si se acabarán los castillos del Loira o las parlamentarias chilenas, pero está claro que en feroés o saja ya habrán hecho mucho si tienen un artículo sobre el Loira y otro sobre el parlamento chileno. Por supuesto hay lenguas que lo tienen peor, con una o ninguna persona editando, pero eso –que también se trató y es interesante- lo dejo de momento.

¿Cómo se consigue que edite más gente o que se hagan más ediciones?

La solución para rellenar las partes a las que no se llega, una vez eliminadas las obvias (no vienen millones de voluntarios, los voluntarios a quienes les gustan los Pokémon no se pasan en masa a las políticas chilenas, y la esclavitud no la van a restablecer para fines educativos) pasa por los medios técnicos. Tenemos artículos sobre unos veinte millones de cosas. Con sus datos. Si conseguimos que un sistema genere texto en «lenguaje natural» (inglés, castellano, catalán, setsuana) a partir de ese material, podremos tener unos artículos para todas las lenguas. ¡¡¡¡¡¡ANATEMA!!!!!! NOT IN MY WIKI! ¡Apartad de mí esos Wikidataherejes! gritarán algunos. Personalmente estoy con los partidarios de la tecnología. El esquema de trabajo consiste en trabajar desde Wikidata, no sólo con los Q, sino también con los lexemas. Esa es la materia prima. A esto habrá que aplicarle Wikifunciones. 

¿Puedes explicarnos más sobre cómo funcionan esas Wikifunciones?

Para los matemáticos y lógicos es fácil de entender, para los demás pues es una cosa que transforma A en un derivado de A. Por ejemplo Si A es «gato» y la función es «+s» entonces f(A)=gatos. Obviamente esto es más largo pero espero que se entienda. Las Wikifunciones, como todo en Wikimedia, son cosa de los voluntarios. Pero hay que tener en cuenta que una vez explicado que f(A)=A+s, si defines bien qué valores puede tomar A, acabas de generar el plural de decenas de miles de palabras.

Al final todo el material debe quedar en texto «natural».  Esto es complicado por el tema de la expresividad. Los estudiosos del tema han conseguido identificar tres facetas que los lenguajes naturales hacen servir y que son complejas de generar sistemáticamente. La narrativa es una de las difíciles [el ejemplo que ponen es cómo Pierre y Marie Curie establecen una relación amorosa]. Otra es la referencia mediante descripción [algo parecido a que el todo es más que la suma de las partes] y la redundancia [que se usa muchísimo en lenguas naturales incluso sin darnos cuenta y tiene un valor semántico].

¿Crees que este es el futuro?

Estos procesos se están estudiando y Wikifunctions aún está en gestación. Pero está claro que o tenemos días de 300 horas o buscamos un apaño. Y este apaño parece viable. Para los que piensen que el plan B es aprender inglés, solo seis de cada veinte artículos posibles en Wikipedia están en inglés: los otros catorce te los pierdes sí o sí.

Vale, hemos hablado de la diversidad lingüística, de quién escribe… Ahora, ¿cómo afecta todo esto a la distribución de contenidos en un ecosistema como Internet?

El movimiento Wikimedia forma parte del Language Equality Movement (movimiento por la igualdad de la lengua). Y esto a su vez enlaza con Digital Language Equality. Algunas cosas tienen un enfoque más europeo, otras no tanto, en conjunto se trata de que tu ordenador (o tu móvil o Alexa o Siri o tu nevera) te trate en tu lengua de preferencia, y que puedas gruñir en tu lengua de preferencia en múltiples instancias.

Creo que para este punto es muy de aplicación el tocho que he metido antes de funciones y lenguaje natural y que no voy a repetir.  Es una opinión personal, pero la principal excusa que se pone al uso de múltiples lenguas (el problema de traducir) una vez enfocado mediante lexemas y funciones se reduce brutalmente. «Prohibido comer melón en la playa» es sencillo de generar en los modelos ya explicados. Y supone un empoderamiento increíble para las minorías lingüísticas (hay 260 dolgan en Rusia que están deseando que les griten que no coman melón en su propia lengua… fuera de bromas, es un enorme paso adelante).

Y obviamente, si vale para la policía municipal, vale para Wikimedia: podremos difundir todo el saber humano a todo el mundo [y sin necesidad de que hagan un curso de inglés, otro de francés, otro de alemán, otro de chino…]

¿Has aprendido alguna curiosidad lingüística en la conferencia?

Los galeses suelen hacer aportaciones interesantes. La palabra clave es «sgol» que quiere decir «escuela«. En País de Gales hay bastante actividad de Wikimedia con las escuelas, incluso de primaria. En este caso mostraban cómo el alumnado, usando WikiShootMe, sacaba fotos de lugares específicos de sus lugares de residencia.

Scots (escocés lengua germánica, no confundir con el gaélico escocés): debido a una actuación desafortunada de un editor, están reescribiendo partes sustanciales de su Wikipedia. Como necesitaban ayuda, se la han pedido a las fuerzas vivas de la lengua escocesa, las cuales les están ayudando.  Creo que recurrir a esas fuerzas vivas es un camino interesante para muchos otros contextos.

¿Cuáles son las experiencias compartidas en Arctic Knot que más te han llamado la atención?

Dentro de Latinoamérica hay esfuerzos dirigidos a las lenguas indígenas (no me termina de gustar esa palabra, porque el garífuna por ejemplo no quedaría bien encuadrado). Yucateco, wayuunaiki, quechua, salieron como ejemplos. En algunos casos los apoyos no venían de los capítulos u organizaciones locales de sus países.

Problemas de relevancia, notabilidad y cosas parecidas. Cuando a la persona que edita le borran el artículo en inglés porque no tiene fuentes escritas, no le parece nada amistoso. Es un punto que habrá que tratar, que enlaza con la oralidad por un lado, y por otro plantea la cuestión de si una comunidad (no necesariamente hablo de una comunidad en un proyecto Wikimedia) puede determinar cuáles son los conocimientos que pueden entrar o salir en «su» sistema lingüístico (vamos, si pueden dejar que se traduzca el artículo del carajillo a su lengua y, en sentido contrario, si están dispuestos a que todo el mundo conozca su visión sobre el origen de los ríos, por decir algo).

¿Alguna reflexión más, tras tu paso por Arctic Knot?

Hay 7000 lenguas. Todas tienen contenidos que necesitan conservarse. Es posible que sobrevivan, es posible que no, pero podemos trabajar para la preservación de esos contenidos con actividades sobre esas lenguas y sus culturas. Desde crear artículos en las «lenguas mayoritarias» [nota: quitando del inglés ¿alguien está seguro de qué lengua es mayoritaria?] pasando por grabar sus voces, documentar visualmente las cosas que se pueda, crear diccionarios, crear wikifunciones para sus gramáticas [recuerda, con un wikcionario, wikidata y wikifunciones puedes llegar a crear un artículo]. Hay un camino.

La solución monolingüe, no importa en qué lengua, es siempre la peor de todas.