Redacción. Investigadores del Grupo de Procesamiento del Lenguaje y Sistemas de Información (GPLSI) de la Universidad de Alicante (UA) han desarrollado un bot, denominado Fiero, que recoge los insultos y los almacena con el objetivo de generar uno de los recursos lingüísticos más utilizados en tecnologías del lenguaje humano (TLH): los lexicones (listas de palabras).
Este trabajo se enmarca en un proyecto de investigación orientado a desarrollar modelos del lenguaje denominado Living-Lang, coordinado por el Grupo de Sistemas Inteligentes de Acceso a la Información (SINAI) de la Universidad de Jaén (UJA).
Dentro de este proyecto, los investigadores de ambas universidades trabajan en entrenar, mediante algoritmos de aprendizaje automático, sistemas computacionales basados en TLH para afrontar diferentes problemas sociales muy de actualidad, como, por ejemplo, la detección de noticias falsas (fake news), el ciberacoso, la propagación del discurso del odio y del lenguaje ofensivo, o la detección de ciertos problemas de salud mental, como la anorexia, la depresión e, incluso, la prevención del suicidio.
Captación de insultos
“El desarrollo de esta tecnología ha surgido desde el GPLSI, con una alta implicación de estudiantes de ingeniería multimedia en prácticas, con el fin de utilizarlo en la captación de insultos que sirvan para crear un diccionario popular sobre el tema”, explican desde la UA.
“Para desarrollar estos sistemas es fundamental e imprescindible contar con recursos lingüísticos que permitan entrenar a los sistemas de aprendizaje automático. Concretamente, para los sistemas de detección automática de lenguaje ofensivo es muy interesante contar con distintos diccionarios y lexicones de insultos, palabras malsonantes”, añaden desde la UJA.
Debido a la dificultad de conseguir esos recursos lingüísticos, el equipo de trabajo del proyecto Living-Lang busca la colaboración de la ciudadanía en general, para lo que han recurrido a la creación de Fiero, que se ejecuta dentro de la aplicación de mensajería Telegram y se instala en los smartphones (Android y iOS) con el único objetivo de recoger insultos de la gente.
Una vez instalada en el móvil, se abre un diálogo en el que el usuario puede incluir todos los insultos (cuantos más mejor) a los que Fiero contesta con cierta sorna e ironía con el fin de conseguir más insultos por parte del usuario.
“El sistema va almacenando todos estos insultos que, posteriormente, serán procesados para ser incluidos en un recurso léxico que será puesto a disposición de la comunidad científica y que servirá, además, para entrenar a los sistemas de aprendizaje automático que se están desarrollando”, explican sus creadores.
“Una vez se recaben los datos con esta herramienta, en colaboración con los investigadores del grupo SINAI crearemos sistemas automáticos de inteligencia artificial capaces de detectar y alertar insultos tanto en redes sociales como en otros mecanismos de mensajería en los que se desee incorporar. Todo ello en la línea de fomentar el desarrollo de tecnologías que velen por la inclusividad de la sociedad”, destacan desde el grupo de trabajo de la Universidad de Alicante.
Proyecto previo
Fiero tiene su origen en el asistente virtual o chatbot Aitana, utilizado en la web de la Universidad de Alicante desde 2019.
“Hemos utilizado el mismo núcleo de software, pero aplicado a dos problemas distintos: Aitana, parar brindar asistencia al alumnado en el proceso de matrícula, y Fiero, para recabar insultos populares para generar recursos léxicos para la investigación”, explican desde el GPLSI de la UA.