Desarrollan un sistema inteligente que detecta noticias falsas

Un equipo de investigación de las universidades de Jaén y Alicante ha creado una aplicación que analiza las noticias de forma automática y determina la veracidad de éstas con una alta precisión. Aunque el modelo está aún en fase de testeo, se propone como una herramienta útil para filtrar la cantidad de información que llega cada día a periodistas y lectores.

Basado en técnicas de inteligencia artificial, el sistema testea la noticia en dos niveles detectando si existen incongruencias en el contenido y si la estructura coincide con la que cualquier publicación con rigor periodístico debe tener.

Con el objetivo de ofrecer una mayor confianza al lector y dotar a los periodistas de nuevas herramientas que le permitan discernir entre diversas informaciones, los investigadores han publicado en la revista Expert Systems with Applications un artículo titulado ‘Exploiting discourse structure of traditional digital media to enhance automatic fake news detection’ en el que presentan el prototipo de un detector de ‘fake news’ para webs.

El sistema, según se ha informado desde la Fundación Descubre, analiza la estructura de la noticia publicada atendiendo a las normas de periodismo clásicas: la regla de las 5W+H, conocida así por las siglas de las cuestiones en inglés, y la pirámide invertida.

Estas guías se sustentan en que la noticia rigurosa debe contener información que responda a las seis preguntas básicas (¿qué?, ¿cuándo?, ¿dónde?, ¿quién?, ¿por qué? y ¿cómo?) y que se presente en gradación desde lo más importante hasta los detalles.

«La estructura de una publicación nos da pistas de si hay base periodística o si, por el contrario, imita a una noticia real», ha indicado el investigador de la Universidad de Jaén (UJA) Miguel Ángel García, autor del artículo.

A partir del análisis del lenguaje natural, los expertos desarrollan un algoritmo que detecta las informaciones que no responden a esta estructura. Estos cálculos se basan en técnicas de aprendizaje automático, también conocido como ‘machine learning’, de forma que el sistema va aprendiendo a medida que va acumulando datos.

Además, la máquina puede procesar en segundos miles de datos simultáneos, algo que una persona no podría hacer. La investigadora de la Universidad de Alicante Estela Saquete, también autora del artículo, ha apuntado que con este sistema, los periodistas pueden contrastar fuentes, detectar estructuras incorrectas, viralizadas, o que tengan incongruencias entre el titular y el cuerpo de manera inmediata y automática. También el usuario final puede tener evidencias de si la noticia que lee cumple con unos estándares o no.

Los equipos ‘Sistemas Inteligentes de Acceso a la información’ (Sinai), de la Universidad de Jaén, y ‘Grupo de Procesamiento del Lenguaje Natural y Sistemas de Información’ (Gplsi), de la Universidad de, Alicante, realizaron las pruebas sobre un conjunto de datos en español con más de 200 artículos centrados en temas sanitarios, de especial relevancia en la actualidad debido a las numerosas noticias falsas que circulan sobre covid-19.

El sistema toma como base el aprendizaje profundo, con el que se crean modelos computacionales compuestos por varias capas de procesamiento de datos. Concretamente en este trabajo, los expertos definen dos capas. Por un lado la estructura de la noticia y por otro el argumento. De esta manera, la máquina predice no sólo la credibilidad de la forma, sino también del contenido.

Además, los investigadores han aplicado un nuevo esquema en el tratamiento de los datos, conocido como anotación de grano fino, que consiste en establecer etiquetas a las noticias. Estas marcas se aplican a todas las posibilidades, aunque las diferencias sean pequeñas. De esta manera se obtiene una descripción detallada en los dos niveles para cada texto.

Cada etiqueta tiene un conjunto de atributos que proporcionan información más allá de lo lingüístico incluyendo la verificación de hechos, relaciones semánticas entre componentes o características contextuales. Incluso, referencia aspectos relacionados con la carga emocional que pueda contener un escrito y que lo alejan de la objetividad que debe tener una noticia real.

El objetivo de los expertos es lograr una aplicación que marque automáticamente el texto de una noticia mientras se lee y que alerte mediante una señal de partes de la noticia que puedan ser falsas, indicando la referencia con otros textos similares en los que se pueda contrastar su veracidad.

Esta investigación se ha desarrollado mediante los proyectos ‘Living-LANG: Modelado del comportamiento de entidades digitales mediante Tecnologías del Lenguaje Humano’, del Ministerio de Ciencia e Innovación y ‘SIIA: Tecnologías del lenguaje humano para una sociedad inclusiva, igualitaria, y accesible’ de la Comunidad Valenciana.