¿Sueñan los androides con noticias automáticas? Parte II – De la automatización en los medios de comunicación al periodismo de datos

Terminaba la primera parte de este artículo planteando la cuestión del papel de los sistemas automáticos para procesamiento de lenguaje natural en el trabajo de los periodistas y en el negocio periodístico en general.

El caso de lainformacion.com

Una de las iniciativas más ambiciosas de automatización periodística en España la ha llevado a cabo en los últimos años lainformacion.com. Su apuesta consistía en el cruce de contenidos generados por parte de máquinas, periodistas y usuarios. En cuanto a la componente automática, la información es generada, recopilada y jerarquizada por robots (los realmente nativos digitales). En este proceso, desde Daedalus aportamos nuestra tecnología de analítica de texto y experiencia dirigidas a la recopilación de noticias de múltiples fuentes, su etiquetado semántico, filtrado de noticias repetidas, agrupamiento de noticias relacionadas y geoposicionamiento. Dentro del etiquetado semántico, se incluye la identificación de menciones a personajes, lugares, empresas, organismos, conceptos, etc., además de la clasificación de los textos en múltiples clases, dentro de un esquema jerárquico estandarizado con un millar de categorías. El resultado: 20.000 noticias diarias de fuentes periodísticas y blogs especializados, procesadas en tiempo real, y 100.000 portadas distintas a disposición de los lectores: 970 temas, 25.000 personajes, 45.000 lugares y 30.000 empresas y organismos con relevancia periodística. (Acceda a la presentación “lainformacion.com: cómo analizar noticias al segundo”, de Jorge Martín-Luengo en la “Jornada Lenguajes y Gestión de Información”, organizada por SEDIC).

Jorge_Martín_Luengo-lainformacion_com-SEDIC_2010

Los sistemas automáticos son además un aliado imprescindible para el periodista. Enrique Infante, desde la óptica educativa de su actividad actual en la UNIR, Universidad Internacional de La Rioja, (con su experiencia, además, en lainformacion.com y en otros medios) incidía también en su ponencia (dentro de este IX Seminario Internacional de Lengua y Periodismo) en las nuevas necesidades formativas de los periodistas. Estas competencias incluyen la generación y etiquetado de contenidos para múltiples canales, optimización para posicionamiento en buscadores (SEO), aprovechamiento de redes sociales, medición de audiencias, marketing de contenidos y publicidad on-line, creación e integración de contenidos multimedia, interactividad, accesibilidad y usabilidad, sistemas de gestión de contenidos, etc. (Los nuevos periodistas, además de escribir historias, hacen mucho más).

Periodismo de datos

Mención aparte merecen las nuevas formas de periodismo, como el denominado “periodismo de datos”. Este consiste en la recogida y gestión informatizada de grandes volúmenes de información sobre un tema para facilitar su análisis, su comprensión por la audiencia, por ejemplo a través de visualizaciones, o incluso permitiendo la exploración directa de esos contenidos por parte de cualquier interesado. El primero de los grandes medios en adoptar el término fue el diario the Guardian, que lanzó su Datablog en marzo de 2009. (Su lema: “los hechos son sagrados”.) El término se popularizó con la difusión de las primeras filtraciones de Wikileaks en 2010.

Búsqueda caso GürtelEl periodismo de datos requiere sofisticados procesos de alimentación y procesamiento automatizado de datos tabulados o de documentos.  Daedalus ha llevado a cabo experiencias de este estilo con expedientes judiciales particularmente voluminosos (caso Gürtel) o en el caso de los cables del Departamento de Estado americano (CableGate).

Por otro lado, el periodismo de datos supone, sobre todo, un importante cambio cultural y un reto para los medios de comunicación, cuyo papel pasa a ser a menudo el de facilitador o intermediario, siendo el lector (el cliente) quien decide qué explorar en un espacio cuasiinfinito de alternativas.

En las pocas semanas transcurridas desde la celebración de la jornada auspiciada por Fundéu-BBVA y la Fundación San Millán, nuevos robots se han incorporado al gremio periodístico. Así, Associated Press (ver “A leap forward in quarterly earnings stories”) anunciaba que la mayoría de las noticias sobre resultados trimestrales de empresas eran ya producidas por un software de la empresa Automated Insights: textos entre 150 y 300 palabras a partir de los datos facilitados por una compañía de información y análisis financiero. Estos “nuevos empleados” publican 4.400 de estas noticias por trimestre en lugar de las 300 de sus antiguos colegas, seguramente ocupando unos pocos minutos de sus “cerebros” cada día. En definitiva, es otra forma de periodismo de datos, bastante llamativa para el público, pero con un recorrido limitado y un impacto poco preocupante para la profesión periodística… ¡al menos por ahora!

José Carlos González

@jgonzalez_es

Deja un comentario

Tu dirección de correo electrónico no será publicada.