Usted está aquí

Roboperiodismo: Narrative Science y el futuro de las noticias

¿Los robots serán los nuevos ganadores de premios literarios periodísticos?

Agosto 19, 2015

Hasta ayer nomás cada vez que leíamos algo (sea en una pantalla o en papel, en los diarios o en los libros, en un e-mail o en un informe o “gray paper”) no hacía siquiera falta dudar acerca de qué lo había escrito, porque inevitablemente más allá de la calidad o la veracidad de la información contenida en el texto, era siempre un humano el que estaba detrás de los bloques de texto. Ya no más.

Porque hoy en día y cada vez más a lo largo de los últimos años, una cantidad llamativa de lo que estamos leyendo no está siendo creada por seres humanos, sino por algoritmos informáticos (algowriters). Y aunque deberíamos haber sospechado de que la información que nos agrede 24hs/7días a la semana, no podría estar siendo creada por escritores o amanuenses, a los humanos nos cuesta demasiado aceptar más heridas narcisista que las que en su momento nos infirieron Galileo, Darwin y Freud. La cuarta discontinuidad  es un lindo título de un libro de Bruce Mazlisch (1998). Y su subtítulo "La coevolución de hombres y máquinas" puede sonar beatífico, pero como nos enseñaron las sagas de las películas Robocop y Terminator, la alianza con las máquinas está siempre destinada a ser traicionada. Y es más fácil imaginar que nos quieren exterminar por la fuerza que copiando nuestra capacidad más sublime, cual es la de escribir y leer, que empresas como Narrative Science y su software Quill están haciendo cada vez mejor.

Porque hoy leemos más que nunca, somos más inteligentes que nunca, y la demanda por informarnos y anoticiarnos crece de un modo tan desmedido, que necesitamos desesperadamente de una industria de “la generación automática de narrativas”.

Las empresa que descollan en este terreno (en la vanguardia tenemos a Narrative Science, pero también a Palantir y Automated Insights) quieren aliviarnos a los humanos del esfuerzo que demanda el proceso de escritura, allegándonos algoritmos y generadores de lenguaje natural que crean un contenido escrito cada vez mas sofisticado, mejor escrito y encima (como a nosotros mismo nos ha sucedido cuando los testamos) indistinguible de cómo y qué escriben los humanos.

El proceso que pasa de los datos a las narrativas es más que simple: alimentamos estas plataformas con algunos datos - estadísticas de ganancias financieras, resultados de partidos de fútbol; series históricas del tipo que sea- para que en segundos, emerja una narrativa para el gusto que cada quien. Los robo-escritores a cargo no sólo regurgitan los datos, sino que crean historias humanas que suenan con el tono a medida - desde serio a descarado - según desee la audiencia.

Hace rato que contamos con algoritmos y generadores de lenguaje natural, pero el volumen y la complejidad de la Big Data que producimos, es tan grande y se reproduce tan rápido, que los simples mortales no podemos hacerles frente, requiriendo de distintas modalidades de inteligencia artificial -en vez de la humana tradicional- para generar sentido a partir de tanto ruido.

Agencias de noticias como Associated Press usan la plataforma Wordsmith (de Automated Insight) para generar 3.000 informes financieros por trimestre, pudiendo escribir una noticia acerca de ganancias financieras a los pocos minutos de conocida la noticia. Forbes utiliza la plataforma Quill de Narrative Science. Los Angeles Times utiliza el algoritmo Quakebot, para analizar los datos geológicos y ser los primeros en comentar sobre terremotos, pero también usa otros algoritmos para mejorar la presentación de informes sobre homicidios.

Todo muy bonito, pero cualquier periodista seguramente se mofará de tanta promesa, sosteniendo que para un ojo entrenado y una mente moldeada en los arcanos del buen periodismo de investigación, estas noticias suenan a huecas, repetitivas, sin charme, y alejadas de la prosa concisa y evocativa de un Gabriel García Márquez, de un Tomás Eloy Martínez, de un Richard Kapucinksi o de una Oriana Fallaci.

Después de todo no está nada mal que los robots nos liberen de las tareas repetitivas del procesamiento de datos, regalándonos tiempo para hacer lo que los mejores reporteros hacen que es crear noticias. Otra vez el narcisismo herido nos hace ver espejismos. Nada casualmente Kristian Hammond, co-fundador de Narrative Science estimó que el 90% de las noticias a mediados de la década de 2020 podría ser generado algorítmicamente, muchas de ellos sin la intervención humana.

Además los clientes de Narrative Science, son marcas como Samsung, Comcast, Edmunds.com y Yahoo.com.  Queda claro que la comunicación corporativa y la publicidad hace rato que están en manos de los algowriters. Quizás esa imagen tan contundente de la computadora reemplazando a los creadores en la séptima temporada final de Mad Men solo preanunciaba algo que recién hoy estamos viendo en su plenitud. Y seguramente aún no hemos visto nada.

Los libros son robo-escritos, también. Philip M. Parker, profesor de ciencias de la gestión en la escuela de negocios francesa Insead patentó un sistema algorítmico que ha generado más de un millón de libros, más de 100.000 de los cuales están disponibles en Amazon. Démosle un tema técnico o arcano y su sistema extraerá los datos y escribirá un libro o informe, et voilà, tenemos obras como The 2009-2014 World Outlook for 60-milligram Containers of Fromage Frais.

Si bien hay varias compañías que están trabajando en este territorio la más llamativa es Narrative Science cuyo fundador trabajó en sus días de estudiante en Yale con Roger Schank, se doctoró en ciencias de la computación, fue contratado por la Universidad de Chicago para liderar un nuevo laboratorio de IA, donde creó un sistema que daba seguimiento a la lectura y escritura de documentos y recomendaba artículos análogos. Más tarde creo Stats Monkey, que sumaba resultados de partidos y los convertía en narrativas creíbles de partidos de béisbol de la universidad.

En ese entonces se trataba de un software que escribía historias de béisbol muy limitado. ¿Podría este sistema crear cualquier tipo de historia, o usar cualquier tipo de datos? ¿Podría crear historias lo suficientemente buenas que la gente pagaría para leerlos? El resultado está a la vista. Desde que la compañía se fundó en 2010 pasó mucha agua bajo el puente. La sofisticación de la plataforma sigue un modelo canónico: 1) colección masiva de datos; 2) encaje de los datos en una comprensión más amplia del juego; 3) uso de metaescritores (periodistas especializados) que construyen “templates”; 4) Estructuración de los artículos (siguiendo el modelo de algún reportero o analista histórico destacado).

Una vez que Narrative Science dominó el arte de contar historias de deportes y finanzas, la compañía se dio cuenta de que podría producir mucho más que periodismo. Le llegaron montones de solicitudes de profesionales enterrados bajo hojas de cálculo y gráficos, más que dispuestos a pagar para convertir toda esa información confusa en un par de párrafos legibles.

Cuando la compañía estaba comenzando, los meta-escritores tenían que educar minuciosamente al sistema cada vez que se abordaba un tema nuevo. Pero al poco tiempo se creó una plataforma que hizo más fácil para el algoritmo aprender sobre nuevos dominios. Por ejemplo, uno de los meta-escritores decidió construir una máquina de relatos que produciría artículos sobre los mejores restaurantes en una ciudad determinada.

El tema se puso cada vez más interesante. Narrative Science fue contratada por una empresa de comida rápida para escribir un informe mensual para sus operadores de franquicias que analiza las cifras de ventas, los compara con sus pares regionales, y sugiere determinados elementos de menú. Lo que es más, el bajo costo de la transformación de los datos en las historias hace que sea práctico para escribir incluso para una audiencia de uno. Pero incluso si Narrative science nunca llegará a producir a nivel Pulitzer seguirá capitalizando el hecho de que más y más de nuestras vidas y nuestro mundo se está convirtiendo en datos.

Mas allá de que la fecha que nos da Hammond  en 2030 como el momento en que el 90% de las noticias sea escrito por robots se cumpla ¿tenemos qué preocuparnos mucho, poquito o nada, por este tsunami de robonews?, ¿Los periodistas y reporteros seguirán irremediablemente el camino de los tipógrafos y los telegrafistas?, ¿Tiene sentido imaginar que el universo de la redacción de noticias se ampliará de forma espectacular, a medida que las computadoras minan vastos universos de datos produciendo narrativas ultrabaratas de eventos, tendencias y desarrollos que ningún periodista está cubriendo actualmente?

Como siempre los vaticinios pueden no ocurrir o suceder mucho antes de lo esperado.  Hammond cree que a medida que Narrative Science crece, sus historias subirán en la cadena alimentaria, desde el periodismo de noticias de los productos básicos, al periodismo explicativo y, en última instancia, hasta generar detallados artículos de formato largo.

Tal vez en algún momento, los humanos y los algoritmos colaborarán, con cada término de la pareja jugando a lo que mejor sabe. A medida que las computadoras tengan acceso a más y más datos, sus limitaciones como narradoras irán desapareciendo. Puede ser que lleve un tiempo, pero al final incluso una historia como la que ustedes están leyendo ahora, podría haber sido producida sin que nosotros interviniéramos en lo más mínimo. ¿Y eso es tan malo después de todo?

Como bien dice Morozov la verdadera amenaza no proviene de nuestra creencia o no en el reemplazo de los periodistas (pero también de los educadores, o de los políticos) a manos de los robots. Sino más bien de nuestra negativa a investigar las consecuencias sociales y políticas de vivir en un mundo en el que la lectura anónima se convierte en imposible. Es el mundo en el que los anunciantes, junto con Google, Facebook y Amazon esperan habitar antes que después, pero también es un mundo en que el pensamiento crítico, erudito y poco convencional puede llegar a ser mucho más difícil de cuidar, preservar y florecer. Y eso si que no nos gusta nada.

Referencias

Howard, Alexander. The Art and Science of Data-Driven Journalism
Levy, Steven Can an Algorithm Write a Better News Story Than a Human Reporter?
Morozov, Evgeny A Robot Stole My Pulitzer!  How automated journalism and loss of reading privacy may hurt civil discourse.
El test Did a Human or a Computer Write This? (en inglés) que muestra como la escritura de un humano y de una maquina son cada vez más indistinguibles
Sepulvado, John What Happens When An Algorithm Writes A Story? The Rise of Robo-Journalism
Steiner, Christopher  Automate This: How Algorithms Came to Rule Our World  Hardcover Portofolio, 2012.

*Las opiniones expresadas en esta columna son responsabilidad estricta del autor.
Boletín de noticias
Registre su correo electrónico para recibir nuestras noticias.
Escrito por
ILCE-México, UBA-Buenos Aires
No hay votos aun
Estadísticas: .
Carlos Enrique Sánchez Santamaria
Gran Maestro Premio Compartir 2011
Con el apoyo de las tecnologías logré que los estudiantes convirtieran el pasado de exclusión que vivió éste municipio lazareto en un pretexto para investigar, conocer la historia y conectarnos con el mundo.