Ai ya está aplastando la industria de las noticias

Cuando las compañías tecnológicas lanzaron por primera vez productos generativos-AI, algunos críticos inmediatamente temieron un colapso de los medios. Cada escrito de escritura, imágenes y videos se volvió sospechoso. Pero para los editores de noticias y periodistas, otra calamidad estaba en el horizonte.
Los chatbots han demostrado ser expertos en mantener a los usuarios bloqueados en conversaciones. Lo hacen respondiendo cada pregunta, a menudo al resumir los artículos de los editores de noticias. De repente, menos personas viajan fuera de los sitios generativos de la AI, un desarrollo que representa una amenaza existencial para los medios de comunicación y para el sustento de los periodistas en todas partes.
De acuerdo a Un estudio completoLas descripciones de AI de Google, una característica que resume las páginas web por encima de los resultados de búsqueda habituales del sitio, ya ha reducido el tráfico a sitios web externos en más del 34 por ciento. El CEO de Dotdash Meredith, que publica Gente, Mejores casas y jardinesy Comida y vinorecientemente dicho La compañía se está preparando para un posible escenario “Google Zero”. Algunos han especulado que las caídas de tráfico resultantes de los chatbots eran parte de la razón por la cual los puntos de venta como Interno de negocios y el Punto diario Recientemente han tenido despidos. “Interno de negocios fue construido para un Internet que ya no existe “, dijo un ex empleado recientemente al reportero de los medios Oliver Darcy.
No todos los editores tienen el mismo riesgo: aquellos que dependen principalmente de lectores de interés general que vienen de los motores de búsqueda y las redes sociales pueden estar en peor forma que los editores especializados con suscriptores dedicados. Sin embargo, nadie está totalmente seguro. Lanzado en mayo de 2024, las descripciones de IA se unen a ChatGPT, Claude, Grok, Perplexity y otros productos con AI que, combinado, han reemplazado la búsqueda de más que 25 por ciento de los estadounidenses, según un estudio. Las empresas capacitan chatbots en grandes cantidades de Libros y artículos robadoscomo lo han demostrado mis informes anteriores, y raspar artículos de noticias para generar respuestas con información actualizada. Los modelos de idiomas grandes también entrenan en materiales abundantes en el dominio público, pero gran parte de lo que es más útil para estos modelos, particularmente a medida que los usuarios buscan información en tiempo real de los chatbots, son noticias que existe detrás de un muro de pago. Los editores están creando el valor, pero las compañías de IA están interceptando su público, tarifas de suscripción e ingresos publicitarios.
Le pregunté a Anthrope, XAI, Perplexity, Google y OpenAI sobre este problema. Antropic y Xai no respondieron. La perplejidad no hizo comentarios directamente sobre el tema. Google argumentó que estaba enviando un tráfico de “mayor calidad” a los sitios web de los editores, lo que significa que los usuarios supuestamente pasan más tiempo en los sitios una vez que hacen clic, pero se negaron a ofrecer cualquier dato en apoyo de este reclamo. OpenAi me refirió a un artículo Mostrando que ChatGPT está enviando más tráfico a los sitios web en general que antes, pero los números sin procesar son bastante modestos. Según los informes, la BBC recibió 118,000 visitas de ChatGPT en abril, pero eso es prácticamente nada relativo al cientos de millones de visitantes recibe cada mes. El artículo también muestra que el tráfico de ChatGPT ha disminuido para algunos editores.
En los últimos meses, he hablado con varios editores de noticias, todos los cuales ven a IA como una amenaza existencial a corto plazo para sus negocios. Rich Caccappolo, vicepresidente de medios de la compañía que publica el Correo diario—El periódico más grande del Reino Unido por circulación: me dice que todos los editores “pueden ver que las descripciones generales desentrañarán el tráfico que obtienen de la búsqueda, socavando un pilar fundamental clave del modelo de ingresos digitales”. Compañías de IA han reclamado Que los chatbots continuarán enviando a los lectores a los editores de noticias, pero no han citado evidencia para respaldar este reclamo. Le pregunté a Caccappolo si pensaba que las respuestas generadas por AI podrían dejar a su empresa fuera del negocio. “Ese es absolutamente el miedo”, me dijo. “Y mi preocupación es que no va a suceder en tres o cinco años, bromeo que sucederá el próximo martes”.
Los editores de libros, especialmente los de no ficción y libros de texto, también me dijeron que anticipan una disminución masiva en las ventas, ya que los chatbots pueden resumir sus libros y dar explicaciones detalladas de sus contenidos. Los editores han tratado de defenderse, pero mis conversaciones revelaron cuánto se apila el mazo contra ellos. El mundo está cambiando rápido, quizás irrevocablemente. Las instituciones que comprenden la prensa libre de nuestro país están luchando por su supervivencia.
Los editores han estado respondiendo de dos maneras. Primero: acción legal. Se han presentado al menos 12 demandas que involucran a más de 20 editores contra empresas de IA. Sus resultados están lejos de ser ciertos, y los casos podrían decidirse solo después de que se haya hecho un daño irreparable.
La segunda respuesta es hacer acuerdos con compañías de inteligencia artificial, permitiendo que sus productos resuman artículos o capaciten el contenido editorial. Algunos editores, como El atlánticoestán buscando ambas estrategias (la compañía tiene una asociación corporativa con OpenAI y está demandando a Cohere). Se han realizado al menos 72 acuerdos de licencia entre editores y compañías de IA en los últimos dos años. Pero descubrir cómo abordar estas ofertas no es una tarea fácil. Caccappolo me dijo que “sintió un tremendo desequilibrio en la mesa de negociaciones”, un sentimiento compartido por otros con los que hablé. Un problema es que no hay un precio estándar para capacitar una LLM en un libro o un artículo. Las compañías de IA saben qué tipo de contenido desean, y ya han demostrado una capacidad y una voluntad de tomarlo sin pagar, tienen un apalancamiento extraordinario cuando se trata de negociar. Aprendí que los libros a veces han sido licenciados por solo un par de cientos de dólares cada uno, y que un editor que pregunta demasiado puede ser rechazado, solo para que las compañías tecnológicas tomen su material de todos modos.
Otro problema es que el contenido diferente parece tener un valor diferente para diferentes LLM. La compañía de medios digitales Ziff Davis ha estudiado conjuntos de datos de capacitación de IA basados en la web y observado Ese contenido de fuentes de “alta autotruz”, como los principales periódicos y revistas, parece más deseable para las compañías de inteligencia artificial que en el blog y las publicaciones de redes sociales. (Ziff Davis es demandar Operai para capacitar en sus artículos sin pagar una tarifa de licencia). Los investigadores de Microsoft también tienen escrito Públicamente sobre “la importancia de los datos de alta calidad” y ha sugerido que el contenido de estilo de libro de texto puede ser particularmente deseable.
Pero más allá de algunos estudios específicos como estos, hay poca idea de qué tipo de contenido mejora más un LLM, dejando muchas preguntas sin respuesta. ¿Son las biografías más o menos importantes que las historias? ¿Importa la ficción de alta calidad? ¿Vale la pena los libros viejos? Amy Brand, la directora y editora de MIT Press, me dijo que “una solución que promete ayudar a determinar el valor razonable del contenido específico de valor humano dentro del mercado activo para los datos de capacitación de LLM sería muy beneficioso”.
El poder de negociación de un editor también está limitado por el grado en que puede evitar que una compañía de IA use su trabajo sin consentimiento. No hay una forma segura de evitar que las compañías de IA desguren los sitios web de noticias; Incluso el protocolo de exclusión de Robots, el método de exclusión estándar disponible para los editores de noticias, se elude fácilmente. Debido a que las compañías de IA generalmente mantienen sus datos de capacitación en secreto, y debido a que no hay una manera fácil para que los editores verifiquen con qué chatbots resume sus artículos, los editores tienen dificultades para determinar qué compañías de IA podrían demandar o tratar de llegar a un acuerdo. Algunos expertos, como Tim O’Reillyhan sugerido que las leyes deberían requerir la divulgación de datos de capacitación con derechos de autor, pero ninguna legislación existente requiere que las empresas revelen autores o editores específicos que se han utilizado para material de capacitación de IA.
Por supuesto, todo esto plantea una pregunta. Las empresas de IA parecen haber tomado el contenido de los editores ya. ¿Por qué lo pagarían ahora, especialmente porque algunas de estas compañías han argumentado en los tribunales que capacitar LLMS en libros y artículos con derechos de autor es un uso justo?
Quizás los acuerdos son simplemente setos contra una decisión desfavorable en la corte. Si se impide que las compañías de IA entrenen en trabajo con derechos de autor de forma gratuita, entonces las organizaciones que tienen acuerdos existentes con editores podrían estar por delante de su competencia. Los acuerdos de los editores también son un medio para resolver sin litigios, que puede ser un camino más deseable para los editores que son reacios al riesgo o de otra manera inciertos. Pero el erudito legal James Grimmelmann me dijo que las compañías de IA también podrían responder a quejas como las de Ziff Davis argumentando que los acuerdos implican más que capacitar en el contenido de un editor: también pueden incluir el acceso a versiones de limpieza de artículos, acceso continuo a una alimentación diaria o en tiempo real, o una liberación de la responsabilidad por el plagio de su chatbot. Las compañías tecnológicas podrían argumentar que el dinero intercambiado en estos acuerdos es exclusivamente para los elementos que no tienen licencia, por lo que no pagan por material de capacitación. Vale la pena señalar que las empresas tecnológicas casi siempre se refieren a estos acuerdos como asociaciones, no acuerdos de licencia, probablemente por este motivo.
De todos modos, el ingreso modesto de estos arreglos no va a ahorrar a los editores: incluso un buen negocio, me dijo un editor, no se acercará a los ingresos perdidos de la disminución de los lectores. Los editores que pueden descubrir cómo sobrevivir al asalto generativo-AI pueden necesitar inventar diferentes modelos de negocio y encontrar nuevas corrientes de ingresos. Puede haber estrategias viables, pero ninguno de los editores con los que hablé tiene una idea clara de lo que son.
Los editores se han acostumbrado a las amenazas tecnológicas en las últimas dos décadas, quizás en particular la pérdida de ingresos publicitarios en Facebook y Google, una compañía que recientemente se descubrió que tenía un monopolio ilegal En publicidad en línea (aunque la compañía ha dicho que atraerá el fallo). Pero el surgimiento de la IA generativa puede significar la fatalidad para la cuarta finca: con IA, la industria tecnológica incluso priva a los editores de una audiencia.
En el caso de la extinción masiva del editor, algunos periodistas podrán soportar. La llamada economía creadora muestra que es posible proporcionar noticias e información de alta calidad a través de Sushack, YouTube e incluso Tiktok. Pero no todos los reporteros pueden simplemente moverse a estas plataformas. El periodismo de investigación que expone la corrupción y la malversación por parte de personas y empresas poderosas conlleva un riesgo grave de repercusiones legales y requiere recursos, como el tiempo y el dinero, que tienden a ser escasos para los trabajadores independientes.
Si los editores de noticias comienzan a salir del negocio, ¿no sufrirán las empresas de IA? Sus chatbots necesitan acceso al periodismo para responder preguntas sobre el mundo. ¿La industria tecnológica no tiene interés en la supervivencia de los periódicos y revistas?
De hecho, hay señales de que las compañías de IA creen que los editores ya no son necesarios. En diciembre, en El New York Times‘Dealbook Summit, se preguntó al CEO de Operai, Sam Altman, cómo los escritores deberían sentirse acerca de que su trabajo se utilice para la capacitación de IA. “Creo que necesitamos un nuevo acuerdo, estándar, protocolo, como quieras llamarlo, para cómo los creadores van a ser recompensados”. Describió un régimen de “opción” donde un autor podría recibir “micropagos” cuando se usó su nombre, semejanza y estilo. Pero esto no podría estar más lejos de la práctica actual de OpenAi, en la que los productos ya se están utilizando imitar Los estilos de artistas y escritores, sin compensación o incluso una opción efectiva.
También se le preguntó al CEO de Google, Sundar Pichai, sobre la compensación del escritor en la cumbre de Dealbook. Sugirió que surgiría una solución de mercado, posiblemente una que no involucraría a los editores a largo plazo. Esto es típico. Como en otras industrias han “interrumpido”, los magnates de Silicon Valley parecen percibir las instituciones antiguas y establecidas como intermediarios para ser eliminados para una mayor eficiencia. Los conductores de Uber atrajeron a trabajar para ello, aplastaron la industria tradicional de taxisy ahora controla los salarios, beneficios y cargas de trabajo algorítmicamente. Esto ha significado una mayor conveniencia para los consumidores, al igual que la IA posiblemente lo haga, pero también ha demostrado ruinoso Para muchas personas que alguna vez pudieron ganar un salario digno de la conducción profesional. Pichai parecía imaginar un futuro que puede tener una consecuencia similar para los periodistas. “Creo que habrá un mercado en el futuro, habrá creadores que creen para AI”, dijo. “La gente lo resolverá”.