Los gigantes de la IA tratan de sortear la regulación europea pactando con grandes grupos de comunicación

Prisa se consolida como el interlocutor de las tecnológicas y añade Meta a la lista de acuerdos en la que ya estaban OpenAI o Google
El Parlamento Europeo exige a Bruselas que las empresas de IA paguen por el uso que hacen de cada una de las noticias, no una “tarifa plana”
Exclusivo para socias y socios

Logotipos de los principales chatbots del mercado a comienzos de 2026. infoLibre

No conocemos las condiciones exactas del primer acuerdo que Prisa Media firmó con OpenIA en marzo de 2024: cuánto dinero, por cuántos artículos, con qué cláusula de renovación. Los pactos entre los gigantes tecnológicos de la inteligencia artificial y los grandes grupos de comunicación tienen algo en común con los tratados de paz: se anuncian en comunicados triunfales pero entierran todos los detalles.

Aun así, lo que sabemos es suficiente para entender la dirección en la que se mueve el mercado. Y lo que no sabemos sobra para entender por qué los medios pequeños, regionales, locales e independientes están preocupados.

Desde 2023, las empresas de inteligencia artificial generativa —OpenAI, Meta, Google, Microsoft, Amazon, Perplexity— han necesitado responder a la misma pregunta incómoda: ¿de dónde sacan el texto con el que entrenan sus modelos? La respuesta es que lo toman de internet. Y una parte sustancial de ese "internet" estaba y está hecho de periodismo: crónicas, reportajes, análisis, entrevistas. El trabajo de redacciones financiadas con suscripciones y publicidad, que forman opinión pública, y a las que nadie consultó antes de convertir su producción en datos de entrenamiento.

El conflicto no es un debate técnico sobre modelos de lenguaje. Trata sobre a quién pertenece el valor que genera el periodismo. Y la respuesta que está dando el mercado es que pertenece, en gran medida, a quien tiene más capacidad de negociación.

La arquitectura del expolio

Los modelos de lenguaje como ChatGPT, Gemini o Claude se entrenan con enormes corpus de texto extraídos de la red. Cuanto más rico y diverso es el material de entrenamiento, mejor funciona el modelo. El periodismo de calidad —con su precisión factual, su variedad temática, su diversidad de registros— es un activo extraordinariamente valioso. El problema es que fue tomado sin permiso.

Las empresas de IA arguyen que el rastreo de contenidos públicos está amparado por la excepción de la minería de datos de la normativa europea de 2019. Los editores rechazaron esa interpretación desde el primer momento. El resultado fue una acumulación de litigios, presiones regulatorias y, finalmente, una carrera por firmar acuerdos que pusieran un precio —aunque tardío— al uso de ese material.

Pero los acuerdos no resuelven el problema de fondo. Un sistema como AI Overviews de Google no solo se entrenó con artículos periodísticos: los resume en tiempo real y los sirve al usuario en la página de resultados, sin que este necesite hacer clic en el enlace original. El medio que financió el sueldo del periodista, el viaje y las horas de edición ve cómo su trabajo llega al usuario sin pasar por su web. Sin clic que genere publicidad. El periodismo se ha convertido en el combustible de un negocio que, en su fase extractiva, no deja nada a cambio.

El mapa de los acuerdos

En España, el actor central de quienes están cobrando a los gigantes de la IA es Prisa Media. La empresa propietaria de El País, la Cadena SER, Cinco Días, As y el Huffpost ha firmado con cuatro operadoras de IA en menos de dos años: con OpenAI, con Meta, con Google y con Perplexity. Prisa se ha convertido, de facto, en el interlocutor del periodismo español ante las grandes tecnológicas.

En el resto de Europa, el patrón es idéntico. OpenAI tiene acuerdos con Axel Springer, Le Monde, el Financial Times, The Guardian y Schibsted. Meta ha fichado a Le Figaro, Süddeutsche Zeitung, Reuters y News Corp. Microsoft colabora con Informa, Axel Springer, el FT y Reuters. Mistral cerró un acuerdo con la AFP. Amazon se alió con Reach, Condé Nast y Hearst.

La lista tiene una característica que se vuelve evidente al leerla entera: todos los nombres son grandes. Todos los medios firmantes tienen decenas o cientos de millones de lectores, archivos históricos de décadas y equipos jurídicos capaces de revisar contratos complejos. Ninguno es un periódico provincial, una revista especializada, un nativo digital de medio alcance. Ninguno.

Por qué las tecnológicas se oponen a la regulación

La posición pública de las grandes empresas de IA descansa en tres argumentos. El primero es el de la innovación: cuando Meta rechazó, en agosto de 2025, firmar el Código de Buenas Prácticas de la UE en materia de inteligencia artificial, argumentó que introduce incertidumbres legales que ahogarán el desarrollo de la IA en Europa. Lo que no dijo es que "incertidumbre legal" es su manera de decir que no quiere quedar obligada a publicar qué datos usaron para entrenar sus modelos.

El segundo es el de la complejidad técnica: alegan que un modelo de pago proporcional al uso real de cada contenido es inviable porque no existe infraestructura para medirlo. Esto es parcialmente cierto. Pero la solución que proponen —la tarifa plana— no resuelve el problema de la atribución: lo elimina. Pagar una cantidad fija anual desvincula la compensación del uso real: el valor específico de cada pieza periodística desaparece en el bulto.

El tercero es el del mercado voluntario: sostienen que el ecosistema de licencias está tomando forma solo. Lo que no explican es que el mercado que toma forma es el de los grandes grupos. No funciona para el periódico regional que no tiene peso –ni recursos– para ser un interlocutor válido con las oficinas de OpenAI.

El argumento que las empresas raramente formulan en público es más simple: negociar con pocos actores grandes es más eficiente que hacerlo con muchos pequeños. Gestionar un acuerdo con Prisa Media tiene el mismo coste administrativo que uno con un periódico local de 10.000 lectores, pero el primero da acceso a décadas de archivo en cuatro cabeceras nacionales. Las cifras conocidas hablan solas: News Corp obtuvo 50 millones de dólares anuales de OpenAI; Axel Springer genera cifras de ocho dígitos. Los medios fuera de esa categoría no tienen cifra porque no tienen acuerdo.

El ‘informe Voss’

El último acuerdo firmado por Meta con varios medios europeos, entre ellos los del Grupo Prisa, se ha conocido pocos días después de que el Parlamento Europeo, el pasado 12 de marzo, aprobase el informe sobre IA que lleva el nombre del eurodiputado de la CDU alemana Axel Voss. No es una directiva vinculante —ese es su límite principal— pero es el diagnóstico más preciso que ha producido hasta ahora una institución europea sobre este conflicto. Su lectura revela algo importante: los legisladores europeos entienden exactamente lo que está pasando. Y ya le han pedido a la Comisión que actúe.

El punto de partida es una afirmación que las empresas de IA llevan años esquivando: la IA generativa se ha entrenado masivamente con obras protegidas sin autorización. No como accidente ni zona gris, sino como práctica sistemática. El informe reafirma que el derecho de autor es algo que ninguna excepción tecnológica puede erosionar e introduce el concepto de ”acceso lícito”: solo puede ampararse en la excepción de minería de datos quien primero accedió legalmente al contenido.

En el plano operativo, el informe pide a la Comisión un nuevo marco jurídico que cubra no solo el entrenamiento inicial de los modelos, sino también la inferencia —el momento en que el modelo genera una respuesta— y la generación aumentada mediante recuperación: el sistema por el que algunos modelos consultan fuentes externas en tiempo real. Es una distinción técnica con consecuencias económicas enormes: cada vez que un modelo usa contenido periodístico para construir una respuesta, ese uso debería ser licenciable y remunerado.

El informe exige además transparencia: listas detalladas del contenido protegido usado para entrenamiento y usos posteriores, registros de actividades de rastreo, y que la Oficina de Propiedad Intelectual de la Unión Europea (EUIPO) actúe como intermediaria para gestionar mecanismos de exclusión y mercados de licencias sectoriales.

Rechaza también las tarifas planas: un modelo de licencia global a cambio de pago único diluye el valor de cada contenido y amenaza la diversidad sectorial. Defiende en su lugar licencias voluntarias con remuneraciones proporcionales al uso efectivo. Y añade un elemento que suele pasarse por alto: pide estudiar soluciones para remunerar los usos ya realizados. Reconoce, en otras palabras, que el daño ya ocurrió y que hay que buscar mecanismos para compensarlo retroactivamente.

Para los medios, el informe reserva un bloque específico: control efectivo sobre sus contenidos tanto para entrenamiento como para productos que compiten con ellos, compensación por desvío de audiencia e ingresos, protección especial explícita para medios locales y regionales, y prohibición de que los sistemas de IA favorezcan selectivamente ciertas cabeceras.

Es la propuesta regulatoria más completa que existe hoy en Europa. Su debilidad es que es una resolución parlamentaria, no una ley. Las empresas de IA la leen con atención. Y mientras leen, siguen firmando acuerdos de tarifa plana. Para protegerse, al menos ante los grandes grupos de comunicación, que son además los más influyentes en las políticas de Bruselas.

La batalla judicial

Mientras tanto, la batalla judicial continúa. En febrero de 2026, el Consejo Europeo de Editores de Medios demandó a Google ante la Comisión Europea. El argumento conecta con lo que el informe Voss llama “productos que compiten directamente” con los medios: cuando AI Overviews genera un resumen tan completo que el usuario ya no necesita leer el artículo original, Google no está citando al periodismo, sino suplantándolo. El usuario obtiene la información, el medio pierde el clic, Google se embolsa el dinero que genera la publicidad.

En España, CEDRO denunció a Google ante la Comisión Nacional de los Mercados y la Competencia (CNMC) por abuso de posición dominante. El expediente se cerró en diciembre de 2025 con compromisos vinculantes para todos los editores y agencias españolas: más transparencia sobre cómo se calcula la remuneración, un procedimiento de negociación estructurado, revisión anual de las ofertas económicas y posibilidad de remuneración retroactiva.

El Tribunal de Justicia de la UE examina por su parte si los resúmenes generados por IA constituyen una reproducción ilícita que vulnera la protección especial de los editores reconocida en la Directiva de Copyright de 2019.

Los que esperan fuera

Al margen se están quedando, al menos por el momento, los medios pequeños y locales, que están siendo utilizados —sus contenidos rastreados, incorporados a modelos, usados para generar respuestas— sin recibir compensación, sin capacidad técnica para verificar si su trabajo está en los corpus de entrenamiento y sin recursos legales para impugnar esa situación. El informe Voss los menciona como sujetos que merecen protección especial. Pero una mención en una resolución no es un cheque ni un acuerdo comercial.

Hay además un problema que los grandes acuerdos no solucionan. Si quienes habrían visitado la web de un medio ya no lo hacen porque la IA les dio la respuesta, ningún ingreso por licencias compensa esa pérdida. Los acuerdos actuales no contemplan el valor del lector a largo plazo: la suscripción, la fidelización, la relación sostenida con la audiencia. El modelo de negocio del periodismo financiado por audiencia está siendo erosionado con independencia de si el medio firmó o no un acuerdo.

Bruselas obliga a Google a abrir su sistema operativo a proveedores de IA

Frente a esta asimetría, CEDRO y la Asociación de Medios de Información (AMI) defienden la gestión colectiva: ningún autor individual puede negociar con las grandes plataformas en condiciones de igualdad, pero una entidad que agrupa a miles de creadores sí puede. El informe Voss respalda esta vía al pedir que la EUIPO apoye mercados de licencias sectoriales con participación de entidades de gestión colectiva. CEDRO defiende además que el contenido no se use salvo que el medio lo autorice expresamente. Porque una vez que los contenidos han entrado en el corpus de entrenamiento, no existe mecanismo técnico para retirarlos. El permiso que no se pidió al principio se puede solicitar retroactivamente, pero no sirve para nada.

Lo que está en juego no es solo una cuestión de derechos de autor. Es si el periodismo local, el especializado, el de investigación —el que no puede permitirse un equipo jurídico ni una ronda de negociación en San Francisco— va a poder seguir existiendo en un ecosistema donde su trabajo alimenta sistemas que no le pagan y que le quitan tráfico. El informe Voss dice que no debería ser así. El mercado, por ahora, alimenta lo contrario.

Y mientras las directivas maduran en Bruselas, los corpus de entrenamiento están cerrados, los modelos de IA desplegados y los contenidos de miles de redacciones que nunca han recibido —ni recibirán— una llamada de las grandes empresas tecnológicas ya forman parte de la inteligencia artificial que hoy compite con ellas. En la mayoría de los debates sobre copyright, el daño está por venir. Aquí el daño ya se produjo, pero sigue teniendo lugar. Lo que se negocia ahora no es el futuro: es si alguien va a pagar, y a quién, por lo que ya ocurrió. Y por lo que está pasando cada día.

Más sobre este tema