Periodismo
La IA reproduce con los medios el desequilibrio de poder que ya impusieron las plataformas
Las empresas de inteligencia artificial (IA) llevan años leyendo la prensa. Leyéndola, copiándola y usándola para entrenar los sistemas que ahora responden preguntas de millones de personas. A cambio, los medios de comunicación reciben visitas. Muy pocas visitas.
Por cada cien páginas de periodismo que los robots de Anthropic —la empresa detrás del asistente Claude— rastrearon en sitios de noticias, devolvieron en tráfico el equivalente a una décima parte de una visita humana. En OpenAI la proporción no es mucho mejor.
La consecuencia ha sido que la inteligencia artificial genera hoy el 0,04% del tráfico externo que reciben los editores de noticias. Y ahora, con esa extracción masiva ya consumada, las mismas empresas que la han padecido ofrecen a los medios un acuerdo para cobrar por el uso futuro de sus contenidos.
Estos datos, recogidos en un informe publicado en abril de 2026 por el Open Markets Institute y el Center for Media and Digital Governace (CMDG) describen una estructura de poder que, según ese mismo informe y un segundo estudio del Media and Journalism Research Center publicado en mayo, reproduce fielmente el modelo que ya arruinó la relación entre los medios y las plataformas digitales durante la primera década de este siglo.
Cuando los grandes modelos de lenguaje empezaron a ingerir internet, los editores de noticias no fueron convocados a ninguna negociación. El entrenamiento de esos sistemas se hizo, mayoritariamente, sin consentimiento, sin compensación y sin que los medios tuvieran siquiera acceso a los datos de qué contenido suyo se había usado y en qué proporción. Más de cien demandas por infracción de derechos de autor se acumulan hoy en los tribunales estadounidenses y en media docena de países más.
Lo que se negocia ahora, en su mayor parte, no es ese entrenamiento histórico. Es otra cosa. Las empresas de IA necesitan que sus sistemas de respuesta en tiempo real, los que funcionan cuando un usuario hace una consulta al chatbot, tengan acceso a información actualizada y contrastada. Esa tecnología se llama RAG (retrieval augmented generation) y consiste, simplificando, en que el modelo consulta fuentes externas antes de responder para no limitarse a lo que aprendió durante el entrenamiento. Y como ahora todo el mundo sabe de dónde toman los datos, necesita licencias. Y ahí es donde los medios tienen, por primera vez, algo de poder de negociación. Algunos medios. Pocos.
El resultado es un mercado naciente que el primero de los dos informes citados mapea con detalle. OpenAI ha firmado acuerdos con unos 35 editores. Microsoft lanzó en febrero de 2026 su Publisher Content Marketplace con un grupo inicial de grandes cabeceras estadounidenses. Perplexity tiene un programa de socios que cubre unas 20 publicaciones. Los números que se han filtrado son llamativos: News Corp –propietario de al menos una cincuentena de medios, como The Sun en Reino Unido o The Wall Street Journal en EEUU– habría cerrado un contrato de cinco años valorado en unos 250 millones de dólares. Thomson Reuters (dueño de la agencia Reuters) declaró 33 millones en ingresos por licencias de IA solo en los primeros meses de 2026. Amazon paga a The New York Times unos 20 millones anuales.
Los beneficiarios
Son cifras que suenan bien sobre el papel. Hasta que se examina a quién están beneficiando.
Los acuerdos bilaterales descritos son, casi sin excepción, contratos entre empresas tecnológicas y grupos mediáticos con presencia internacional, departamentos jurídicos propios y suficiente peso de marca como para que las plataformas los quieran sentados en la mesa. Prácticamente todos son anglosajones o del norte global.
La prensa local, regional, en lenguas minoritarias, étnica e indígena no existe en este mercado. No tiene el reconocimiento de marca que atrae el interés de OpenAI. No tiene abogados especializados en propiedad intelectual. No tiene capacidad técnica para detectar cuándo sus contenidos son rastreados, ni con qué frecuencia, ni para qué fin. En muchos casos, ni siquiera sabe si sus artículos forman parte de los datos de entrenamiento de los modelos que ahora responden preguntas sobre sus propias coberturas locales.
El informe Same Gatekeepers, New Tollbooths, elaborado por las investigadoras Courtney Radsch y Karina Montoya para el Center for Media and Digital Governance, sostiene que la distribución de ingresos del mercado de licencias de IA seguirá probablemente una curva de potencia muy pronunciada. Un puñado de grandes grupos captará la mayor parte del valor. Miles de cabeceras locales e independientes no recibirán prácticamente nada. Y eso, señalan las autoras, no refleja cómo está distribuido el valor informativo real del periodismo. Refleja cómo está distribuido el poder de mercado.
Para España, la consecuencia es directa. Los medios independientes, los comarcales, las radios municipales digitales, los nativos digitales locales que cubren lo que nadie más cubre en sus territorios son exactamente el tipo de publicación que este mercado ignora. No por mala voluntad declarada, sino porque el diseño estructural del sistema los excluye antes de que empiece la negociación.
Hay otro problema más profundo que los informes identifican y que tiene consecuencias a largo plazo. La métrica que domina las negociaciones actuales, el criterio con el que las empresas de IA justifican lo que pagan, es el tráfico de referencia. Cuántas visitas genera la presencia de un medio en los resultados del chatbot. Cuántos clics devuelve el sistema al sitio original.
Esa métrica es heredada de la era de las plataformas sociales y tiene el mismo defecto congénito que entonces. Mide solo una fracción de lo que el periodismo aporta a los sistemas de IA. Los modelos de lenguaje no solo usan el periodismo para responder preguntas en tiempo real. Lo utilizaron para aprender a razonar, a construir argumentos, a redactar con coherencia, a distinguir hechos verificados de rumores. Todo eso ocurrió durante el entrenamiento, sin compensación, y el debate público sobre licencias lo da por amortizado o lo trata como un asunto puramente jurídico pendiente de resolución en los tribunales.
Una valoración diferente
Para corregirlo, el informe del CMDG propone un marco de valoración diferente. La contribución del periodismo a la IA tiene, como mínimo, cuatro dimensiones. La primera es la capacidad lingüística y de razonamiento que los modelos extrajeron de décadas de prosa periodística de calidad. La segunda es el anclaje factual, el mecanismo por el que los hechos sobre el mundo se establecen y verifican públicamente. La tercera es la actualidad, la información de tiempo real que los chatbots —Claude, ChatGPT— necesitan para ser útiles. La cuarta es la legitimidad cívica, la credibilidad que los sistemas de IA heredan cuando citan fuentes periodísticas reconocidas.
Pagar solo por el tráfico de referencia que generen las consultas a la IA es, en este análisis, un error categórico que beneficia a las empresas de IA. Es como tasar una casa sin examinar el estado de la cubierta, de la estructura y de los cimientos.
Tal es el potencial del negocio que está en juego que entre los grandes acuerdos bilaterales y el vacío en el que navegan la mayoría de los medios ha surgido un ecosistema de startups intermediarias. TollBit, Sphere.ai, ScalePost, Defined.AI, ProRata, Miso.ai. Más de una docena de empresas que ofrecen distintas versiones del mismo servicio básico: conectar a los editores con las empresas de IA, gestionar los permisos de rastreo, cobrar por cada consulta o por cada acceso y repartir los ingresos.
Los modelos varían. TollBit y Sphere.ai dicen quedarse con cero comisión sobre los ingresos del editor. ScalePost aplica un 15%. Cloudflare, que gestiona aproximadamente el 20% del tráfico mundial de internet y ha convertido el bloqueo de crawlers de IA –los programas automáticos que recorren internet leyendo páginas web de forma masiva y continua– en opción predeterminada para sus clientes, operaría con una comisión de entre el 20% y el 30%. ProRata, que ha desarrollado tecnología de atribución para calcular la contribución de cada fuente a cada respuesta generada y reparte los ingresos en proporción, se queda con el 50%.
El problema estructural de este ecosistema intermediario es que reproduce, en formato acelerado, la misma trayectoria que tuvo el ad tech, el sector de tecnología publicitaria que durante la década pasada fue acumulando startups especializadas hasta que Google y Meta las absorbieron o las hicieron irrelevantes. La mayoría de estas empresas están financiadas por capital riesgo. Son, por tanto, potencialmente adquiribles por las mismas grandes tecnológicas de las que nominalmente protegen a los editores.
El segundo informe, firmado por Marius Dragomir director y fundador del Media and Journalism Research Center (MJRC), amplía el análisis hacia una pregunta más incómoda. No solo quién cobra qué, sino qué ocurre con el pluralismo informativo cuando los sistemas automatizados deciden, a través de criterios de licencia y de recuperación de datos, qué fuentes son visibles y cuáles no.
Dragomir introduce el concepto de Orden de Información Automatizado para describir el sistema que está reemplazando al ecosistema mediático como infraestructura de conocimiento público. Un ciudadano que pregunta a un asistente de IA qué decidió su gobierno ayer recibe una respuesta fluida y confiada que puede no citar al medio local que publicó la información, porque ese medio no está en la red de licencias del sistema. La respuesta puede ser técnicamente correcta y, al mismo tiempo, quedar sistemáticamente empobrecida porque quien la recibe no sabe cuál es su origen.
El pluralismo, argumenta Dragomir, no es lo mismo que la exactitud. Un sistema puede dar respuestas correctas y seguir estrechando el espacio informativo si cita siempre las mismas fuentes dominantes, ignora el periodismo local, excluye las lenguas minoritarias o aplana los debates sobre asuntos controvertidos. Los instrumentos clásicos de medición del pluralismo mediático, construidos sobre datos de propiedad, audiencia y línea editorial, no detectan este tipo de concentración porque opera en capas que esos instrumentos no miden.
Google y OpenAI destrozan el modelo de negocio de los medios mientras pelean por el control de la atención
Ver más
El problema es que la oportunidad de resolver este doble problema se está acabando, aseguran tanto Radsch y Montoya como Dragomir. Las estructuras contractuales, las tasas de intermediación y las normas de gobernanza que se fijen ahora serán difíciles de revisar cuando se normalicen. La historia de los medios con las plataformas sociales lo ilustra con bastante claridad. Los editores aceptaron condiciones estructuralmente desfavorables porque el tráfico inmediato parecía compensarlas. Cuando quisieron renegociar, la infraestructura ya era demasiado costosa de abandonar.
Los modelos legislativos que los informes señalan como referencias son el Código de Negociación de Australia, la Ley de Noticias Online de Canadá y el derecho afín de la Directiva de Copyright europea, que en España se transpuso como el llamado canon AEDE, luego reformado. Ninguno es perfecto. Todos tienen en común algo que los informes consideran esencial: establecen que la elegibilidad para la compensación es una decisión de política pública, no una preferencia comercial de la plataforma. Quien decide qué medios reciben dinero no puede ser la misma empresa que decide cuánto paga.
Sin esa separación, el mercado de licencias de IA no es un nuevo modelo de financiación del periodismo. Será el mismo modelo de patrocinio de siempre, con nuevas pantallas.