Garrigues Digital_

Innovación legal en la economía 4.0

 

Garrigues

ELIGE TU PAÍS / ESCOLHA O SEU PAÍS / CHOOSE YOUR COUNTRY / WYBIERZ SWÓJ KRAJ / 选择您的国家

IA y derechos de autor: la sentencia alemana de segunda instancia del caso LAION redefine el alcance del 'opt-out' en el 'text and data mining'

Begoña González Otero, of counsel de Propiedad Industrial e Intelectual de Garrigues y experta en derecho digital

El tribunal concluye que el ‘opt-out’ para evitar la minería de datos (TDM) sólo es válido si es plenamente legible por máquina en el momento de la extracción, de modo que un sistema automatizado pueda identificarlo sin interpretación humana y la cláusula utilizada para proteger la fotografía del demandante, redactada en lenguaje natural, no cumplía este requisito.

El Tribunal Superior Regional de Hamburgo ha confirmado que es posible descargar y utilizar fotografías disponibles en Internet para actividades de TDM destinadas a la creación de datasets para entrenar modelos de inteligencia artificial (IA). Así lo ha establecido en una sentencia del 10 de diciembre de 2025 que, en línea con lo resuelto por el Tribunal Regional, da la razón a la asociación sin ánimo de lucro LAION, amparándose en las excepciones de los artículos 44b (TDM general) y 60d de la ley de derechos de autor alemana (UrhG), en lo que se refiere a la investigación científica. El caso ahora se dirige al Tribunal Supremo alemán, que tendrá ocasión de pronunciarse sobre el alcance de las excepciones de TDM e investigación científica, la calificación del entrenamiento de IA como investigación no comercial y la interacción entre derechos de autor y tratamiento de datos en modelos de IA.

El demandante se oponía al uso de su fotografía para minería de textos y datos

Concretamente, la Sala Quinta de lo Civil del Tribunal Superior Regional de Hamburgo ha desestimado el recurso interpuesto por un fotógrafo contra la sentencia del Tribunal Regional de Hamburgo (310 O 227/23) de 24 de septiembre de 2024. El demandante se oponía a la minería de textos y datos realizada por la asociación sin ánimo de lucro LAION, que afectaba a una de sus fotografías.

El litigio se refiere al uso de la imagen para crear un dataset destinado al entrenamiento de sistemas de IA. LAION pone a disposición del público un dataset gratuito compuesto por pares imagen-texto, estructurado como un documento tabular con hipervínculos a imágenes disponibles en Internet, los archivos correspondientes y sus metadatos, incluida una descripción de la imagen. Este tipo de dataset se utiliza típicamente para entrenar modelos de IA.

Para elaborar el dataset, LAION descargó, entre otras, la fotografía objeto del litigio desde la web de una agencia de imágenes con el fin de cotejarla con la descripción asociada. El fotógrafo solicitaba la prohibición de la reproducción, alegando una infracción de sus derechos de autor.

El Tribunal Regional había desestimado la demanda en septiembre de 2024, y el fotógrafo mantuvo su pretensión ante la instancia superior, que ha confirmado la sentencia de primera instancia, pero ha hecho dos precisiones muy relevantes.

Tribunal Superior Regional: no hay infracción de derechos de autor

El Tribunal Superior Regional de Hamburgo ha dictaminado que el Tribunal Regional desestimó correctamente la demanda. El fotógrafo demandante no tiene derecho a una acción de cesación por infracción de los derechos de autor.

Para fundamentar su decisión, la Sala expone que el demandado puede invocar las restricciones aplicables al uso de la fotografía descargada en virtud del artículo 44b UrhG sobre minería de textos y datos. El Tribunal Regional había dejado abierta su aplicabilidad en su decisión.

1. La necesidad de un ‘opt-out’ legible para para la máquina

El tribunal reconoce que LAION puede acogerse a la excepción general de TDM. La ley alemana define TDM como “el análisis automatizado de una o varias obras digitales o digitalizadas con el fin de obtener información, en particular sobre patrones, tendencias y correlaciones” (artículo 44b. apartado 1 UrhG: “Text und Data Mining ist die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen”).

El fotógrafo, al comercializar sus obras a través de una agencia, queda vinculado por las reservas de derechos que esta implementa. Sin embargo, al momento de la descarga, la reserva publicada en la web no cumplía con los requisitos legales de forma, en particular, la exigencia de que la exclusión del TDM estuviera formulada en condiciones de lectura mecánica conforme al artículo 44b, apartado 3 UrhG.

El tribunal parte de la lógica del artículo 44b apartado 3 UrhG y de su anclaje en el artículo 4.3 de la Directiva 2019/790 y su considerando 18 para construir una noción muy exigente de maschinenlesbar —lectura mecánica—. Recuerda que el legislador europeo entiende que, en el caso de contenidos puestos a disposición en línea, solo es apropiado formular el derecho de reserva mediante medios legibles por la máquina, incluidos metadatos y términos y condiciones del sitio, y que la Exposición de Motivos de la transposición alemana de la Directiva 2019/790 (BT-Drs. 19/27426, p. 89) admite que el opt-out pueda figurar también en el Impressum o en las AGB siempre que, también allí, sea efectivamente legible por sistemas automatizados.

Sobre esa base, la Sala precisa que la lectura por máquina no se agota en que el texto pueda ser captado técnicamente, sino que debe poder interpretarse de forma automatizada, de modo que, en un proceso típico de TDM, el sistema pueda excluir, sin intervención humana, los contenidos cubiertos por el opt-out. Por eso considera insuficiente un texto genérico en las condiciones de uso que prohíbe la evaluación automática de contenidos. Como se desprende del texto de la sentencia, aunque por interpretación humana pueda abarcar tanto el crawling previo como el download para el análisis imagen-texto, se trata de una reserva formulada en lenguaje natural que exige una labor de interpretación semántica que los procesos de scraping y TDM no están diseñados para hacer. En consecuencia, el tribunal concluye que el uso reservado de la agencia no reúne la forma requerida por el artículo 44b apartado 3 UrhG y no puede impedir la aplicación de la excepción.

En paralelo, el tribunal eleva el listón probatorio sobre la lectura mecánica al momento del acto de uso controvertido: “procesalmente, lo que importa es si la forma elegida era legible por una máquina en el momento del acto de uso controvertido (segunda mitad de 2021)” (pág. 20). Y reprocha al demandante que sustente su alegato con posibilidades actuales. La prueba con ChatGPT (que salió al mercado a finales de 2022) y la referencia al weboptout-tool no demuestran que en 2021 existieran herramientas en el mercado capaces de detectar e interpretar automáticamente ese tipo de cláusula, ni que hubiera entonces un mecanismo de lectura mecánica disponible que permitiera a un sistema, en un proceso de TDM masivo, reconocer que la fórmula genérica sobre evaluación automática incluía también la minería de textos y datos. Por ello, basándose en la literalidad de la norma y en la doctrina que cita, que también sitúa en el titular de derechos de autor la carga de alegar y probar esa condición, la sala concluye que no se ha acreditado que el opt-out fuera de lectura mecánica en 2021. En ausencia de esa prueba, la reserva no resulta eficaz y la excepción de TDM se aplica plenamente.

Esto demuestra que la exigencia de lectura mecánica no es formalista, sino funcional y que debe poder integrarse en procesos automatizados de scraping y TDM a gran escala.

La sentencia establece un estándar claro: un opt-out solo es válido si está expresado en una forma que, en el momento del acto de extracción, pueda ser detectada de manera plenamente automática por herramientas comunes, sin requerir comprensión semántica o intervención humana.

La precisión en cómo debe formularse un opt-out eficaz que hace el tribunal alemán también ha de recordarnos que su utilización no es una decisión meramente técnica, sino estratégica. Reservarse frente a la minería de textos y datos puede ser una herramienta legítima para proteger determinados modelos de explotación o preservar control sobre ciertos activos valiosos; sin embargo, también implica limitar la presencia de esos contenidos en los procesos que alimentan y estructuran la actual generación de sistemas de IA. Esta exclusión puede tener efectos indirectos: reducir la diversidad del material accesible para el entrenamiento, alterar la representatividad de ciertos sectores o estilos, o incluso afectar a la visibilidad y circulación futura de las obras en entornos digitales donde la intermediación algorítmica es creciente. Por ello, realizar un opt-out exige una valoración ponderada que combine intereses comerciales, consideraciones de política cultural y, sobre todo, la reflexión sobre qué papel quieren los titulares que sus contenidos desempeñen en los ecosistemas creativos y tecnológicos que se están configurando.

2. La excepción de investigación científica

El tribunal también confirma la segunda excepción alegada: el uso está amparado por el artículo 60d UrhG relativo a la investigación científica. La sentencia constituye el análisis más detallado hasta la fecha en Alemania sobre la aplicación del artículo 60d UrhG (TDM para fines de investigación) a actividades relacionadas con datasets para IA. El tribunal adopta una interpretación amplia, finalista y proinvestigación, que conviene desglosar.

La sentencia interpreta el concepto de institución de investigación siguiendo la Directiva 2019/790 y la voluntad del legislador europeo: “(…) que exige una lectura amplia (…)” (pág. 22).

Y considera suficiente que (a) los estatutos del demandado (LAION) incluyan fines científicos, (b) su actividad contribuya al avance del conocimiento en IA, y (c) que realice procesos estructurados de validación y análisis de datos. Así, concluye que la elaboración del datasets constituye un procedimiento metodológico, estructurado, verificable y orientado al conocimiento, es decir, investigación aplicada.

Esto implica un criterio funcional. No importa la forma jurídica (asociación, fundación, universidad), sino si efectivamente realiza investigación científica. Es más, el hecho de que terceros, incluidos operadores con fines comerciales puedan utilizar posteriormente el dataset no desvirtúa la naturaleza científica del proceso, ya que no existe una influencia determinante de la empresa privada sobre el centro de investigación, conforme a artículo 60d, apartado 2, frase 3 UrhG.

Esto significa que, incluso si no hubiera sido aplicable la excepción general de TDM, la excepción para fines de investigación habría cubierto igualmente la reproducción realizada.

La sentencia no es firme. Se ha autorizado recurso de casación ante el Tribunal Supremo alemán (BGH, por sus siglas en alemán), que probablemente abordará cuestiones cruciales sobre:

  • los límites del artículo 60d UrhG;
  • si el entrenamiento de modelos de IA puede calificarse como investigación científica (aplicada) no comercial;
  • cómo se articula la excepción de investigación con el derecho de autor cuando hay descargas masivas;
  • y cuál es el encaje entre derechos de autor y tratamiento de datos en procesos de IA.

El comunicado de prensa sobre la sentencia puede consultarse aquí y la sentencia completa, en alemán, aquí.