Generatieve AI

De laatste jaren heeft artifical intelligence (AI) een steeds hogere vlucht genomen. Denk alleen maar aan de ontwikkelingen van bekende toepassingen als ChatGPT, DALL-E en Google Gemini. De ontwikkelingen op dit vlak zijn in volle gang. Hoewel er inmiddels diverse AI-toepassingen op de markt zijn, gaat de meeste aandacht uit naar generatieve AI.

Generatieve AI is een vorm van AI waarmee iemand op geautomatiseerde wijze teksten, afbeeldingen, audio en overige content kan genereren. Generatieve AI maakt gebruikt van een zeer grote hoeveelheid input-materiaal, ook wel trainingsmateriaal genoemd. Met dit trainingsmateriaal analyseert of ‘leert’ het AI-algoritme, zodat zij steeds beter in staat is voorspellingen te doen. Hetgeen de AI genereert – de output – is de resultante van deze voorspellingen.

Stel dat ik aan de AI-toepassing DALL-E de opdracht geef om een afbeelding van een kat te genereren, dan zal DALL-E ‘voorspellen’ hoe een kat eruit zal zien. Dat doet DALL-E op basis van de vele afbeeldingen van katten die zij heeft geanalyseerd. Het algoritme van DALL-E zal hebben geleerd wat de uiterlijke kenmerken van katten zijn. De kans dat DALL-E daadwerkelijk een afbeelding van een kat genereert, is afhankelijk van de hoeveelheid trainingsmateriaal waarmee het algoritme is gevoed. Hoe meer trainingsmateriaal, hoe groter de kans dat DALL-E een (realistische) afbeelding van een kat genereert.

Auteursrechtelijke uitzondering voor tekst- en datamining

Generatieve AI is dus afhankelijk van grote hoeveelheden trainingsmateriaal. Maar wat nu als dat trainingsmateriaal auteursrechtelijk beschermd is? Kan de auteursrechthebbende zich ertegen verzetten dat zijn werken gebruikt worden als trainingsmateriaal?

De Europese DSM-Richtlijn heeft in de artikelen 3 en 4 een nieuwe auteursrechtelijke exceptie voor tekst- en datamining geïntroduceerd. Tekst- en datamining gaat over het geautomatiseerd analyseren van grote hoeveelheden ongestructureerde tekst en data. De uitzondering voor tekst- en datamining is geïmplementeerd in artikel 15n en artikel 15o van de Auteurswet.

De regeling komt erop neer dat onderzoeksorganisaties en erfgoedinstellingen zonder toestemming van de auteursrechthebbende tekst- en datamining mogen verrichten met het oog op wetenschappelijk onderzoek. Onderzoeksorganisaties zijn universiteiten en andere onderzoeksinstellingen zonder winstoogmerk of die alle winsten herinvesteren in wetenschappelijk onderzoek. Bij het begrip ‘erfgoedinstelling’ moet men denken aan musea en archieven.

Tekst- en datamining door andere organisaties, zoals rechtspersonen mét winstoogmerk, is ook toegestaan, tenzij de auteursrechthebbende een voorbehoud heeft gemaakt; een opt-out dus. Over dit voorbehoud bepaalt de DSM-richtlijn dat dit ‘uitdrukkelijk’ en op ‘passende wijze’ moet plaatsvinden. Bij werken die online beschikbaar worden gesteld, betekent dit dat het voorbehoud in een machinaal leesbare opmaak moet worden toegepast.

Hoe zo’n voorbehoud er precies moet uitzien, is nog niet bekend. Pictoright heeft op haar website laten weten dat zij een ‘collectieve opt-out’ gaat uitoefenen namens de bij haar aangesloten rechthebbenden. Of dat volstaat, is nog onduidelijk. Wij zullen uiteindelijk moeten wachten op richtinggevende jurisprudentie van het Hof van Justitie. Tot die tijd doen auteursrechthebbenden er verstandig aan een algemeen voorbehoud bij hun werken te plaatsen, bijvoorbeeld in de voorwaarden of metadata van de website waarop het werk geplaatst is.

Databankenrecht

Een gegevensverzameling kan soms bescherming genieten op grond van de Databankenwet. Dat zal het geval zijn indien de verkrijging, de controle of de presentatie van de inhoud van de databank getuigt van een substantiële investering. Het databankrecht komt toe aan de producent van de databank.

De producent van de databank kan optreden tegen derden die substantiële delen van de inhoud van de databank opvragen of hergebruiken. Ook kan de producent optreden tegen derden die herhaald en systematisch niet-substantiële delen van de inhoud van een databank opvragen of hergebruiken.

Ook in de Databankenwet is een uitzondering opgenomen voor tekst- en datamining. Deze vinden wij terug in artikel 4a sub a en b. De omvang van deze uitzondering voor tekst- en datamining is hetzelfde als in het auteursrecht.

AI-verordening

Eind 2022 heeft NORD een blog geschreven over een voorstel van de Europese Commissie voor een nieuwe AI-verordening (ook wel ‘AI Act’ genoemd). In deze verordening was aanvankelijk niets geregeld over auteursrechten. Oorspronkelijk was de AI-verordening bedoeld om mogelijke veiligheidsrisico’s van AI-systemen te beteugelen. Als gevolg van de opkomst van generatieve AI, zoals ChatGPT, is de AI-verordening gewijzigd. In de definitieve tekst, waarmee Europees Parlement akkoord is gegaan op 13 maart 2024 en de Raad van de Europese Unie op 21 mei 2024, is wél iets geregeld over het auteursrecht.

In artikel 53 lid 1 sub c is een verwijzing naar de eerdergenoemde DSM-richtlijn opgenomen. Daarin is geregeld dat aanbieder van AI-modellen voor algemene doeleinden (general purpose AI, zoals ChatGPT) beleid moeten opstellen en invoeren om Europees recht inzake auteursrechten na te leveren, met name wat betreft het eerbiedigen van de voorbehouden, onder meer door middel van ‘geavanceerde technologieën’. Hoe dat er precies uit moet komen te zien en wat de sanctie is op het niet naleven van het beleid, is op dit moment onduidelijk.

Daarnaast staat in artikel 53 lid 1 sub d dat de aanbieder een voldoende gedetailleerde samenvatting moet opstellen en openbaar maken over de voor het trainen van het AI-model voor algemene doeleinden gebruikte content. De gedachte is dat auteursrechthebbenden zo beter in staat gesteld worden om hun rechten te handhaven. Die samenvatting hoeft overigens niet technisch gedetailleerd te zijn. Uit overweging 107 bij de AI-verordening volgt dat die samenvatting breed van karakter moet zijn (‘comprehensive at a general level’). In de toekomst zal het AI-bureau, de nieuwe Europese toezichthouder, een template verschaffen. Tot die tijd geeft overweging 107 wat meer duidelijkheid. Aanbieders kunnen een opsomming geven ‘van de belangrijkste gegevensverzamelingen of -reeksen waarmee het model is getraind, zoals grote particuliere op openbare databanken of gegevensarchieven, en kan een uitleg in de vorm van een relaas worden gegeven over andere gebruikte gegevensbronnen’.

Interessant is dat de AI-verordening ook verplichtingen voor de gebruikers van AI-systemen in het leven roept. Volgens artikel 50 lid 4 moeten gebruikers van een AI-systeem dat beeld-, audio- of videocontent genereert of bewerkt die een deepfake vormt, bekend maken dat de content kunstmatig is gegenereerd of gemanipuleerd. Maar als de content deel uitmaakt van een kennelijk artistiek, creatief, satirisch, fictief of analoog werk of programma, dan is die verplichting beperkt tot de openbaarmaking van het bestaan van dergelijke gegenereerde of bewerkte content op een passende wijze die de weergave of het genot van het werk niet belemmert. Die uitzondering is nog betrekkelijk vaag. Want wanneer is iets evident artistiek, creatief, satirisch of fictief? De tijd zal het moeten leren.

Conclusie

De opkomst van (met name generatieve) AI heeft gevolgen voor de bescherming van auteursrechten. Auteursrechtelijk beschermde werken kunnen immers gebruikt worden voor het trainen van AI-modellen. Het gebruik van auteursrechtelijk beschermde werken voor dit doel is toegestaan, tenzij de auteursrechthebbende een voorbehoud heeft gemaakt. Hoe dat precies moet, is nog onduidelijk, maar auteursrechthebbenden doen er verstandig aan een algemeen voorbehoud bij hun werken te plaatsen, bijvoorbeeld in de voorwaarden of metadata van de website waarop het werk geplaatst is.

Heeft u vragen of auteursrecht of AI, neem dan contact op met NORD Advocaten. Het recht omtrent AI is nog volop in ontwikkeling. De advocaten van NORD volgen dit onderwerp op de voet en kunnen u voorzien van een gedegen advies. Om alvast meer te weten te komen over de belangrijkste regelgeving omtrent AI, kunt u deze blog raadplegen.

AI: artificiële intelligentie
Geplaatst op 29 juli 2024 door Gertjan van den Hout