Att utbilda AI med YouTube-videor strider mot användarvillkoren

YouTubes VD Neal Mohan har klargjort att användandet av videor publicerade på plattformen för att träna modeller med artificiell intelligens (AI), som Sora från OpenAI, utgör ett “tydligt brott” mot användarvillkoren. Mohans kommentarer, under en intervju med Bloomberg, framstår som en varning till OpenAI, skaparna bakom ChatGPT, DALL-E och Sora.

Att utbilda AI med YouTube-videor strider mot användarvillkoren

I korthet:

  • Neal Mohan, VD för YouTube, har uttalat att att utnyttja videor från plattformen för AI-träning, exempelvis för OpenAIs Sora, strider mot användarvillkoren;
  • OpenAIs CTO Mira Murati har uttryckt osäkerhet gällande användningen av material från YouTube (och andra videoplattformar som Instagram och Facebook) för att träna Sora, vilket väcker frågor om företagets metodik för att utveckla sina AI-tekniker;
  • Denna diskussion belyser de juridiska och etiska komplikationerna kring att nyttja licensierat material för att träna AI-system. YouTube VD betonar rättigheterna och förväntningarna hos plattformens innehållsskapare;
  • Debatten kring AI-träning med YouTube-material ingår i en bredare kontext av juridiska och etiska dilemman inom AI-industrin, där transparens och respekten för upphovsrätt blir allt viktigare.

Mira Murati, CTO för OpenAI, har under en intervju med Wall Street Journal uttalat att hon inte är säker på om träning av Sora, en plattform som genererar videor baserat på textkommandon, innefattar data från YouTube eller andra plattformar som Instagram och Facebook.

Sora går till YouTube: Så det finns så mycket AI

Neal Mohan från YouTube påpekar: “Från skaparnas perspektiv, när de laddar upp sitt arbete till vår plattform, finns det vissa förväntningar. En av dessa är att användarvillkoren följs, vilket inte tillåter nedladdning av transkriptioner eller videoklipp. Detta strider klart mot våra användarvillkor. Detta är spelreglerna för innehåll på vår plattform.”

Det är fortfarande oklart exakt hur OpenAI tränar sina AI-plattformar, inklusive ChatGPT, DALL-E och Sora. Möjligen nämnde Mohan transkriptioner specifikt efter att WSJ rapporterat att OpenAI planerar att använda YouTube-videotranskriptioner för att träna GPT-5 – nästa generations “hjärna” för ChatGPT.

Till skillnad från detta, följer Gemini – Googles AI och konkurrent till både ChatGPT och Copilot (Microsofts AI, en partner till OpenAI som använder GPT) – de “spelregler” som Mohan nämnt, särskilt när det gäller YouTube, som också ägs av Google. Enligt plattformens VD använder Gemini enbart videor som följer licensavtalen undertecknade av innehållsskaparna.

Denna fråga markerar ytterligare en utveckling i den röriga situationen relaterad till träning av generativ AI – som “skapar” något nytt – och licensierat material. Stora mediehus och plattformar, såsom Getty Images och The New York Times, har inlett rättsliga åtgärder mot utvecklare av sådana plattformar, med OpenAI ofta i fokus. Men företaget håller fortfarande sin “hemliga formel” väl skyddad.