10 Saniyede Özet
Dava, 3 Nisan 2026’da California Kuzey Bölgesi Federal Mahkemesi’nde açıldı ve önerilen toplu dava olarak sunuldu.
Apple’ın STIV başlıklı makalesinde veri kaynakları arasında Panda-70M ve şirket içinde derlenen 42 milyon videoluk başka bir veri seti yer alıyor.
Dava dosyasına göre Panda-70M, 3.098.462 YouTube videosundan türetilmiş yaklaşık 70,8 milyon klip içeriyor.
Davacılar toplu dava onayı, yasal tazminat, ihtiyati tedbir ve avukatlık ücretlerinin karşılanmasını talep ediyor.
Apple, ABD’de açılan önerilen toplu davada YouTube videolarını yapay zeka eğitimi için izinsiz indirip kullandığı iddiasıyla karşı karşıya. Dosyanın merkezinde ise milyonlarca YouTube videosuna işaret eden Panda-70M adlı veri seti ve Apple araştırmacılarının 2024 tarihli teknik makalesindeki veri kaynağı beyanı yer alıyor.
Şimdilik ortada verilmiş bir mahkeme kararı yok. Ancak dava dosyası ile Apple’ın yayımladığı teknik çalışma yan yana geldiğinde şirketlerin yapay zeka modellerini hangi içeriklerle eğittiği sorusu bir kez daha doğrudan hukuk başlığına dönüşmüş durumda.
Tartışmanın merkezinde Panda-70M var
Davayı açan taraflar Ted Entertainment, Matt Fisher ve Golfholics. Mahkeme kaydına göre dosya Apple’a karşı California Kuzey Bölgesi Federal Mahkemesi’nde açıldı. Şikayetin omurgası, YouTube’daki içeriklerin platformun teknik korumaları aşılarak toplandığı ve bu içeriklerin Apple’ın video üretimi odaklı yapay zeka çalışmaları için kullanıldığı iddiasına dayanıyor.

Davacı tarafın öne çıkardığı en kritik nokta Apple’ın kendi yayımladığı STIV makalesi. Bu makalenin “Data” bölümünde veri kaynakları arasında Panda-70M ile Apple içinde derlenen 42 milyon videoluk yüksek kaliteli bir veri seti sayılıyor.
Aynı bölümde bu kaynaklardan 90 milyonun üzerinde video-metin çifti derlendiği yazıyor. Yani dava yalnızca genel bir “AI eğitimi” tartışmasına değil, Apple imzalı teknik metindeki açık veri seti beyanına yaslanıyor.
Apple’ın makalesi neden bu kadar önemli?
STIV makalesi Apple ve UCLA bağlantılı araştırmacıların imzasını taşıyor. Makalede Panda-70M’nin açık biçimde veri kaynağı olarak anılması, dava dosyasında doğrudan dayanak olarak kullanılıyor. Davacılar da tam bu noktadan ilerleyerek, Apple’ın YouTube’dan türetilen bir veri setiyle model eğittiğini kendi akademik yayını üzerinden kabul ettiğini savunuyor.
Panda-70M’nin açık proje sayfası da tartışmayı büyüten bir başka detay içeriyor. Proje açıklamasında veri listelerini içeren CSV dosyaları ile videoları indirmeye yarayan kodların bulunduğu açıkça belirtiliyor. Bu da veri setinin yalnızca başlık ya da özetlerden oluşmadığını, videolara erişim tarafında ayrıca bir indirme katmanı bulunduğunu gösteriyor.
Davacılar ne söylüyor?
Dava dosyasında Panda-70M’nin 3.098.462 YouTube videosundan oluştuğu ve yaklaşık 70,8 milyon klibe karşılık geldiği öne sürülüyor. Yine aynı dosyada veri setinin doğrudan video dosyalarını değil, URL, video kimliği ve zaman damgası gibi işaretleyicileri tuttuğu, bu nedenle eğitimde kullanılabilmesi için ilgili videoların YouTube’dan ayrıca çekilmesi gerektiği savunuluyor. Davacıların temel iddiası da tam burada başlıyor: Apple’ın bu içeriği platformun teknik önlemlerini aşarak topladığı öne sürülüyor.
Dosyada davacı kanalların içeriklerine ilişkin somut eşleşme sayıları da yer alıyor. Ted Entertainment’ın işlettiği h3h3 Productions için 155, H3 Podcast Highlights için 283, Matt Fisher için 8 ve Golfholics için 62 video eşleşmesi gösteriliyor. Bu listeler toplandığında davacı tarafın içeriklerinin veri setinde en az 508 kez geçtiği görülüyor.
Apple için risk nerede büyüyor?
Dosya yalnızca telif ihlali tartışmasıyla sınırlı değil. Şikâyette DMCA kapsamındaki “anti-circumvention” yani teknik korumaları aşma iddiası da açık biçimde yer alıyor. Davacılar, her bir aşma eyleminin ayrı ihlal sayılması gerektiğini savunuyor ve bu nedenle toplu dava onayıyla birlikte yasal tazminat, tedbir kararı, içerik kullanımının durdurulması ve avukatlık ücretlerinin karşılanmasını talep ediyor.
Buradaki kritik nokta şu: dosya yeni açıldı ve şu aşamada iddiaların mahkeme tarafından doğrulanmış bir hükme dönüşmüş hali yok. Buna rağmen Apple’ın kendi teknik makalesinde geçen veri seti adı, davanın en güçlü taşıyıcı unsuru haline gelmiş durumda.
Yapay zekâ modellerinde hangi veri kaynağının kullanıldığı artık yalnızca mühendislik detayı değil, doğrudan dava konusu olabilen bir kayıt izi haline geliyor. Bu, mahkemenin vereceği karardan bağımsız olarak, sektördeki veri şeffaflığı tartışmasını daha da sertleştirecek bir gelişme.
Bir yanıt yazın