قانوني

“سيلزفورس” تواجه دعوى جماعية بسبب استخدام مزعوم لبيانات غير قانونية لتدريب الذكاء الاصطناعي

رفعت دعوى قضائية جماعية جديدة في محكمة فيدرالية بسان فرانسيسكو ضد شركة Salesforce العملاقة للبرمجيات، متهمة إياها ببناء نماذجها للذكاء الاصطناعي XGen باستخدام مكتبة قرصنة من الكتب، ثم حذف الإشارات إلى تلك المصادر بمجرد ظهور تساؤلات حولها.

تفاصيل الدعوى القضائية

تشير الدعوى، التي تم رفعها بموجب قانون حقوق النشر، إلى أن Salesforce استخدمت بشكل مستمر مئات الآلاف من الكتب المحمية لحقوق النشر لتطوير سلسلة نماذجها اللغوية XGen. واعتمدت الشركة على مجموعتي بيانات مشبوهتين هما RedPajama و The Pile، واللتان تضمنتا مجموعة كتب تعرف باسم Books3، وهي مجموعة من أكثر من 196,000 كتاب تم نسخها من موقع Bibliotik.

محاولة إخفاء المصادر

في البداية، أدرجت Salesforce مصدر التدريب “RedPajama-Books” عندما أطلقت XGen في يونيو 2023. ومع ذلك، وبحلول سبتمبر، يُزعم أن الشركة حذفت هذه الإشارات من موقعها الإلكتروني واستبدلتها بعبارات غامضة مثل “بيانات لغة طبيعية” من “مصادر متاحة للعموم”. وفي أكتوبر، قام منصة Hugging Face بإزالة مجموعة البيانات Books3 بسبب شكاوى حقوق النشر.

"سيلزفورس" تواجه دعوى جماعية بسبب استخدام مزعوم لبيانات غير قانونية لتدريب الذكاء الاصطناعي

التجارية والإفصاحات المضللة

تدعي الدعوى أيضًا أن الشركة استخدمت مجموعة The Pile لتدريب نماذج CodeGen في عام 2022، ثم جعلت هذه التكنولوجيا تجارية من خلال منصة Agentforce AI الخاصة بها. وبعد شهرين من إطلاق نموذج XGen-Sales في أكتوبر 2024، قامت Salesforce بحذف الإفصاحات الخاصة بها وادعت بأن نماذجها تستخدم “مجموعة بيانات متوافقة قانونيًا” دون ذكر RedPajama.

التحديات القانونية للدعوى

تواجه هذه الدعوى تحديات قانونية، حيث يجب على المؤلفين إثبات ضرر مالي حقيقي وليس مجرد استخدام كتبهم للتدريب. وقد رفض قاضٍ مؤخرًا دعاوى مماثلة ضد شركات أخرى مثل Meta، قائلاً أن مجرد الادعاء بأن “عملنا تم استخدامه” ليس كافيًا. كما أيدت أحكام قضائية حديثة شركتي OpenAI و Anthropic في قضايا مشابهة.

ولكن الخبراء القانونيون يشيرون إلى أن استخدام مجموعات البيانات العامة لا يمحو تلقائيًا انتهاك حقوق النشر المتعمد. إذا علمت الشركة أو تجاهلت أن الأعمال المحمية بحقوق النشر مدرجة، فيمكن للمحاكم أن تجد أن هناك تجاهلًا طائشًا.

مطالب الدعوى

تطالب الدعوى بما يلي:

  • تعويضات مالية محددة قانونيًا.
  • تدمير جميع النسخ التي تنتهك حقوق النشر.
  • استرداد الأرباح التي جنتها الشركة من هذا الاستخدام.
  • إعلان بأن الانتهاك كان متعمدًا.
  • دفع المصاريف القانونية للمدعين.

الأسئلة الشائعة

ما هي المشكلة مع شركة Salesforce والذكاء الاصطناعي؟

اتهمت دعوى قضائية Salesforce باستخدام آلاف الكتب المحمية بحقوق النشر دون إذن لتدريب نماذج الذكاء الاصطناعي XGen الخاصة بها، ثم محاولة إخفاء المصادر التي استخدمتها.

ما هي مجموعات البيانات المثيرة للمشكلة؟

المجموعات المذكورة هي RedPajama و The Pile، وتحديدًا مجموعة فرعية تعرف باسم Books3 والتي تحتوي على أكثر من 196,000 كتاب تم نسخها بشكل غير قانوني.

هل من السهل للمؤلفين الفوز بمثل هذه الدعاوى؟

لا، الأمر ليس سهلًا. يجب على المؤلفين إثبات أنهم تعرضوا لضرر مالي حقيقي بسبب استخدام كتبهم، وليس مجرد إثبات أن كتبهم تم استخدامها في تدريب النماذج، وهو ما شكل تحديًا في دعاوى سابقة ضد شركات كبرى.

حكيم العملات

خبير استراتيجي في سوق العملات الرقمية، يشارك بانتظام نصائح واستراتيجيات مستنيرة للتداول والاستثمار الناجح.
زر الذهاب إلى الأعلى