**أنطولوجيا تطالب بالتحقق البشري في بيانات تدريب الذكاء الاصطناعي دون التضحية بالخصوصية**

توجه شركة أونتولوجي الأنظار إلى مشكلة متنامية في عالم الذكاء الاصطناعي: كيف يمكنك إثبات أن بيانات التدريب جاءت من شخص حقيقي دون تحويل العملية بأكملها إلى كابوس للخصوصية؟
في منشور حديث، أوضحت الشركة أن الحل لا يجب أن يكون المزيد من المراقبة. بدلاً من مطالبة المساهمين بتقديم صور السيلفي أو بطاقات الهوية أو مسح القزحية أو غيرها من البيانات الشخصية، تقول أونتولوجي إن على الصناعة الاعتماد على بيانات اعتماد قابلة للتحقق والإفصاح الانتقائي، حتى يتمكن الأشخاص من إثبات أنهم بشر دون الكشف عن كل شيء عن أنفسهم.
هذه الفكرة أصبحت أكثر أهمية الآن مما كانت عليه قبل عام. لقد تغير الحديث حول بيانات تدريب الذكاء الاصطناعي بشكل واضح. في الماضي، كان التركيز ينصب على الحجم والكمية وكم البيانات التي يمكنك جمعها. أما الآن، فالسؤال الأكبر هو من أين أتت هذه البيانات، وهل هي من صنع بشري حقًا، وكم منها تلوث بالفعل بالمحتوى الاصطناعي.
لم يعد هذا القلق مجرد مشكلة هامشية. بل أصبح أحد أكبر الصداع الذي يواجه فرق الذكاء الاصطناعي التي تحاول بناء نماذج أنظف وأكثر موثوقية. تقول أونتولوجي إن السوق بدأ بالفعل في التعامل مع “إثبات الشخصية” كأصل قيم. أصبحت البيانات البشرية الموثقة شيئًا قد تضطر الشركات لدفع المزيد للحصول عليه.
الطلب في تزايد، لكن العرض محدود، والطريقة التي تخطط بها العديد من المنصات للتحقق من الأشخاص، من وجهة نظر الشركة، معيبة بشدة. المسار الأسهل لمعظم المنصات هو أيضًا الأكثر انتهاكًا للخصوصية.
المشكلة الحالية: التحقق على حساب الخصوصية
إذا أرادت المنصة معرفة ما إذا كان الشخص إنسانًا، فعادةً ما تطلب المزيد والمزيد من المعلومات الشخصية. قد تطلب صورة سيلفي، أو بطاقة هوية حكومية، أو فحصًا للكشف عن الحياة، أو تتبعًا سلوكيًا، أو بصمة جهاز، أو مزيجًا من كل ما سبق.
كل طبقة إضافية قد تجعل التحقق أكثر ثقة، لكنها تعني أيضًا أن المستخدم يتخلى عن المزيد من الخصوصية. بمرور الوقت، يتحول الشخص الذي يحاول إثبات حقيقته إلى مجموعة من نقاط البيانات المخزنة على أنظمة شخص آخر. ترى أونتولوجي أن هذه مقايضة خاطئة.
الشركة تقول إن المشكلة ليست في أن الأشخاص بحاجة للتحقق. المشكلة هي أن النموذج الحالي يفترض أن التحقق يجب أن يأتي مع كشف دائم. هذا ما يحدث عندما تستخدم الصناعة أدوات مركزية مصممة لجمع أكبر قدر ممكن من البيانات. عمليًا، يصبح الإنسان هو ثمن الثقة.
الابتكار الحقيقي: الإفصاح الانتقائي
البديل الذي تشير إليه أونتولوجي مبني على نموذج بيانات بيانات الاعتماد القابلة للتحقق من W3C الإصدار 2.0، والذي تم الإعلان عنه كتوصية في مايو 2025. الفكرة بسيطة جدًا، حتى لو كانت التشفيرات التي تقف خلفها ليست كذلك: جهة إصدار موثوقة، مثل حكومة أو بنك أو مزود تحقق، يمكنها تأكيد شيء عن شخص ما مرة واحدة، ويمكن لبيانات الاعتماد هذه أن تعيش على جهاز المستخدم الخاص.
عندما تحتاج منصة لاحقًا إلى معرفة ما إذا كان هذا الشخص إنسانًا، يمكن للمستخدم تقديم دليل تشفيري بدلاً من تسليم السجل الكامل الأساسي. هذا يعني أن جهة التحقق تحصل على ما تحتاجه، ولا شيء أكثر.
- تتعلم أن جهة إصدار موثوقة أكدت أن الشخص إنسان.
- لا ترى ملف الهوية الكامل للشخص، أو بياناته البيومترية، أو تفاصيل إضافية أخرى.
- لا تحتاج جهة الإصدار إلى الاتصال بها في كل مرة تُستخدم فيها بيانات الاعتماد.
- المستخدم لا يترك أثرًا من المعرفات القابلة للربط عبر منصات مختلفة.
تقول أونتولوجي إن الابتكار الحقيقي هنا هو الإفصاح الانتقائي. هذا ما يجعل النظام محافظًا على الخصوصية بشكل حقيقي. يمكن أن تحتوي بيانات الاعتماد على الكثير من المعلومات، لكن المستخدم يكشف فقط عن الأجزاء المهمة للطلب المحدد. لذا، إذا كانت المنصة تحتاج فقط إلى إثبات الشخصية، فإنها تحصل على ذلك بالضبط ولا شيء غيره. لا بيانات شخصية إضافية، لا بصمات حيوية، لا أجزاء ملف تعريف قابلة لإعادة الاستخدام يمكن ربطها لاحقًا.
أشارت الشركة أيضًا إلى عملها الخاص في الهوية اللامركزية، بما في ذلك $ONTID ومحفظة ONTO، كأمثلة على هذا النهج عمليًا. وفقًا لأونتولوجي، هذه الأدوات مصممة لإبقاء بيانات الاعتماد على الجهاز والسماح للمستخدمين بتوليد الأدلة محليًا، دون كشف بياناتهم الخاصة لجهات الإصدار أو التحقق.
الخلاصة الأكبر: مستقبل البنية التحتية للذكاء الاصطناعي
النقطة الأكبر، مع ذلك، لا تتعلق فقط بأونتولوجي. إنها تتعلق باتجاه البنية التحتية للذكاء الاصطناعي. بينما تتسابق الشركات لتنظيف بيانات التدريب الخاصة بها ومعرفة ما لا يزال يمكن الوثوق به، فإن الضغط للتحقق من المساهمين البشريين سيزداد فقط. السؤال الحقيقي هو: هل ستحل الصناعة هذه المشكلة ببناء المزيد من المراقبة في النظام، أم باستخدام أنظمة تسمح للأشخاص بإثبات حقيقتهم دون التخلي عن خصوصيتهم في هذه العملية؟
تراهن أونتولوجي بوضوح على الخيار الثاني. ومع قلق شركات الذكاء الاصطناعي الآن بشأن المصدر أكثر من الكمية الخام، قد يبدأ هذا الرهان في الظهور وكأنه ليس مجرد حجة خصوصية هامشية، بل متطلب عملي للمرحلة التالية من جمع بيانات الذكاء الاصطناعي.
الأسئلة الشائعة (FAQ)
س1: ما هي المشكلة التي تحاول أونتولوجي حلها في عالم الذكاء الاصطناعي؟
ج: تحاول أونتولوجي حل مشكلة إثبات أن بيانات تدريب الذكاء الاصطناعي جاءت من بشر حقيقيين، دون انتهاك خصوصية هؤلاء البشر بجمع بيانات شخصية حساسة مثل صور السيلفي أو بطاقات الهوية.
س2: ما هو الحل الذي تقدمه أونتولوجي بدلاً من المراقبة وجمع البيانات؟
ج: الحل هو استخدام “الإفصاح الانتقائي” و”بيانات الاعتماد القابلة للتحقق”، حيث يمكن للمستخدم إثبات أنه إنسان باستخدام دليل تشفيري، دون الكشف عن أي معلومات إضافية غير ضرورية للتحقق.
س3: لماذا أصبح هذا الموضوع مهمًا الآن أكثر من أي وقت مضى؟
ج: لأن شركات الذكاء الاصطناعي لم تعد تهتم فقط بحجم البيانات، بل أصبحت قلقة بشأن مصدر البيانات وما إذا كانت ملوثة بمحتوى اصطناعي. لذلك، أصبحت البيانات البشرية الموثقة أصلًا قيمًا، والطلب عليها يرتفع بينما العرض محدود.












