باولو أردوينو من تيثر يدعم نماذج الترجمة المصغّرة داخل الأجهزة

تحدث باولو أردوينو، الرئيس التنفيذي لشركة Tether، عن نوع مختلف تماماً من الذكاء الاصطناعي: الترجمة التي تتم بالكامل على الجهاز نفسه، دون إرسال النصوص الحساسة إلى السحابة.
في منشور حديث، ركز أردوينو على موضوع الخصوصية والسرعة والتطبيق العملي. فكرته كانت بسيطة، لكنها تتعلق بمشكلة يواجهها ملايين المستخدمين يومياً. عندما يترجم شخص ما ملاحظة طبية، أو رسالة خاصة، أو عقداً قانونياً، أو حتى مذكرات شخصية عبر خدمة سحابية، فإن هذا النص يغادر جهازه ويدخل إلى بنية تحتية لشخص آخر.
في كثير من الحالات، لا يعرف المستخدمون أين تذهب بياناتهم، أو كم من الوقت يتم الاحتفاظ بها، أو من يمكنه الوصول إليها. قال أردوينو إن هذا ليس مجرد قلق نظري، بل هو حقيقي، خاصة في الحالات التي تكون فيها السرية مهمة.
وفقاً لأردوينو، الحل ليس الاعتماد على نماذج ذكاء اصطناعي عامة أكبر وأكبر. بدلاً من ذلك، قال إن الترجمة هي إحدى المهام التي يمكن فيها للنماذج الصغيرة المتخصصة أن تهزم “جالوت”.
في رأيه، إذا كانت المهمة هي الترجمة من لغة إلى أخرى، فلا داعي لاستخدام نموذج ضخم يمكنه أيضاً كتابة الشعر، وتلخيص المقالات، وأداء عشرات المهام غير المرتبطة. للترجمة، نموذج متخصص مصمم لغرض واحد يمكن أن يكون أصغر وأسرع وأكثر موثوقية.
تتفوق على نماذج اللغات الكبيرة
أشار أردوينو إلى حدود نماذج اللغات العامة على الأجهزة مثل الهواتف وأجهزة الكمبيوتر المحمولة. حتى النماذج الصغيرة نسبياً يمكن أن تستهلك مساحة تخزين كبيرة، وتستغرق وقتاً طويلاً للتحميل، ولا تزال بطيئة جداً لتجربة مستخدم سلسة.
على النقيض من ذلك، يمكن لنماذج الترجمة الآلية العصبية المخصصة أن تكون أخف وزناً بشكل كبير، وغالباً ما يكون حجمها بضع عشرات من الميغابايت فقط، مع تحميلها في أجزاء من الثانية وإنتاج ترجمات أسرع بكثير. في رأي أردوينو، هذا الاختلاف ليس مجرد تفاصيل تقنية. إنه يغير ما هو ممكن للمستخدمين الحقيقيين على الأجهزة الحقيقية.
تلك الحجة التي تركز على الخصوصية تقع في صميم النهج الذي يتم الترويج له من خلال مشروع QVAC، الذي ناقشه في المنشور. الفكرة هي جعل الترجمة محلية بالكامل، بحيث تحدث العملية بأكملها على هاتف المستخدم أو كمبيوتره المحمول أو أجهزته المدمجة. لا حاجة لطلب سحابي.
لا يحتاج أي طرف ثالث إلى رؤية النص. بالنسبة للمستخدمين والمطورين المهتمين بالامتثال، يمكن أن يعني هذا أيضاً تقليل الأعباء التنظيمية. لا يقتصر QVAC على نوع واحد من محركات الترجمة. في حين أن نماذج الترجمة الآلية العصبية المخصصة هي الهدف طويل المدى، يمكن للنظام أيضاً دعم الترجمة القائمة على نماذج اللغات الكبيرة في الوقت الحالي.
استراتيجية جسر عملية
وصف أردوينو ذلك بأنه استراتيجية جسر عملية. إذا كانت هناك حاجة إلى إطلاق زوج لغوي جديد بسرعة، فيمكن نشر نموذج أكبر أولاً، بينما يتم تدريب نموذج ترجمة مخصص بالتوازي. بهذه الطريقة، يحصل المستخدمون على دعم فوري، ويمكن أن تتحسن التجربة بمرور الوقت مع استبدال النموذج الأصغر للنسخة الاحتياطية المؤقتة.
موضوع آخر في المنشور كان الترجمة الدفعية. قال أردوينو إن هذا أصبح مهماً بمجرد أن تجاوز الفريق العروض التوضيحية وبدأ في التفكير في حالات الاستخدام الإنتاجية مثل المستندات وسجلات الدردشة والمدخلات متعددة الجمل.
قد تكون ترجمة جملة واحدة في كل مرة مناسبة لواجهة بسيطة، لكن المعالجة الدفعية تُحدث فرقاً كبيراً في التطبيقات الحقيقية. قال الفريق إن النتيجة كانت إنتاجية أسرع بحوالي 2.5 مرة على نطاق واسع، مع تحسينات ملحوظة في زمن الاستجابة لكل جملة.
الجزء الأكثر طموحاً من الاقتراح هو التغطية. بدلاً من محاولة بناء نموذج منفصل لكل زوج لغوي محتمل، يستخدم QVAC اللغة الإنجليزية كنقطة محورية. هذا يعني أن مسار الترجمة، مثل الإسبانية إلى الإيطالية، يمكن التعامل معه عن طريق ربط نماذج الإسبانية إلى الإنجليزية والإنجليزية إلى الإيطالية معاً.
من الناحية العملية، يقلل هذا من عدد النماذج المطلوبة من عدد هائل إلى شيء يمكن إدارته بشكل أكبر. اقترح أردوينو أن دعم 26 لغة قد يتطلب حوالي 50 نموذجاً بدلاً من 650، مما يجعل نظام الترجمة المحلي الواسع أكثر واقعية.
كما شارك أرقاماً قياسية تظهر سبب أهمية هذا النهج على الأجهزة الحقيقية. على كمبيوتر محمول يعمل بنظام لينكس، تم تحميل نموذج Bergamot للترجمة من الإنجليزية إلى الإيطالية في ما يزيد قليلاً عن 100 مللي ثانية وقدم جودة ترجمة عالية.
على هاتف Pixel 10 Pro XL يعمل مباشرة على الجهاز، تم تحميل النموذج في أقل من 80 مللي ثانية وأدى بشكل جيد خاصة في الوضع الدفعي. قال أردوينو إن النتائج على الهاتف المحمول أظهرت ميزة واضحة على الترجمة التسلسلية، حيث أنتجت المعالجة الدفعية تجربة أكثر استجابة.
بالنظر إلى المستقبل، قال الفريق إنه يتوسع في اللغات الهندية من خلال IndicTrans وفي تغطية لغات أفريقية أكثر من خلال AfriqueGemma، بينما يستكشف أيضاً الترجمة المباشرة للدردشة الحية وتوليد الترجمة النصية. كانت الرسالة الأوسع للمنشور هي أن الذكاء الاصطناعي المحلي لا يجب أن يكون حلاً وسطاً. في الترجمة على الأقل، جادل أردوينو بأن النماذج الأصغر قد لا تكون كافية فقط، بل أفضل.
أسئلة شائعة
- س: ما هي الفكرة الرئيسية التي يقدمها باولو أردوينو حول الترجمة بالذكاء الاصطناعي؟
ج: الفكرة هي استخدام نماذج ذكاء اصطناعي صغيرة ومتخصصة للترجمة مباشرة على جهاز المستخدم (مثل الهاتف أو الكمبيوتر) دون إرسال النصوص إلى السحابة، مما يحافظ على الخصوصية ويزيد السرعة. - س: كيف يحل مشروع QVAC مشكلة كثرة اللغات دون الحاجة لنماذج ضخمة؟
ج: يستخدم QVAC اللغة الإنجليزية كنقطة محورية، مثلاً للترجمة من الإسبانية للإيطالية، يترجم النص أولاً من إسبانية لإنجليزية ثم من إنجليزية لإيطالية، مما يقلل عدد النماذج المطلوبة بشكل كبير (50 نموذجاً بدلاً من 650 لـ 26 لغة). - س: ما الفرق بين نماذج الترجمة المخصصة ونماذج الذكاء الاصطناعي العامة؟
ج: النماذج المخصصة أصغر حجماً (بضع عشرات من الميغابايت)، وتُحمّل في أجزاء من الثانية، وتعمل أسرع وأكثر دقة في الترجمة دون الحاجة لموارد كبيرة، بينما النماذج العامة ضخمة وتستهلك مساحة وتعمل ببطء على الأجهزة المحمولة.












