بلوكتشين

“جوجل تُضاعف تركيزها على الذكاء الاصطناعي: Veo 3 وImagen 4 وGemini Diffusion تدفع حدود الإبداع إلى آفاق جديدة”

“`html

لم يكن مؤتمر جوجل I/O 2025 خجولاً أبداً. هذا العام، تخلت الشركة عن التدرج في التطوير، وأطلقت سلسلة من ترقيات الذكاء الاصطناعي التوليدي التي تهدف إلى إعادة رسم خريطة البحث والفيديو والإبداع الرقمي.

المحرك الرئيسي: جيميني

جيميني، عائلة النماذج الجديدة من جوجل، أصبحت الآن تدعم كل شيء من نتائج البحث إلى توليد الفيديو وإنشاء الصور عالية الدقة، مما يضع جوجل في سباق يتحدد بمدى سرعة وقدرة الذكاء الاصطناعي على التوليد.

"جوجل تُضاعف تركيزها على الذكاء الاصطناعي: Veo 3 وImagen 4 وGemini Diffusion تدفع حدود الإبداع إلى آفاق جديدة"

النجم الصاعد: فيو 3

الضجة الحقيقية كانت حول فيو 3، أول مولّد فيديو بالذكاء الاصطناعي من جوجل الذي لا ينتج مشاهد مرئية فحسب، بل أيضاً موسيقى تصويرية كاملة—ضجيج خلفي، مؤثرات، وحتى حوار—متزامن تماماً مع اللقطات. أدخل نصاً أو صورة، وسيخرج فيديو كامل بدقة 4K.

هذا أول نموذج فيديو واسع النطاق قادر على توليد الصوت والصورة معاً—وهي تقنية بدأت مع Showrunner Alpha (نموذج غير منشور)، لكن فيو 3 يقدم مرونة أكبر، حيث ينتج أنماطاً متعددة تتجاوز الرسوم المتحركة ثنائية الأبعاد البسيطة.

“نحن ندخل عصراً جديداً من الإبداع مع توليد الصوت والفيديو معاً”، قال جوش وودورد، نائب رئيس جوجل لابس خلال الإطلاق. هذا تحدٍ مباشر لقادة توليد الفيديو الحاليين مثل Kling وHunyuan وLuma وWan وSora من OpenAI، حيث يضع فيو 3 نفسه كحل شامل بدلاً من الحاجة إلى أدوات متعددة.

إيماجن 4: قفزة في الواقعية

بجانب فيو 3، يأتي إيماجن 4—أحدث نسخة من مولّد الصور من جوجل—مع تحسينات في الواقعية، ودقة 2K، والأهم من ذلك، قدرة فعّالة على عرض النصوص للعلامات والمنتجات والنماذج الرقمية.

لأي شخص عانى من النصوص غير المفهومة التي أنتجتها نماذج الذكاء الاصطناعي السابقة، يمثل إيماجن 4 تحسناً كبيراً.

التكامل مع فلو AI

هذه الأدوات لا تعمل بمعزل عن غيرها. فلو AI، ميزة اشتراك جديدة للمستخدمين المحترفين، تجمع بين فيو وإيماجن وقدرات جيميني اللغوية في بيئة موحدة لصناعة الأفلام وتحرير المشاهد. لكن هذا التكامل يأتي بسعر—125 دولاراً شهرياً للوصول إلى الأدوات الكاملة خلال الفترة الترويجية، قبل أن يصل السعر الكامل إلى 250 دولاراً.

جيميني: قوة البحث و”نشر النصوص”

الذكاء الاصطناعي التوليدي ليس للمبدعين فقط. جيميني 2.5 أصبح الآن العمود الفقري لمحرك البحث المُعاد تصميمه، الذي تريد جوجل تطويره من مجرد مُجمّع روابط إلى واجهة محادثة ديناميكية تتعامل مع الاستفسارات المعقدة وتقدم إجابات مُركبة من مصادر متعددة.

الملخصات الذكية—حيث يحاول جيميني تقديم إجابات شاملة دون الحاجة إلى الانتقال لمواقع أخرى—تظهر الآن في أعلى صفحات البحث، مع أكثر من 1.5 مليار مستخدم شهرياً.

تطور مثير: “نشر النصوص” بتقنية الانتشار

تطور آخر مثير هو “جيميني Diffusion”، المبني على تقنية طورتها Inception Labs قبل أشهر. حتى وقت قريب، اتفق مجتمع الذكاء الاصطناعي على أن النماذج التلقائية (autoregressive) هي الأفضل لتوليد النصوص، بينما تقنية الانتشار (diffusion) تتفوق في الصور.

النماذج التلقائية تولّد كل جزء جديد بعد قراءة كل الأجزاء السابقة لتحديد أفضل خيار—مثالي لصنع نصوص مترابطة. أما تقنية الانتشار فتبدأ بمعلومات عشوائية ثم تُحسّن المخرجات خطوة بخطوة لتتناسب مع المطلوب—مثالي للصور ذات القواعد الثابتة.

أصبحت جوجل أول شركة كبرى تطبق تقنية الانتشار على النصوص، مما يعني أن النموذج يبدأ بنص عشوائي ثم يُحسّنه مع كل تكرار، منتجاً آلاف الكلمات في الثانية مع الحفاظ على الدقة—مقارنة بـ 275 كلمة/ثانية من أسرع مزودي الاستدلال في العالم.

النموذج غير متاح للجمهور بعد—على المهتمين الانضمام لقائمة الانتظار—لكن المستخدمين الأوائل شاركوا نتائج مذهلة تظهر سرعته ودقته.

تجربة أدوات جوجل الجديدة

اختبرنا عدة ميزات جديدة من جوجل، بنتائج متفاوتة حسب الخطة المستخدمة.

البحث العميق يتفوق

أداة البحث العميق قوية جداً—بل وتتفوق على بديل ChatGPT. هذا الوكيل البحثي يقيم مئات المصادر ويقدم معلومات موثوقة بأقل أخطاء.

ما يميزه عن وكيل OpenAI البحثي هو قدرته على توليد رسوم بيانية. بعد إنتاج نص بحثي كامل، يمكنه تلخيص المعلومات في شرائح جذابة بصرياً. عند اختباره بموضوع إعلانات جوجل الأخيرة، قدم معلومات دقيقة عبر مخططات ورسوم بيانية.

فيو 3 حصري لمستخدمي جيميني أولترا

فيو 3 مخصص لمستخدمي جيميني أولترا، رغم أن بعض المواقع مثل Freepik وFal.ai تقدم وصولاً عبر واجهة برمجة التطبيقات (API). فلو غير متاح للتجربة إلا مع خطة أولترا.

فلو يثبت كونه محرر فيديو بديهي يعتمد على نماذج فيو، حيث يمكن للمستخدمين تعديل ومشاهد إنتاجية بالذكاء الاصطناعي باستخدام نصوص بسيطة.

فيو 2 يحصل على تحديثات

حتى فيو 2 حصل على بعض التحسينات، مما يسهل الحياة لمستخدمي الخطة الاحترافية. توليد الفيديوهات أصبح أسرع بكثير—أنتجنا 8 ثوانٍ من الفيديو في حوالي 30 ثانية. رغم أن فيو 2 لا يدعم الصوت ولا يزال يعتمد على النص فقط (مع دعم الصور قريباً)، إلا أنه فهم طلباتنا وحتى أنتج نصوصاً مترابطة.

أداء فيو 2 يماثل Kling 2.0—المعيار الجودة في صناعة الفيديو التوليدي. أما فيو 3 فيبدو أكثر واقعية وتماسكاً، مع صوت خلفي جيد وحوار وأصوات شبيهة بالحياة.

إيماجن 4 يتفوق في الواقعية

بالنسبة لإيماجن، يصعب تحديد ما إذا كانت جوجل تستخدم النسخة 4 أو لا تزال على النسخة 3 في واجهة الدردشة، رغم أن المستخدمين يمكنهم التأكد عبر Whisk. تشير اختباراتنا الأولية إلى أن إيماجن 4 يركز على الواقعية ما لم يُطلب غير ذلك، مع التزام أفضل بالطلبات وجودة بصرية تتفوق على سابقه.

عند توليد صورة بعناصر غير متجانسة—”صورة لامرأة ببشرة زجاجية، محاطة بآلاف القطع اللامعة في غرفة باروكية مع كلمة ‘Decrypt’ مكتوبة بالنيون، واقعية”—نجح إيماجن 4 بسهولة في تحقيق الطلب، بينما فشل إيماجن 3 في التقاط الأسلوب الواقعي.

بشكل عام، إيماجن 4 يماثل أحدث مولّدي الصور، خاصة مع سهولة إدخال الطلبات.

تحسينات في الملخصات الصوتية

تحسنت أيضاً الملخصات الصوتية، حيث تقدم النماذج الآن مناقشات كاملة تزيد عن 20 دقيقة على جيميني، بدلاً من إجبار المستخدمين على التبديل إلى NotebookLM. هذا يجعل جيميني واجهة أكثر اكتمالاً، ويقلل التجزئة التي كانت تتطلب التنقل بين مواقع مختلفة.

الجودة مماثلة لـ NotebookLM، مع مخرجات أطول قليلاً في المتوسط. لكن الميزة الرئيسية ليست أن النموذج أفضل، بل أنه مدمج الآن في واجهة الدردشة الخاصة بجيميني.

الذكاء الاصطناعي المميز بسعر مميز

لم تخف جوجل عن استراتيجيتها للربح. خطتها “أولترا” تكلف 250 دولاراً شهرياً، وتشمل وصولاً أولياً لأقوى النماذج، أدوات فلو AI، و30 تيرابايت من التخزين—موجهة بوضوح لصانعي الأفلام والمبدعين الجادين والشركات.

خطة “AI Pro” بـ 20 دولاراً تفتح نموذج فيو 2 السابق، مع ميزات الصور والإنتاجية لمجموعة أوسع. الأدوات الأساسية—مثل جيميني لايف البسيط وإنشاء الصور—تبقى مجانية، لكن مع قيود مثل حد للكلمات و10 بحوث فقط شهرياً.

هذا النهج المتدرج يعكس اتجاه سوق الذكاء الاصطناعي: جذب الجمهور بالمجان، ثم استهداف المحترفين بميزات لا يمكن تجاهلها. رهان جوجل هو أن القيمة الحقيقية (والربح) يكمن في العمل الإبداعي عالي الجودة وأتمتة سير العمل—وليس فقط الطلبات العابرة وإنشاء الميمات.

الأسئلة الشائعة

ما أهم ميزة في فيو 3؟

فيو 3 هو أول مولّد فيديو ينتج الصوت والصورة معاً بدقة 4K، مما يجعله منافساً قوياً في سوق الفيديو التوليدي.

كيف يختلف إيماجن 4 عن النسخ السابقة؟

إيماجن 4 يتميز بواقعية أعلى، دقة 2K، وقدرة محسنة على عرض النصوص بشكل صحيح—تحسن كبير لمن عانى من النصوص المشوهة سابقاً.

ما تكلفة الوصول لأقوى أدوات جوجل؟

خطة “أولترا” تكلف 250 دولاراً شهرياً وتشمل أدوات متقدمة مثل فلو AI، بينما تقدم خطة “AI Pro” ميزات مناسبة بـ 20 دولاراً. الأدوات الأساسية تبقى مجانية بقيود.

“`

ملك الكريبتو

مستشار وخبير في سوق العملات الرقمية، يشتهر بقدرته على قيادة المستثمرين نحو النجاح بتحليلاته واستراتيجياته المميزة.
زر الذهاب إلى الأعلى