حقبة جديدة من الإبداع الرقمي: الذكاء الاصطناعي يختصر مسافات الإنتاج المرئي

ثورة في صناعة المحتوى: جوجل تطلق Gemini Omni لتحويل الأفكار إلى فيديوهات بلمسة واحدة

واجهة تفاعلية توضح قدرة نموذج Gemini Omni على تحوي

كشفت شركة جوجل رسمياً عن نموذجها المتطور للذكاء الاصطناعي Gemini Omni، وذلك خلال فعاليات مؤتمر المطورين Google I/O 2026. ويمثل هذا النموذج قفزة نوعية في قدرة الآلة على إنشاء أي شيء انطلاقاً من أي نوع من المدخلات، مع تركيز أساسي على توليد مقاطع فيديو عالية الجودة عبر دمج النصوص والصور والصوت.

إمكانيات غير مسبوقة في توليد الفيديو

على عكس الإصدارات السابقة مثل Veo 3.1، يدعم Gemini Omni نطاقاً أوسع من المدخلات، ويسمح للمستخدمين بتعديل المقاطع عبر محادثة طبيعية؛ حيث يضمن النظام الحفاظ على اتساق الشخصيات والعناصر عند تنفيذ التعليمات المتتابعة. وبإمكان المستخدم تصوير مقطع فيديو ثم الطلب من النموذج إجراء تعديلات دقيقة تشمل إضافة شخصيات جديدة، تغيير البيئة، تبديل زوايا التصوير، أو تعديل الأسلوب البصري.

تؤكد جوجل أن النموذج الجديد يعتمد على فهم عميق للقوانين الفيزيائية الواقعية مثل الجاذبية، الطاقة الحركية، وديناميكيات السوائل، بالإضافة إلى استغلال معرفة Gemini الواسعة بالسياقات التاريخية والثقافية، مما يضفي واقعية أكبر على المحتوى المنتج.

توفر الخدمة وخصوصية المستخدم

طرحت جوجل الإصدار الأول المسمى Gemini Omni Flash للمستخدمين ابتداءً من اليوم عبر تطبيق Gemini، ومنصتي Flow ويوتيوب Shorts، وذلك لمشتركي باقات Google AI Plus و Pro و Ultra.

وفيما يتعلق بالخصوصية، يتيح النموذج إنشاء شخصيات رقمية تحاكي المستخدم بصوته وشكله، وهي ميزة تثير تساؤلات حول التزييف العميق. واستجابة لذلك، أوضحت جوجل أنها تتبنى سياسات صارمة للحد من إساءة الاستخدام، وتُخضع أدوات تعديل الصوت للاختبار قبل إطلاقها. كما ستُرفق كافة الفيديوهات المُنتجة بعلامة SynthID الرقمية المائية للتحقق من أصل المحتوى.

ورغم التوقعات الكبيرة، لا يزال الأداء الفعلي للنموذج وقدرته على معالجة المشاهد المعقدة دون ظهور عيوب تقنية موضع اختبار وترقب من قبل المستخدمين خلال الأسبوع الجاري.

إضافة تعليق
الأسم
موضوع التعليق
النص