جوجل تكشف عن نموذج Veo لتوليد مقاطع الفيديو بالذكاء الاصطناعي

أعلنت شركة جوجل في مؤتمر المطورين Google I/O 2023 عن نموذج الذكاء الاصطناعي التوليدي Veo، الذي يمتلك القدرة على إنشاء مقاطع فيديو عالية الجودة استنادًا إلى المطالبات النصية للمستخدمين. يُزعم أن نموذج Veo يفهم اللغة الطبيعية والدلالات البصرية بشكل متقدم، مما يسمح له بإنشاء مقاطع فيديو تتناسب مع تصورات المستخدمين.

 

نموذج Veo لتوليد مقاطع الفيديو بالذكاء الاصطناعي

 

يمكن لنموذج Veo إنشاء مقاطع فيديو تزيد عن دقيقة وبجودة تصل إلى 1080 بكسل، وهو قادر أيضًا على فهم التقنيات السينمائية والبصرية، مثل مفهوم الفاصل الزمني، حسب تأكيدات جوجل. تعاونت جوجل مع دونالد جلوفر، صانع الأفلام، واستوديوهات Gilga لعرض قدرات نموذج Veo في محاكاة فيزياء العالم الحقيقي، كما ظهر ذلك في مقطع فيديو ترويجي نُشر على يوتيوب.

 

نموذج Veo سيتاح ضمن أداة VideoFX من جوجل لبعض منشئي المحتوى ابتداءً من اليوم، وسيتم إضافته أيضًا إلى يوتيوب Shorts ومنتجات أخرى تابعة للشركة. بالإضافة إلى ذلك، أعلنت جوجل عن نموذج Imagen 3، وهو نموذج متقدم لتحويل النص إلى صورة، يُعتبر “الأعلى جودة” في هذا المجال، حيث يقدم صورًا واقعية نابضة بالحياة ودرجة عالية من التفاصيل.

 

جوجل أكدت أن نموذج Imagen 3 يتفاعل بشكل أفضل مع النصوص وأصبح أكثر ذكاءً في فهم التفاصيل في المطالبات الطويلة. يشعر المجتمع التقني بالشغف لتجربة هذه الابتكارات الجديدة من جوجل ومقارنتها بنماذج شركة OpenAI المنافسة مثل Sora لتحويل النص إلى فيديو وDALL-E 3 لتحويل النص إلى صور.

اظهر المزيد

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى