طورت Odyssey ، وهي شركة ناشئة أسسها رواد القيادة الذاتي أوليفر كاميرون وجيف هوك ، نموذجًا لمنظمة العفو الدولية يتيح للمستخدمين “التفاعل” مع تدفق الفيديو.
متوفر على الويب في “العرض التوضيحي المبكر” ، يقوم النموذج بإنشاء وتدفق إطارات الفيديو كل 40 مللي ثانية. عبر عناصر التحكم الأساسية ، يمكن للمشاهدين استكشاف المناطق داخل مقطع فيديو ، على غرار لعبة فيديو ثلاثية الأبعاد.
“بالنظر إلى الوضع الحالي للعالم ، وعمل وارد ، وتاريخ من الدول والإجراءات ، يحاول النموذج التنبؤ بالحالة التالية في العالم” ، يوضح أوديسي في منشور مدونة. “إن تشغيل هذا نموذج عالمي جديد ، يوضح قدرات مثل توليد وحدات البكسل التي تشعر واقعية ، والحفاظ على الاتساق المكاني ، وإجراءات التعلم من الفيديو ، وإخراج تدفقات الفيديو المتماسكة لمدة 5 دقائق أو أكثر.”
يطارد عدد من الشركات الناشئة وشركات التكنولوجيا الكبيرة بعد نماذج العالم ، بما في ذلك DeepMind ، وباحث الذكاء الاصطناعي Fei-Fei Li’s World Labs و Microsoft و Decart. إنهم يعتقدون أنه يمكن استخدام نماذج العالم ذات يوم لإنشاء وسائط تفاعلية ، مثل الألعاب والأفلام ، وتشغيل عمليات محاكاة واقعية مثل بيئات التدريب للروبوتات.
لكن التصميمات لديها مشاعر مختلطة حول التكنولوجيا. وجد تحقيق سلكي حديثًا أن استوديوهات الألعاب مثل Activision Blizzard ، التي أسفرت عن عشرات العمال ، تستخدم الذكاء الاصطناعي لقطع الزوايا والاستنزاف القتالي. ودراسة عام 2024 بتكليف من نقابة الرسوم المتحركة ، نقابة تمثل الرسوم المتحركة في هوليوود ورسام كاريكاتير ، قدرت أن أكثر من 100000 من وظائف الأفلام والتلفزيون والرسوم المتحركة ستعطل من قبل الذكاء الاصطناعي في الأشهر المقبلة.
من جانبها ، تعهد Odyssey بالتعاون مع المهنيين المبدعين – لا تحل محلهم.
“الفيديو التفاعلي … يفتح الباب على أشكال جديدة تمامًا من الترفيه ، حيث يمكن إنشاء القصص واستكشافها عند الطلب ، مجانًا من قيود وتكاليف الإنتاج التقليدي” ، تكتب الشركة في منشور المدونة. “مع مرور الوقت ، نعتقد أن كل ما هو فيديو اليوم – الترفيه والإعلانات والتعليم والتدريب والسفر والمزيد – سوف يتطور إلى فيديو تفاعلي ، وكلها مدعومة من أوديسي.”
العرض التوضيحي لـ Odyssey قاسي بعض الشيء حول الحواف ، والتي تعترف بها الشركة في منشورها. البيئات التي يولدها النموذج ضبابية ومشتتة ، وغير مستقرة بمعنى أن تخطيطاتها لا تظل دائمًا كما هي. المشي للأمام في اتجاه واحد لفترة من الوقت أو استدير ، وقد تبدو المحيطة مختلفة فجأة.
لكن الشركة الواعدة في التحسن بسرعة على النموذج ، والتي يمكنها حاليًا بث الفيديو بما يصل إلى 30 إطارًا في الثانية من مجموعات NVIDIA H100 GPU بتكلفة 1 دولار إلى 2 دولار لكل “ساعة مستخدم”.
“نتطلع إلى المستقبل ، نحن نبحث عن تمثيلات العالم الأكثر ثراءً التي تجسد الديناميات بأمانة أكثر بكثير ، مع زيادة الاستقرار الزمني والحالة المستمرة” ، كتب أوديسي في منصبه. “بالتوازي ، نوسع مساحة العمل من الحركة إلى التفاعل العالمي ، ونتعلم إجراءات مفتوحة من الفيديو على نطاق واسع.”
تتخذ Odyssey مقاربة مختلفة عن العديد من مختبرات الذكاء الاصطناعي في مساحة النمذجة العالمية. لقد صمم نظامًا كاميراتًا محمولاً على ظهره 360 درجة لالتقاط المناظر الطبيعية في العالم الحقيقي ، والذي يعتقد أوديسي أنه يمكن أن يكون بمثابة أساس للنماذج ذات الجودة العالية من النماذج المدربة فقط على البيانات المتاحة للجمهور.
حتى الآن ، جمعت Odyssey 27 مليون دولار من المستثمرين ، بما في ذلك EQT Ventures و GV و Air Street Capital. يقع Ed Catmull ، أحد مؤسسي Pixar والرئيس السابق لاستوديوهات Walt Disney للرسوم المتحركة ، في مجلس إدارة بدء التشغيل.
في ديسمبر الماضي ، قالت أوديسي إنها تعمل على البرامج التي تسمح للمبدعين بتحميل المشاهد التي تم إنشاؤها بواسطة نماذجها إلى أدوات مثل Unreal Engine و Blender و Adobe After حتى يمكن تحريرها يدويًا.
روابط قد تهمك
مؤسسة اشراق العالم خدمات المواقع والمتاجر باك لينكات باقات الباك لينك
روابط قد تهمك
مؤسسة اشراق العالم خدمات المواقع والمتاجر باك لينكات باقات الباك لينك