بعد عشرة أشهر من الإعلان التشويقي الأول، أطلقت OpenAI خدمة إنشاء الفيديو Sora علنًا
![]() |
تم إنشاؤه بواسطة الذكاء الاصطناعي بواسطة Sora من OpenAI. |
أصدرت OpenAI يوم الاثنين تطبيق Sora Turbo، وهو إصدار جديد من نموذجها لتحويل النصوص إلى مقاطع فيديو، متاحًا لمشتركي ChatGPT Plus وPro عبر موقع إلكتروني مخصص. يُنتج النموذج مقاطع فيديو تصل مدتها إلى 20 ثانية بدقة تصل إلى 1080 بكسل من خلال رسالة نصية أو صورة.
أعلنت Open AI أن Sora سيكون متاحًا اليوم لمشتركي ChatGPT Plus وPro في الولايات المتحدة وأجزاء عديدة من العالم، ولكنه غير متوفر بعد في أوروبا. مع ذلك، وحتى بعد ظهر يوم الاثنين، ظهرت رسالة "التسجيل غير متاح مؤقتًا" حتى لمشتركي Plus الحاليين الذين يحاولون استخدام الأداة، وذلك بسبب "الازدحام الشديد".
وحرصًا على سلامتهم، تحد OpenAI من قدرة Sora على إنشاء مقاطع فيديو للأشخاص في الوقت الحالي. عند الإطلاق، تواجه التحميلات التي تتضمن أشخاصًا قيودًا، بينما تعمل OpenAI على تحسين أنظمة منع التزييف العميق. كما تحظر المنصة المحتوى الذي يتضمن مواد اعتداء جنسيًا (CSAM) child sexual abuse material. وتقول OpenAI إنها تحتفظ بنظام مراقبة نشط وأجرت اختبارات لتحديد سيناريوهات إساءة الاستخدام المحتملة قبل الإصدار.
فاجأ سورا خبراء الذكاء الاصطناعي بأجياله عالية الجودة نسبيًا عندما عرضته OpenAI لأول مرة في فبراير. ولكن خلال الأشهر التي تلت ذلك، قللت نماذج تركيب الفيديو المختلفة من المنافسين - مثل Veo من جوجل، وGen-3 Alpha من Runway، وKling، وMinimax، ونموذج حديث يُدعى Hunyuan Video - من بريق إصدار سورا.
عينة فيديو Sora مقدمة من OpenAI، تم إنشاؤها باستخدام المطالبة (Prompt): لوحة القصة: تظهر مجموعة من ستة عمال يرتدون ملابس داكنة مهترئة ويحملون أدوات وحقائب ظهر، وهم يسيرون ببطء على شاطئ مهجور مغطى بالضباب. يلوح في الأفق خلفهم هيكل غواصة ضخم صدئ ضخم، يلقي صورة ظلية مهيبة على الضباب الكثيف ذي اللون البني الداكن. يزيد الضوء الخافت والنغمات غير المشبعة من الأجواء الغريبة المروعة. الشاطئ موحل ومليء بالحطام، مما يساهم في شعور المشهد بالتدهور والهجران. تم التقاط الفيديو باستخدام كاميرا رقمية كاملة الإطار مع عدسة واسعة الزاوية، تم تصويرها على فيلم رقمي، تحت إضاءة طبيعية منتشرة بالضباب. يزداد الضباب كثافة بينما يتنقل العمال حول الغواصة، مما يغلف الهيكل الضخم بشكل أكبر. يتوقف العمال مؤقتًا، ويفحصون الحطام عن كثب، وصورهم الظلية غير واضحة بسبب الضباب. تتحرك الكاميرا إلى الخارج، لتكشف عن المزيد من الساحل المغطى بالضباب، وتسلط الضوء على الحجم الهائل لحطام السفينة مقارنة بالشخصيات البشرية الصغيرة.مع ذلك، يُعدّ إطلاق نموذج الفيديو المرتقب من OpenAI إنجازًا كبيرًا. يتيح Sora للمستخدمين إنشاء مقاطع فيديو بنسب أبعاد متعددة، ويتضمن ميزات لدمج المحتوى الحالي مع المحتوى المُولّد بواسطة الذكاء الاصطناعي. وتؤكد OpenAI أن Sora Turbo يُعالج طلبات إنشاء الفيديو أسرع من الإصدار التجريبي الذي عُرض في فبراير 2024.
يمكن لمشتركي ChatGPT Plus (بسعر 20 دولارًا أمريكيًا شهريًا) إنشاء ما يصل إلى 50 مقطع فيديو شهريًا بدقة 480 بكسل، مع خيار إنشاء عدد أقل من مقاطع الفيديو بجودة 720 بكسل. أما مشتركو Pro (بسعر 200 دولار أمريكي شهريًا) فيحصلون على إمكانيات موسعة، تشمل خيارات دقة أعلى ومدة فيديو أطول. وتخطط OpenAI لطرح فئات أسعار متخصصة في أوائل عام 2025.
خلال بث مباشر يوم الاثنين، خلال اليوم الثالث من فعالية "12 يومًا من OpenAI" التي أطلقتها OpenAI، استعرض مطورو Sora واجهة "استكشاف" جديدة تتيح للمستخدمين تصفح مقاطع الفيديو التي أنشأها آخرون لاستلهام أفكار جديدة. وتقول OpenAI إنه يمكن لأي شخص الاستمتاع بمشاهدة موجز "استكشاف" مجانًا، لكن إنشاء مقاطع الفيديو يتطلب اشتراكًا.
كما عرضوا ميزة جديدة تُسمى Storyboard "لوحة القصة" تتيح للمستخدمين إخراج فيديو بحركات متعددة بشكل متتابع.
إجراءات السلامة والقيود
بالإضافة إلى الإصدار، نشرت OpenAI أيضًا بطاقة نظام Sora لأول مرة. تتضمن البطاقة تفاصيل تقنية حول كيفية عمل النموذج واختبارات السلامة التي أجرتها الشركة قبل هذا الإصدار.
وكتبت OpenAI: "بينما تحتوي نماذج LLM على رموز نصية، يحتوي Sora على تصحيحات بصرية"، واصفةً أجزاء التدريب الجديدة بأنها "تمثيل فعال لنماذج البيانات البصرية... على مستوى عالٍ، نُحوّل مقاطع الفيديو إلى تصحيحات عن طريق ضغطها أولًا في مساحة كامنة ذات أبعاد أقل، ثم تحليل التمثيل إلى تصحيحات زمكانية".
ويستخدم Sora أيضًا "تقنية إعادة التسميات التوضيحية" - مشابهة لتلك المستخدمة في توليد صور DALL-E 3 الخاصة بالشركة، "لإنشاء تسميات توضيحية وصفية للغاية لبيانات التدريب البصرية". وهذا بدوره يُمكّن Sora من "اتباع تعليمات المستخدم النصية في الفيديو المُولّد بدقة أكبر"، كما كتبت OpenAI.
عينة فيديو Sora مقدمة من OpenAI، تم إنشاؤها باستخدام المطالبة (Prompt)طبقت OpenAI عدة إجراءات أمان في هذا الإصدار. تُضمّن المنصة بيانات تعريف C2PA في جميع مقاطع الفيديو المُولّدة لتحديد هويتها والتحقق من مصدرها. تعرض مقاطع الفيديو علامات مائية مرئية افتراضيًا، كما طوّرت OpenAI أداة بحث داخلية للتحقق من محتوى Sora المُولّد.
أقرّت الشركة بوجود قيود تقنية في الإصدار الحالي. صرّح أحد المطورين خلال إطلاق البث المباشر: "ستُرتكب أخطاء في هذه النسخة المبكرة من Sora، فهي ليست مثالية". ويُقال إن النموذج يُواجه صعوبات في محاكاة الفيزياء والإجراءات المُعقدة لفترات زمنية طويلة.
في الماضي، لاحظنا أن هذه الأنواع من القيود تستند إلى مقاطع الفيديو النموذجية المُستخدمة لتدريب نماذج الذكاء الاصطناعي. يواجه هذا الجيل الحالي من نماذج توليف الفيديو بالذكاء الاصطناعي صعوبة في توليد محتوى جديد تمامًا، نظرًا لأن البنية الأساسية تُبدع في تحويل المفاهيم الحالية إلى عروض تقديمية جديدة، ولكنها حتى الآن عادةً ما تُخفق في تحقيق الأصالة الحقيقية. ومع ذلك، لا يزال إنتاج مقاطع فيديو الذكاء الاصطناعي في مراحله الأولى، والتكنولوجيا في تحسّن مستمر.