اوپن اے آئی کے ویڈیو جنریشن ٹول سورا نے فروری میں AI کمیونٹی کو حیران کر دیا، حقیقت پسندانہ ویڈیو جو حریفوں سے میلوں آگے دکھائی دیتی ہے۔ لیکن احتیاط سے اسٹیج کے زیر انتظام ڈیبیو نے بہت ساری تفصیلات چھوڑ دی ہیں – وہ تفصیلات جو ایک فلمساز نے سورا کا استعمال کرتے ہوئے مختصر تخلیق کرنے کے لیے ابتدائی رسائی دی ہوئی ہے۔
شائی کڈز ٹورنٹو میں واقع ایک ڈیجیٹل پروڈکشن ٹیم ہے جسے OpenAI نے بنیادی طور پر OpenAI کے پروموشنل مقاصد کے لیے مختصر فلمیں بنانے کے لیے چند میں سے ایک کے طور پر منتخب کیا تھا، حالانکہ انھیں “ایئر ہیڈ” بنانے میں کافی تخلیقی آزادی دی گئی تھی۔ بصری اثرات کے نیوز آؤٹ لیٹ fxguide کے ساتھ ایک انٹرویو میں، پوسٹ پروڈکشن آرٹسٹ پیٹرک سیڈربرگ نے اپنے کام کے حصے کے طور پر “حقیقت میں سورا کا استعمال” کو بیان کیا۔
شاید زیادہ تر لوگوں کے لیے سب سے اہم نکتہ یہ ہے: اگرچہ OpenAI کی شارٹس کو نمایاں کرنے والی پوسٹ سے قارئین کو اندازہ ہوتا ہے کہ وہ کم و بیش مکمل طور پر سورا سے ابھرے ہیں، حقیقت یہ ہے کہ یہ پیشہ ورانہ پروڈکشنز تھیں، جو مضبوط اسٹوری بورڈنگ، ایڈیٹنگ، رنگوں کی اصلاح کے ساتھ مکمل تھیں۔ اور پوسٹ ورک جیسے rotoscoping اور VFX۔ بالکل اسی طرح جیسے ایپل کہتا ہے “آئی فون پر گولی مار دی گئی” لیکن حقیقت کے بعد اسٹوڈیو سیٹ اپ، پیشہ ورانہ لائٹنگ، اور رنگوں کا کام نہیں دکھاتا، سورا پوسٹ صرف اس بات پر بات کرتی ہے کہ یہ لوگوں کو کیا کرنے دیتا ہے، یہ نہیں کہ انہوں نے اصل میں یہ کیسے کیا۔
سیڈربرگ کا انٹرویو دلچسپ اور کافی غیر تکنیکی ہے، لہذا اگر آپ بالکل بھی دلچسپی رکھتے ہیں، تو fxguide پر جائیں اور اسے پڑھیں۔ لیکن یہاں سورا کے استعمال کے بارے میں کچھ دلچسپ نوگیٹس ہیں جو ہمیں بتاتے ہیں کہ جتنا متاثر کن ہے، یہ ماڈل شاید اس سے کم ہے جتنا ہم نے سوچا تھا۔
کنٹرول اب بھی وہ چیز ہے جو اس مقام پر سب سے زیادہ مطلوبہ اور سب سے زیادہ پرجوش بھی ہے۔ … سب سے قریب جو ہم حاصل کر سکتے تھے وہ صرف ہمارے اشارے میں انتہائی وضاحتی ہونا تھا۔ کرداروں کے لیے الماری کی وضاحت، نیز غبارے کی قسم، مستقل مزاجی کے بارے میں ہمارا طریقہ تھا کیونکہ شاٹ ٹو شاٹ / نسل در نسل، مستقل مزاجی پر مکمل کنٹرول کے لیے ابھی تک کوئی خصوصیت موجود نہیں ہے۔
دوسرے لفظوں میں، وہ معاملات جو روایتی فلم سازی میں سادہ ہوتے ہیں، جیسے کسی کردار کے لباس کا رنگ منتخب کرنا، جنریٹیو سسٹم میں وسیع کام اور جانچ پڑتال کرتے ہیں، کیونکہ ہر شاٹ دوسروں سے آزاد تخلیق کیا جاتا ہے۔ یہ واضح طور پر تبدیل ہوسکتا ہے، لیکن اس وقت یہ یقینی طور پر بہت زیادہ محنتی ہے۔
سورا آؤٹ پٹس کو ناپسندیدہ عناصر کے لیے بھی دیکھنا پڑا: سیڈربرگ نے بتایا کہ ماڈل کس طرح معمول کے مطابق غبارے پر ایک چہرہ تیار کرے گا جو مرکزی کردار کے سر کے لیے ہوتا ہے، یا سامنے کی طرف لٹکتی ہوئی تار۔ ان کو پوسٹ میں ہٹانا پڑا، ایک اور وقت طلب عمل، اگر وہ ان کو خارج کرنے کا اشارہ حاصل نہ کر سکے۔
عین مطابق وقت اور کرداروں یا کیمرے کی نقل و حرکت واقعی ممکن نہیں ہے: “اس بارے میں تھوڑا سا عارضی کنٹرول ہے کہ یہ مختلف حرکتیں اصل نسل میں کہاں ہوتی ہیں، لیکن یہ قطعی نہیں ہے … یہ اندھیرے میں گولی مارنے کی طرح ہے،” کہا۔ سیڈربرگ۔
مثال کے طور پر، دستی اینیمیشنز کے برعکس، لہر کی طرح کسی اشارے کا وقت دینا ایک بہت ہی تخمینی، تجویز پر مبنی عمل ہے۔ اور کردار کے جسم پر اوپر کی طرف پین جیسا شاٹ اس بات کی عکاسی کرسکتا ہے کہ فلمساز کیا چاہتا ہے – لہذا اس معاملے میں ٹیم نے پورٹریٹ اورینٹیشن میں ایک شاٹ پیش کیا اور پوسٹ میں کراپ پین کیا۔ تیار کردہ کلپس بھی اکثر کسی خاص وجہ کے سست رفتار میں رہتے تھے۔
درحقیقت، فلم سازی کی روزمرہ کی زبان کا استعمال، جیسے “پیننگ رائٹ” یا “ٹریکنگ شاٹ” عام طور پر متضاد تھے، سیڈربرگ نے کہا، جسے ٹیم نے کافی حیران کن پایا۔
“محققین، اس سے پہلے کہ وہ اس آلے کے ساتھ کھیلنے کے لیے فنکاروں سے رابطہ کریں، واقعی فلم سازوں کی طرح نہیں سوچ رہے تھے،” انہوں نے کہا۔
نتیجے کے طور پر، ٹیم نے سینکڑوں نسلیں، ہر 10 سے 20 سیکنڈ میں، اور صرف ایک مٹھی بھر استعمال کرتے ہوئے ختم کیا. سیڈربرگ نے تناسب کا تخمینہ 300:1 لگایا — لیکن یقیناً ہم سب ایک عام شوٹ کے تناسب پر حیران ہوں گے۔
ٹیم نے درحقیقت پردے کے پیچھے تھوڑی سی ویڈیو بنائی جس میں کچھ مسائل کی وضاحت کی گئی، اگر آپ جاننا چاہتے ہیں۔ AI سے ملحقہ بہت سارے مواد کی طرح، تبصرے پوری کوشش کے لیے کافی تنقیدی ہیں – حالانکہ AI کی مدد سے چلنے والے اشتہار کی طرح ہم نے حال ہی میں دیکھا ہے۔
آخری دلچسپ شکن کاپی رائٹ سے متعلق ہے: اگر آپ سورا سے آپ کو “اسٹار وار” کلپ دینے کو کہیں گے، تو وہ انکار کر دے گی۔ اور اگر آپ “ایک ریٹرو فیوچرسٹک اسپیس شپ پر ایک لیزر تلوار کے ساتھ لٹیرے آدمی” کے ساتھ اس کے ارد گرد جانے کی کوشش کرتے ہیں، تو یہ بھی انکار کر دے گا، جیسا کہ کچھ طریقہ کار کے ذریعے یہ پہچانتا ہے کہ آپ کیا کرنے کی کوشش کر رہے ہیں۔ اس نے “آرونوفسکی ٹائپ شاٹ” یا “ہچکاک زوم” کرنے سے بھی انکار کر دیا۔
ایک طرف، یہ کامل معنی رکھتا ہے۔ لیکن اس سے سوال پیدا ہوتا ہے: اگر سورا جانتی ہے کہ یہ کیا ہیں، تو کیا اس کا مطلب یہ ہے کہ ماڈل کو اس مواد پر تربیت دی گئی تھی، یہ پہچاننا بہتر ہے کہ یہ خلاف ورزی کر رہا ہے؟ اوپن اے آئی، جو اپنے تربیتی ڈیٹا کارڈز کو بنیان کے قریب رکھتا ہے – بیہودگی کی حد تک، جیسا کہ سی ٹی او میرا مورتی کا جوانا اسٹرن کے ساتھ انٹرویو – تقریبا یقینی طور پر ہمیں کبھی نہیں بتائے گا۔
جہاں تک سورا اور فلم سازی میں اس کے استعمال کا تعلق ہے، یہ اپنی جگہ واضح طور پر ایک طاقتور اور مفید ٹول ہے، لیکن اس کی جگہ “پورے کپڑے سے فلمیں بنانا” نہیں ہے۔ ابھی تک. جیسا کہ ایک اور ولن نے ایک بار مشہور کہا تھا، “یہ بعد میں آتا ہے۔”