Categories: تطبيقات

باحثو Google يكشفوا النقاب عن الذكاء الاصطناعي Genie الذي ينشئ مشاهد ألعاب من الصور

كشف باحثو Google DeepMind النقاب عن Genie – أول بيئة تفاعلية توليدية تعمل بالذكاء الاصطناعي في العالم. يمكن لهذا الذكاء الاصطناعي أن ينظر إلى صورة نموذج منصة ثنائية الأبعاد، ثم ينشئ مشهد لعبة مصغرة قابل للتشغيل. لا يحتاج الذكاء الاصطناعي إلى مدخلات إضافية للقيام بذلك. بحسب ما ذكره موقع notebookcheck.

كشف باحثون من Google DeepMind النقاب عن Genie، أول بيئة تفاعلية توليدية تعمل بالذكاء الاصطناعي في العالم. يستطيع الذكاء الاصطناعي إنشاء مشهد قابل للتشغيل بعد النظر إلى صورة لعبة نموذجية. وهذا يفتح الباب أمام اللاعبين لإنشاء ألعاب قابلة للعب بدون برمجة.

تم تدريب Genie على أسلوب لعب المنصات ثنائي الأبعاد من خلال النظر إلى 30000 ساعة من مقاطع الفيديو (6.8 مليون مقطع مدته 16 ثانية). يعمل الذكاء الاصطناعي على تبسيط ما يراه من خلال تمثيل صور الفيديو والإجراءات التي يراها كمجموعات من الأرقام، تمامًا مثل استخدام الإنسان للكلمات لوصف مشهد اللعبة.

بمجرد التدريب، كل ما يحتاجه Genie هو مثال واحد لمشهد اللعبة لإنشاء مشهد صغير قابل للعب. خلف الكواليس، يمكن للذكاء الاصطناعي توسيع الصورة الأولية باستخدام أساليب متطورة لتوليد الأجزاء المفقودة من الصورة، حتى يتمكن جيني من رسم أجزاء جديدة من عالم اللعبة مع تقدم اللاعب للأمام. يقوم بذلك من خلال الإشارة إلى ملايين المقاطع التي شاهدها أثناء إعطاء الشخصية إجراءات قابلة للعب مثل الجري أو القفز.

والأهم من ذلك، أن الجني يتعلم الأفعال من خلال مشاهدة طريقة اللعب، وليس من خلال جعل البشر يشيرون إلى ذلك. لذا، عندما يكون هناك جسر به فجوة، يعرف الذكاء الاصطناعي مما رآه أن الشخصية ستحتاج على الأرجح إلى القفز فوق الفجوة، ويفعل ذلك عندما يضغط اللاعب البشري على الزر العلوي في وحدة التحكم.

يتطلب كل هذا قوة حاسوبية هائلة للتدريب (آلاف التيرافلوب على مدى أسابيع على أجهزة الكمبيوتر التي تحتوي على مئات الرقائق) واللعب، وهو ما لا يمكن القيام به إلا بمعدل إطار واحد فائق البطء في الثانية.

بالنسبة للأشخاص ذوي التفكير التقني، يتم ترميز إطارات الفيديو والإجراءات الكامنة المستنتجة باستخدام VQ-VAE الخاص بشركة van den Oord. يتم إدخال الإجراءات الكامنة المحددة من قبل المستخدم إلى جانب إطارات الفيديو المميزة في النموذج الديناميكي باستخدام محول Chang’s MaskGIT لإنشاء رموز إطار متكررة تُستخدم لإنشاء مقاطع فيديو مخرجة باستخدام MaskViT من Gupta. يتم استخدام محولات ST المعتمدة من Xu في جميع أنحاء العالم لتشمل الاهتمام الزمني بالإضافة إلى الاهتمام المكاني لتحسين التنبؤات وكذلك تقليل متطلبات الذاكرة.

لذلك، حتى يأتي اليوم الذي تصبح فيه أجهزة الكمبيوتر قوية بما يكفي لإنشاء ألعاب منصات ثنائية الأبعاد بالكامل بمفردها، استمتع بألعاب المنصات الكلاسيكية باستخدام وحدة تحكم ألعاب محمولة (مثل هذه الموجودة في Amazon).

محمد يحيى

Share
Published by
محمد يحيى

Recent Posts

أفضل هواتف الذكاء الاصطناعي 2026

من Galaxy S25 Ultra إلى Pixel 9 Pro، هذه هي أفضل الهواتف التي تتمتع بقدرات…

يوم واحد ago

أفضل هواتف الذكاء الاصطناعي لعام 2025

ما هو الهاتف الذكي المزود بتقنية الذكاء الاصطناعي؟ كيف نختبر ميزات الذكاء الاصطناعي؟ أفضل 10…

يوم واحد ago

حاسوب كمي جديد لزيادة دقة الذكاء الاصطناعي

أعلنت شركة كوانتينيوم عن الإطلاق التجاري لحاسوبها الكمي الجديد هيليوس، الذي يوفر دقة غير مسبوقة…

شهرين ago

مايكروسوفت: ثغرة أمنية في نظام Windows 11 24H2 تُعطّل مستكشف الملفات وقائمة ابدأ

أكدت مايكروسوفت وجود ثغرة أمنية خطيرة في نظام Windows 11 24H2 تُسبب تعطل مستكشف الملفات…

شهرين ago

تُمكّن القراصنة من استخدام نماذج اللغات الكبيرة غير المقيدة (LLMs)

تُحسّن نماذج اللغات الكبيرة غير المقيدة (LLMs) مثل WormGPT 4 و KawaiiGPT قدراتها على توليد…

شهرين ago

إنفينيكس تُشوّق لهاتف ذكي جديد مُصمّم بالتعاون مع بينينفارينا، ومن المُقرّر إطلاقه الشهر المُقبل.

تتعاون Infinix مع استوديو تصميم إيطالي لتصميم هاتفها الذكي الرائد القادم. لم يُعلن عن الاسم…

شهرين ago