تحكم في الروبوتات عن بُعد باستخدام Apple Vision Pro، NVIDIA: 'تكامل الإنسان والآلة ليس بالأمر الصعب'
قال جينسن هوانغ: "الموجة التالية من الذكاء الاصطناعي هي الروبوتات، وأحد التطورات الأكثر إثارة هو الروبوتات البشرية." اليوم، حقق مشروع GR00T خطوة مهمة إلى الأمام.
أمس، تحدث مؤسس NVIDIA جينسن هوانغ عن نموذج الروبوت البشري العام الخاص بهم، "مشروع GR00T"، خلال كلمته الرئيسية في SIGGRAPH 2024. وقد حصل النموذج على سلسلة من التحديثات الوظيفية.
قام يوك زو، أستاذ مساعد في جامعة تكساس في أوستن وباحث كبير في NVIDIA، بتغريد فيديو يوضح كيف دمجت NVIDIA الأطر التدريبية لمحاكاة الروبوتات المنزلية على نطاق واسع RoboCasa وMimicGen في منصة NVIDIA Omniverse ومنصة تطوير الروبوتات Isaac.
يغطي الفيديو ثلاث منصات حوسبة من NVIDIA—الذكاء الاصطناعي، وOmniverse، وJetson Thor—مستفيدًا منها لتبسيط وتسريع سير العمل للمطورين. من خلال القدرات المدمجة لهذه المنصات الحوسبية، نحن على وشك دخول عصر من الروبوتات البشرية المدفوعة بالذكاء الاصطناعي الفيزيائي.
من بين أبرز النقاط هو أنه يمكن للمطورين استخدام Apple Vision Pro للتحكم عن بُعد في الروبوتات البشرية لأداء المهام.
وفي الوقت نفسه، ذكر عالم الأبحاث الكبير في NVIDIA، جيم فان، أن التحديثات لمشروع GR00T مثيرة للغاية. تستخدم NVIDIA نهجًا منهجيًا لتوسيع بيانات الروبوتات، مما يعالج بعض من أصعب المشكلات في مجال الروبوتات.
الفكرة بسيطة: يقوم البشر بجمع بيانات العرض على الروبوتات الحقيقية، وتقوم NVIDIA بتوسيع هذه البيانات ألف مرة أو أكثر في المحاكاة. مع المحاكاة المعززة بالمعالجات الرسومية، يمكن للناس الآن استخدام القدرة الحوسبية لاستبدال العملية المرهقة والمكلفة لجمع بيانات البشر.
أشار إلى أنه ليس منذ وقت طويل، كان يعتقد أن التشغيل عن بُعد غير قابل للتوسع جوهريًا لأنه في العالم الذري، نحن دائمًا مقيدون بحد الـ 24 ساعة لكل روبوت في اليوم. تكسير خط البيانات الاصطناعية الجديد المستخدم في GR00T هذا القيد في العالم الرقمي.
فيما يتعلق بأحدث تقدمات NVIDIA في مجال الروبوتات البشرية، علق أحد مستخدمي الإنترنت بأن Apple Vision Pro قد وجد أكثر استخداماته برودة.
تبدأ NVIDIA في قيادة الموجة التالية: الذكاء الاصطناعي الفيزيائي.
كما أوضحت NVIDIA عملية تسريع الروبوتات البشرية في منشور مدونة. إليك المحتوى الكامل:
لتسريع تطوير الروبوتات البشرية في جميع أنحاء العالم، أعلنت NVIDIA عن مجموعة من الخدمات والنماذج والمنصات الحوسبية لمصنعي الروبوتات الرائدين ومطوري نماذج الذكاء الاصطناعي وصانعي البرمجيات عالميًا، مما يمكنهم من تطوير وتدريب وبناء الجيل التالي من الروبوتات البشرية.
تشمل هذه المجموعة خدمات NVIDIA NIM الجديدة والميكروسيرفيسات والأطر لمحاكاة الروبوتات والتعلم، وخدمة تنسيق NVIDIA OSMO لتشغيل أحمال العمل المتعددة للروبوتات، وسير العمل الخاص بالتشغيل عن بُعد الذي يدعم الذكاء الاصطناعي والمحاكاة، مما يسمح للمطورين بتدريب الروبوتات بحد أدنى من بيانات العرض البشري.
قال جينسن هوانغ: "الموجة التالية من الذكاء الاصطناعي هي الروبوتات، وأحد التطورات الأكثر إثارة هو الروبوتات البشرية. نحن نتقدم في مجموعة روبوتات NVIDIA بالكامل، ونفتحها لمطوري الروبوتات البشرية والشركات في جميع أنحاء العالم، مما يمكنهم من استخدام المنصات والمكتبات المعززة ونماذج الذكاء الاصطناعي التي تلبي احتياجاتهم بشكل أفضل."
تسريع التطوير باستخدام NVIDIA NIM وOSMO.
تقدم خدمات NIM الميكروسيرفيسات الحاوية الجاهزة المدعومة من برنامج استنتاج NVIDIA، مما يقلل من وقت النشر من أسابيع إلى دقائق.
ستسمح خدمات الميكروسيرفيسات الجديدة للذكاء الاصطناعي لخبراء الروبوتات بتحسين توليد سير العمل لمحاكاة الذكاء الاصطناعي الفيزيائي في NVIDIA Isaac Sim.
تولد خدمة MimicGen NIM بيانات حركة اصطناعية من بيانات مسجلة عن بُعد من أجهزة الحوسبة المكانية مثل Apple Vision Pro. وتولد خدمة Robocasa NIM مهام الروبوتات وبيئات المحاكاة في OpenUSD.
الخدمة المُدارة السحابية NVIDIA OSMO متاحة الآن، مما يسمح للمستخدمين بتنسيق وتوسيع سير العمل المعقد لتطوير الروبوتات عبر موارد الحوسبة الموزعة، سواء كانت محلية أو في السحابة. تبسط OSMO بشكل كبير سير العمل لتدريب الروبوتات والمحاكاة، مما يقلل من دورات النشر والتطوير من أشهر إلى أقل من أسبوع.
توفير سير عمل متقدم لالتقاط البيانات لمطوري الروبوتات البشرية.
يتطلب تدريب النماذج الأساسية خلف الروبوتات البشرية كميات هائلة من البيانات. إحدى الطرق للحصول على بيانات عرض بشرية هي من خلال التشغيل عن بُعد، لكن هذه الطريقة تصبح أكثر تكلفة وتحتاج إلى وقت متزايد.
من خلال عرض سير العمل المرجعي للتشغيل عن بُعد باستخدام NVIDIA AI وOmniverse في مؤتمر SIGGRAPH لرسوم الحاسوب، يمكن للباحثين ومطوري الذكاء الاصطناعي توليد كميات كبيرة من بيانات الحركة والإدراك الاصطناعية من كمية قليلة من البيانات البشرية الملتقطة عن بُعد.
أولاً، يقوم المطورون بالتقاط كمية صغيرة من العرض عن بُعد باستخدام Apple Vision Pro. ثم يقومون بمحاكاة التسجيلات في NVIDIA Isaac Sim ويستخدمون خدمة MimicGen NIM لتوليد مجموعات بيانات اصطناعية من التسجيلات.
يستخدم المطورون كل من البيانات الحقيقية والاصطناعية لتدريب نموذج الروبوت البشري الأساسي لمشروع GR00T، مما يوفر وقتًا كبيرًا ويقلل التكاليف. ثم يستخدمون خدمة Robocasa NIM في Isaac Lab، إطار تعلم الروبوتات، لتوليد تجارب لإعادة تدريب نموذج الروبوت. على مدار سير العمل، تقوم NVIDIA OSMO بتخصيص مهام الحوسبة بسلاسة لموارد مختلفة، مما يقلل من عبء إدارة المطورين من أسابيع.
توسيع الوصول إلى تقنيات مطوري الروبوتات البشرية من NVIDIA.
تقدم NVIDIA ثلاث منصات حوسبية لتبسيط تطوير الروبوتات البشرية: الحاسوب الفائق للذكاء الاصطناعي من NVIDIA لتدريب النماذج؛ NVIDIA Isaac Sim، المبني على Omniverse، للروبوتات لتعلم وتنقيح المهارات في عالم محاكاة؛ وNVIDIA Jetson Thor، حاسوب الروبوتات البشرية لتشغيل النماذج. يمكن للمطورين الوصول إلى واستخدام كل أو جزء من هذه المنصات وفقًا لاحتياجاتهم المحددة.
من خلال برنامج مطوري الروبوتات البشرية الجديد من NVIDIA، يمكن للمطورين الحصول على وصول مبكر إلى المنتجات الجديدة والإصدارات الأحدث من NVIDIA Isaac Sim، وNVIDIA Isaac Lab، وJetson Thor، ونموذج الروبوت البشري الأساسي لمشروع GR00T.
تشمل 1x، وBoston Dynamics، وByteDance، وField AI، وFigure، وFourier، وGalbot، وLimX Dynamics، وMentee، وNeura Robotics، وRobotEra، وSkild AI من بين أولى الشركات التي انضمت إلى برنامج الوصول المبكر.
يمكن للمطورين الآن الانضمام إلى برنامج مطوري الروبوتات البشرية من NVIDIA للوصول إلى NVIDIA OSMO وIsaac Lab وسرعان ما يحصلون على الوصول إلى خدمات الميكروسيرفيسات NIM من NVIDIA.
رابط المدونة: https://nvidianews.nvidia.com/news/nvidia-accelerates-worldwide-humanoid-robotics-development
تابع WriteGo للحصول على أحدث المعلومات حول الذكاء الاصطناعي