Apple Vision Pro के साथ दूरस्थ रूप से रोबोट नियंत्रित करें, NVIDIA: 'मानव-यंत्र एकीकरण कठिन नहीं है'
जेनसन हुआंग ने कहा, "AI की अगली लहर रोबोट हैं, और एक सबसे रोमांचक विकास मानवाकार रोबोट हैं।" आज, प्रोजेक्ट GR00T ने एक महत्वपूर्ण कदम आगे बढ़ाया है।
कल, NVIDIA के संस्थापक जेनसन हुआंग ने अपने SIGGRAPH 2024 की मुख्य भाषण में उनके सामान्य उद्देश्य मानवाकार रोबोट मॉडल, "प्रोजेक्ट GR00T," के बारे में बात की। इस मॉडल को कार्यात्मक अपडेट की एक श्रृंखला प्राप्त हुई है।
युके झू, टेक्सास विश्वविद्यालय में सहायक प्रोफेसर और NVIDIA में वरिष्ठ शोध वैज्ञानिक, एक वीडियो ट्वीट किया जिसमें दिखाया गया है कि NVIDIA ने बड़े पैमाने पर घरेलू रोबोट सिमुलेशन प्रशिक्षण ढांचे RoboCasa और MimicGen को NVIDIA ओमनिवर्स प्लेटफार्म और इसाक रोबोट विकास प्लेटफॉर्म में कैसे एकीकृत किया।
यह वीडियो NVIDIA के तीन कंप्यूटिंग प्लेटफार्मों—AI, ओमनिवर्स और जेटसन थॉर—को कवर करता है, जिन्हें डेवलपर कार्यप्रवाह को सरल और तेज करने के लिए उपयोग किया जा रहा है। इन कंप्यूटिंग प्लेटफार्मों की संयुक्त क्षमताओं के माध्यम से, हम भौतिक AI द्वारा संचालित मानवाकार रोबोटों के युग में प्रवेश करने के लिए तैयार हैं।
मुख्य आकर्षणों में से एक यह है कि डेवलपर्स Apple Vision Pro का उपयोग करके मानवाकार रोबोटों को दूरस्थ रूप से कार्य करने के लिए नियंत्रित कर सकते हैं।
इस बीच, NVIDIA के एक अन्य वरिष्ठ शोध वैज्ञानिक, जिम फैन ने कहा कि प्रोजेक्ट GR00T के अपडेट रोमांचक हैं। NVIDIA एक प्रणालीबद्ध दृष्टिकोण का उपयोग करता है ताकि रोबोट डेटा को स्केल किया जा सके, जो रोबोटिक्स क्षेत्र की कुछ सबसे चुनौतीपूर्ण समस्याओं का समाधान करता है।
विचार सरल है: मनुष्य वास्तविक रोबोटों पर प्रदर्शन डेटा एकत्र करते हैं, और NVIDIA इस डेटा को सिमुलेशन में हजार गुना या उससे अधिक स्केल करता है। GPU-त्वरित सिमुलेशन के साथ, लोग अब समय-खपत करने वाले, श्रम-गहन और महंगे मानव डेटा संग्रह की प्रक्रिया को बदलने के लिए कंप्यूटेशनल शक्ति का उपयोग कर सकते हैं।
उन्होंने उल्लेख किया कि हाल ही में, उन्होंने विश्वास किया कि दूरस्थ संचालन मौलिक रूप से अस्केलेबल था क्योंकि, परमाणु दुनिया में, हम हमेशा प्रति दिन प्रति रोबोट 24 घंटे की सीमा से बाधित होते हैं। GR00T में उपयोग की जाने वाली नई सिंथेटिक डेटा पाइपलाइन डिजिटल दुनिया में इस सीमा को तोड़ती है।
NVIDIA की मानवाकार रोबोटिक्स में नवीनतम प्रगति के संबंध में, एक नेटिजन ने टिप्पणी की कि Apple Vision Pro ने अपना सबसे कूल उपयोग मामला पाया है।
NVIDIA अगली लहर में नेतृत्व करना शुरू करता है: भौतिक AI।
NVIDIA ने मानवाकार रोबोटों को तेज करने की तकनीकी प्रक्रिया का विवरण भी एक ब्लॉग पोस्ट में दिया। यहां पूरा सामग्री है:
दुनिया भर में मानवाकार रोबोटों के विकास को तेज करने के लिए, NVIDIA ने प्रमुख रोबोट निर्माताओं, AI मॉडल डेवलपर्स और सॉफ़्टवेयर निर्माताओं के लिए सेवाओं, मॉडलों और कंप्यूटिंग प्लेटफार्मों का एक सेट घोषित किया है, जिससे उन्हें अगली पीढ़ी के मानवाकार रोबोटों का विकास, प्रशिक्षण और निर्माण करने में सक्षम बनाया जा सके।
इस पैकेज में नए NVIDIA NIM माइक्रोसर्विसेज और रोबोट सिमुलेशन और शिक्षा के लिए ढांचे शामिल हैं, NVIDIA OSMO आर्किटेक्चर सेवा जो बहु-चरण रोबोट कार्यभार चलाने के लिए है, और दूरस्थ संचालन कार्यप्रवाह जो AI और सिमुलेशन का समर्थन करता है, जिससे डेवलपर्स को न्यूनतम मानव प्रदर्शन डेटा के साथ रोबोटों को प्रशिक्षित करने की अनुमति मिलती है।
जेनसन हुआंग ने कहा, "AI की अगली लहर रोबोट हैं, और एक सबसे रोमांचक विकास मानवाकार रोबोट हैं। हम NVIDIA रोबोट स्टैक को आगे बढ़ा रहे हैं, इसे मानवाकार रोबोट डेवलपर्स और कंपनियों के लिए खोलते हुए, उन्हें उन प्लेटफार्मों, तेज़ लाइब्रेरी और AI मॉडलों का उपयोग करने में सक्षम बनाते हैं जो उनकी आवश्यकताओं के लिए सबसे अच्छे हैं।"
NVIDIA NIM और OSMO के साथ विकास को तेज करना।
NIM माइक्रोसर्विसेज NVIDIA इन्फरेंस सॉफ़्टवेयर द्वारा संचालित पूर्व-निर्मित कंटेनर प्रदान करते हैं, जिससे तैनाती का समय हफ्तों से मिनटों में कम हो जाता है।
दो नए AI माइक्रोसर्विसेज रोबोटिक्स विशेषज्ञों को NVIDIA इसाक सिम में भौतिक AI सिमुलेशन कार्यप्रवाह की पीढ़ी को बढ़ाने की अनुमति देंगे।
MimicGen NIM माइक्रोसर्विस दूरस्थ रूप से रिकॉर्ड किए गए डेटा से सिंथेटिक गति डेटा उत्पन्न करता है, जैसे कि Apple Vision Pro। Robocasa NIM माइक्रोसर्विस OpenUSD में रोबोट कार्यों और सिमुलेशन वातावरण उत्पन्न करता है।
क्लाउड-नेटिव प्रबंधित सेवा NVIDIA OSMO अब उपलब्ध है, जिससे उपयोगकर्ता वितरित कंप्यूटिंग संसाधनों के बीच जटिल रोबोट विकास कार्यप्रवाह को समन्वयित और स्केल कर सकते हैं, चाहे वह ऑन-प्रिमाइस हो या क्लाउड में। OSMO रोबोट प्रशिक्षण और सिमुलेशन कार्यप्रवाह को काफी सरल बनाता है, तैनाती और विकास चक्रों को महीनों से एक सप्ताह से कम समय में कम कर देता है।
मानवाकार रोबोट डेवलपर्स के लिए उन्नत डेटा कैप्चर कार्यप्रवाह प्रदान करना।
मानवाकार रोबोटों के पीछे के मौलिक मॉडलों को प्रशिक्षित करने के लिए विशाल मात्रा में डेटा की आवश्यकता होती है। मानव प्रदर्शन डेटा प्राप्त करने का एक तरीका दूरस्थ संचालन के माध्यम से है, लेकिन यह विधि दिन-ब-दिन अधिक महंगी और समय लेने वाली होती जा रही है।
SIGGRAPH कंप्यूटर ग्राफिक्स सम्मेलन में NVIDIA AI और ओमनिवर्स दूरस्थ संचालन संदर्भ कार्यप्रवाह को प्रदर्शित करके, शोधकर्ता और AI डेवलपर्स न्यूनतम मात्रा में दूरस्थ रूप से कैप्चर किए गए मानव प्रदर्शन से बड़े पैमाने पर सिंथेटिक गति और धारणा डेटा उत्पन्न कर सकते हैं।
पहले, डेवलपर्स Apple Vision Pro का उपयोग करके दूरस्थ प्रदर्शन का एक छोटा हिस्सा कैप्चर करते हैं। फिर, वे NVIDIA इसाक सिम में रिकॉर्डिंग का सिमुलेशन करते हैं और MimicGen NIM माइक्रोसर्विस का उपयोग करके रिकॉर्डिंग से सिंथेटिक डेटासेट उत्पन्न करते हैं।
डेवलपर्स वास्तविक और सिंथेटिक डेटा दोनों का उपयोग करके प्रोजेक्ट GR00T मानवाकार रोबोट मौलिक मॉडल को प्रशिक्षित करते हैं, महत्वपूर्ण समय बचाते हैं और लागत को कम करते हैं। वे फिर इसाक लैब में रोबोकासा NIM माइक्रोसर्विस का उपयोग करके रोबोट मॉडल को फिर से प्रशिक्षित करने के लिए अनुभव उत्पन्न करते हैं। कार्यप्रवाह के दौरान, NVIDIA OSMO बिना किसी बाधा के विभिन्न संसाधनों को कंप्यूटिंग कार्यों को आवंटित करता है, जिससे डेवलपर्स के प्रबंधन कार्यभार को हफ्तों तक कम किया जा सकता है।
NVIDIA मानवाकार रोबोट डेवलपर तकनीकों तक पहुँच का विस्तार करना।
NVIDIA मानवाकार रोबोट विकास को सरल बनाने के लिए तीन कंप्यूटिंग प्लेटफार्मों की पेशकश करता है: मॉडल प्रशिक्षित करने के लिए NVIDIA AI सुपरकंप्यूटर; ओमनिवर्स पर निर्मित NVIDIA इसाक सिम, रोबोटों को एक सिमुलेटेड दुनिया में कौशल सीखने और सुधारने के लिए; और NVIDIA जेटसन थॉर मानवाकार रोबोट कंप्यूटर मॉडल चलाने के लिए। डेवलपर्स अपनी विशिष्ट आवश्यकताओं के अनुसार इन प्लेटफार्मों का उपयोग कर सकते हैं।
नए NVIDIA मानवाकार रोबोट डेवलपर प्रोग्राम के माध्यम से, डेवलपर्स को NVIDIA इसाक सिम, NVIDIA इसाक लैब, जेटसन थॉर, और प्रोजेक्ट GR00T सामान्य मानवाकार रोबोट मौलिक मॉडल के नए उत्पादों और नवीनतम संस्करणों तक जल्दी पहुँच प्राप्त हो सकती है।
1x, बॉट्सन डायनामिक्स, बाइटडांस, फील्ड AI, फिगर, फूरियर, गैल्बॉट, लिमएक्स डायनामिक्स, मेंटी, न्यूरा रोबोटिक्स, रोबोटएरा, और स्किल्ड AI पहले कंपनियों में से हैं जिन्होंने प्रारंभिक पहुँच कार्यक्रम में शामिल होने के लिए।
डेवलपर्स अब NVIDIA मानवाकार रोबोट डेवलपर प्रोग्राम में शामिल हो सकते हैं ताकि NVIDIA OSMO और इसाक लैब तक पहुँच प्राप्त कर सकें और जल्द ही NVIDIA NIM माइक्रोसर्विसेज तक पहुँच प्राप्त कर सकें।
ब्लॉग लिंक: https://nvidianews.nvidia.com/news/nvidia-accelerates-worldwide-humanoid-robotics-development
नवीनतम AI जानकारी प्राप्त करने के लिए WriteGo का पालन करें