Google डीपमाइंड बकरी सिम्युलेटर 3 के अंदर एजेंटों को प्रशिक्षित करने के लिए जेमिनी का उपयोग कर रहा है
Latest Technology, (लेटेस्ट टेक न्यूज़) Gadget (गैजेट्स) …
शोधकर्ताओं का दावा है कि SIMA 2 आभासी दुनिया के अंदर कई जटिल कार्यों को अंजाम दे सकता है, यह पता लगा सकता है कि कुछ चुनौतियों को स्वयं कैसे हल किया जाए, और अपने उपयोगकर्ताओं के साथ चैट कर सकता है। यह कठिन कार्यों को कई बार निपटाकर और परीक्षण और त्रुटि के माध्यम से सीखकर भी खुद को बेहतर बना सकता है।
Google DeepMind के शोध वैज्ञानिक जो मैरिनो ने इस सप्ताह एक संवाददाता सम्मेलन में कहा, “गेम काफी समय से एजेंट अनुसंधान के पीछे एक प्रेरक शक्ति रहा है।” उन्होंने कहा कि खेल में एक साधारण क्रिया, जैसे कि लालटेन जलाना, में भी कई चरण शामिल हो सकते हैं: “यह वास्तव में कार्यों का एक जटिल सेट है जिसे आपको प्रगति के लिए हल करने की आवश्यकता है।”
अंतिम उद्देश्य अगली पीढ़ी के एजेंटों को विकसित करना है जो निर्देशों का पालन करने और वेब ब्राउज़र की तुलना में अधिक जटिल वातावरण में ओपन-एंडेड कार्य करने में सक्षम हैं। लंबे समय में, Google DeepMind वास्तविक दुनिया के रोबोटों को चलाने के लिए ऐसे एजेंटों का उपयोग करना चाहता है। मैरिनो ने दावा किया कि SIMA 2 ने जो कौशल सीखे हैं, जैसे कि पर्यावरण को नेविगेट करना, उपकरणों का उपयोग करना और समस्याओं को हल करने के लिए मनुष्यों के साथ सहयोग करना, भविष्य के रोबोट साथियों के लिए आवश्यक बिल्डिंग ब्लॉक हैं।
अल्फ़ाज़ीरो जैसे गेम-प्लेइंग एजेंटों पर पिछले काम के विपरीत, जिसने 2016 में गो ग्रैंडमास्टर को हराया, या अल्फ़ास्टार, जिसने 99.8% रैंक वाले मानव प्रतियोगिता खिलाड़ियों को हराया 2019 में वीडियो गेम स्टारक्राफ्ट 2 में, SIMA के पीछे का विचार एक एजेंट को पूर्व निर्धारित लक्ष्यों के बिना एक ओपन-एंडेड गेम खेलने के लिए प्रशिक्षित करना है। इसके बजाय, एजेंट लोगों द्वारा उसे दिए गए निर्देशों का पालन करना सीखता है।
मनुष्य SIMA 2 को टेक्स्ट चैट के माध्यम से, ज़ोर से बात करके, या गेम की स्क्रीन पर चित्र बनाकर नियंत्रित करते हैं। एजेंट वीडियो गेम के पिक्सल को फ्रेम दर फ्रेम लेता है और यह पता लगाता है कि उसे अपने कार्यों को पूरा करने के लिए क्या कार्रवाई करने की आवश्यकता है।
अपने पूर्ववर्ती की तरह, SIMA 2 को आठ व्यावसायिक वीडियो गेम खेलने वाले मनुष्यों के फुटेज पर प्रशिक्षित किया गया था, जिसमें नो मैन्स स्काई और गोट सिम्युलेटर 3 के साथ-साथ कंपनी द्वारा बनाई गई तीन आभासी दुनिया भी शामिल थी। एजेंट ने कीबोर्ड और माउस इनपुट को क्रियाओं से मिलाना सीखा।
जेमिनी से जुड़ा हुआ, शोधकर्ताओं का दावा है, SIMA 2 निर्देशों का पालन करने (प्रश्न पूछने और अपडेट प्रदान करने) और स्वयं यह पता लगाने में कहीं बेहतर है कि कुछ अधिक जटिल कार्यों को कैसे किया जाए।
Google DeepMind ने ऐसे वातावरण में एजेंट का परीक्षण किया जिसे उसने पहले कभी नहीं देखा था। प्रयोगों के एक सेट में, शोधकर्ताओं ने फर्म के विश्व मॉडल के नवीनतम संस्करण जिनी 3 को खरोंच से वातावरण तैयार करने के लिए कहा और उनमें SIMA 2 डाला। उन्होंने पाया कि एजेंट वहां नेविगेट करने और निर्देशों को पूरा करने में सक्षम था।
Latest Technology, (लेटेस्ट टेक न्यूज़) Gadget (गैजेट्स) …
Source link
