लगातार सीखने और खुद को बेहतर बनाने वाले एआई के निर्माण की दिशा में एक बड़े कदम के रूप में, गूगल के शोधकर्ताओं ने कहा है कि उन्होंने एक स्व-संशोधित आर्किटेक्चर वाला एक नया मशीन लर्निंग मॉडल विकसित किया है। ‘HOPE’ नामक यह नया मॉडल मौजूदा अत्याधुनिक एआई मॉडलों की तुलना में दीर्घकालिक संदर्भ स्मृति प्रबंधन में बेहतर बताया गया है।
यह गूगल शोधकर्ताओं द्वारा विकसित ‘नेस्टेड लर्निंग’ नामक एक नवीन दृष्टिकोण के लिए अवधारणा के प्रमाण के रूप में कार्य करने के लिए है , जहां एक एकल मॉडल को एक सतत प्रक्रिया के बजाय “एक साथ अनुकूलित परस्पर जुड़े, बहु-स्तरीय सीखने की समस्याओं की प्रणाली” के रूप में माना जाता है, जैसा कि सर्च दिग्गज ने शनिवार, 8 नवंबर को एक ब्लॉग पोस्ट में कहा।
गूगल ने कहा कि ‘नेस्टेड लर्निंग’ की नई अवधारणा आधुनिक बड़े भाषा मॉडल (एलएलएम) में निरंतर सीखने जैसी सीमाओं को हल करने में मदद कर सकती है, जो कृत्रिम सामान्य बुद्धिमत्ता (एजीआई) या मानव जैसी बुद्धिमत्ता के मार्ग पर एक महत्वपूर्ण कदम है। पिछले महीने, Google DeepMind में काम कर चुके और एक बेहद सम्मानित AI/ML शोध वैज्ञानिक, आंद्रेज कारपथी ने कहा था कि AGI अभी एक दशक दूर है, मुख्यतः इसलिए क्योंकि कोई भी ऐसा AI सिस्टम विकसित नहीं कर पाया है जो लगातार सीखता रहे – कम से कम अब तक तो नहीं। “वे लगातार सीखते नहीं हैं। आप उन्हें बस कुछ बताकर उसे याद नहीं रख सकते। उनमें संज्ञानात्मक क्षमता की कमी है और यह काम नहीं कर रहा है। इन सभी समस्याओं को हल करने में लगभग एक दशक लगेगा,” कारपथी ने एक पॉडकास्ट पर अपनी उपस्थिति में कहा । गूगल ने कहा, “हमारा मानना है कि नेस्टेड लर्निंग प्रतिमान वर्तमान एलएलएम की सीमित, विस्मृति की प्रवृत्ति और मानव मस्तिष्क की उल्लेखनीय निरंतर सीखने की क्षमता के बीच की खाई को पाटने के लिए एक मज़बूत आधार प्रदान करता है।” शोधकर्ताओं के निष्कर्ष न्यूरआईपीएस 2025 में ‘नेस्टेड लर्निंग: द इल्यूज़न ऑफ़ डीप लर्निंग आर्किटेक्चर’ शीर्षक से एक शोधपत्र में प्रकाशित हुए।
निरंतर सीखना क्या है? यह एक चुनौती क्यों है?
एआई चैटबॉट्स को शक्ति प्रदान करने वाले एलएलएम वर्तमान में कुछ ही सेकंड में सॉनेट लिखने और कोड तैयार करने में सक्षम हैं। हालाँकि, उनमें अभी तक अनुभव से सीखने की बुनियादी क्षमता नहीं है।
मानव मस्तिष्क के विपरीत, जो निरंतर सीखता और सुधारता रहता है, आज के एलएलएम छात्र पहले से ज्ञात ज्ञान को भूले बिना नया ज्ञान या कौशल प्राप्त नहीं कर सकते। इस अक्षमता को ‘विनाशकारी भूलने’ (सीएफ) कहा जाता है। वर्षों से, शोधकर्ता मॉडल की वास्तुकला में बदलाव करके या बेहतर अनुकूलन तकनीकों के साथ CF का समाधान ढूँढ़ने की कोशिश कर रहे हैं। हालाँकि, गूगल के शोधकर्ताओं का तर्क है कि मॉडल की वास्तुकला और उसे प्रशिक्षित करने के लिए इस्तेमाल किए गए नियम (यानी, अनुकूलन एल्गोरिथम) मूलतः एक ही अवधारणाएँ हैं।
शोधकर्ताओं ने लिखा, “इस अंतर्निहित संरचना को पहचानकर, नेस्टेड लर्निंग अधिक सक्षम एआई को डिजाइन करने के लिए एक नया, पहले अदृश्य आयाम प्रदान करता है, जिससे हमें गहन कम्प्यूटेशनल गहराई के साथ सीखने के घटकों का निर्माण करने की अनुमति मिलती है, जो अंततः भयावह भूलने जैसी समस्याओं को हल करने में मदद करता है।”
नेस्टेड लर्निंग क्या है?
शोधकर्ताओं के अनुसार, नेस्टेड लर्निंग की अवधारणा एक जटिल मशीन लर्निंग मॉडल को “एक दूसरे के भीतर स्थित या समानांतर रूप से चलने वाली सुसंगत, परस्पर जुड़ी अनुकूलन समस्याओं के एक समूह” के रूप में देखती है। उन्होंने आगे कहा, “इन आंतरिक समस्याओं में से प्रत्येक का अपना संदर्भ प्रवाह होता है – सूचनाओं का अपना विशिष्ट समूह जिससे वह सीखने का प्रयास कर रही होती है।” गूगल ने कहा कि इन सिद्धांतों का उपयोग करके, डेवलपर्स एलएलएम में अधिक कम्प्यूटेशनल गहराई वाले शिक्षण घटक बना पाएँगे। गूगल ने आगे कहा, “होप आर्किटेक्चर जैसे परिणामी मॉडल दर्शाते हैं कि इन तत्वों को एकीकृत करने का एक सैद्धांतिक दृष्टिकोण अधिक अभिव्यंजक, सक्षम और कुशल शिक्षण एल्गोरिदम का निर्माण कर सकता है।” कंपनी के अनुसार, प्रूफ-ऑफ-कॉन्सेप्ट मॉडल, HOPE, ने सामान्य रूप से प्रयुक्त और सार्वजनिक भाषा मॉडलिंग तथा सामान्य ज्ञान तर्क कार्यों के विविध सेट पर परीक्षण करने पर आधुनिक LLM की तुलना में कम उलझन और उच्च सटीकता प्रदर्शित की।