बुधवार, फ़रवरी 21, 2024

Top 5 This Week

spot_img

Related Posts

विचारों का वृक्ष जो बेहतर उत्पादक एआई परिणामों की ओर ले जाता है


कई लोग बेहतर और अधिक परिष्कृत प्रतिक्रियाएँ प्राप्त करने के लिए कृत्रिम बुद्धिमत्ता को निर्देशित करने की लोकप्रिय चेन ऑफ़ थॉट (सीओटी) विधि से अवगत हैं। गूगल डीपमाइंड और प्रिंसटन यूनिवर्सिटी के शोधकर्ताओं ने ट्री ऑफ थॉट्स (टीओटी) नामक एक बेहतर मार्गदर्शन रणनीति विकसित की है जो मार्गदर्शन को उच्च स्तर के परिणामों तक ले जाती है, अधिक परिष्कृत सोच विधियों और बेहतर आउटपुट को अनलॉक करती है।

शोधकर्ता बताते हैं:

“हम दिखाते हैं कि विचारों के वृक्षों (टीओटी) में निर्देशित खोज कैसे बेहतर परिणाम देती है और, अधिक महत्वपूर्ण बात यह है कि खोज या योजना की आवश्यकता वाली समस्याओं को हल करने के लिए भाषा मॉडल का उपयोग करने के दिलचस्प और आशाजनक नए तरीके हैं।”

शोधकर्ता तीन प्रकार के मार्गदर्शन की तुलना करते हैं

शोध पत्र टीओटी की तुलना तीन अन्य शिक्षण रणनीतियों से करता है।

1. इनपुट-आउटपुट (आईओ) निर्देश।
यह मूल रूप से भाषा मॉडल को हल करने और उत्तर पाने के लिए एक समस्या देता है।

पाठ सारांश पर आधारित एक उदाहरण है:

इनपुट लैंडिंग: निम्नलिखित आलेख का सारांश प्रस्तुत करें।
आउटपुट संदेश: प्रस्तुत लेख पर आधारित एक सारांश

2. विचारों की शृंखला

संकेत देने का यह रूप वह है जहां एक भाषा मॉडल को विचारों के तार्किक अनुक्रम का पालन करने के लिए प्रोत्साहित करके सुसंगत और जुड़ी प्रतिक्रियाएं उत्पन्न करने के लिए निर्देशित किया जाता है। विचार श्रृंखला (सीओटी) मार्गदर्शन समस्या-समाधान सोच के मध्यवर्ती चरणों के माध्यम से एक भाषा मॉडल का मार्गदर्शन करने का एक तरीका है।

विचारों की श्रृंखला का एक उदाहरण:

प्रश्न: रोजर के पास 5 टेनिस गेंदें हैं। वह टेनिस गेंदों के 2 और डिब्बे खरीदता है। प्रत्येक कैन में 3 टेनिस गेंदें हैं। अब उसके पास कितनी टेनिस गेंदें हैं?
तर्क: रोजर ने 5 गेंदों से शुरुआत की। 3 टेनिस गेंदों के 2 डिब्बे, प्रत्येक 6 टेनिस गेंदें। 5 + 6 = 11. उत्तर: 11

प्रश्न: कैफेटेरिया में 23 सेब थे। यदि उन्होंने दोपहर का भोजन बनाने के लिए 20 का उपयोग किया और 6 और खरीदे, तो उनके पास कितने सेब हैं?

3. सीओटी के साथ आत्मनिर्भरता

सीधे शब्दों में कहें तो, यह भाषा मॉडल को कई बार संकेत देने और फिर सबसे आम उत्तर चुनने की एक संकेत देने वाली रणनीति है।

ईश्वर अनुसंधान मार्च 2023 से सीओटी के साथ स्व-संरेखण पर यह बताया गया है:

“यह पहले केवल लालची को अपनाने के बजाय विचार पथों के एक विविध सेट का नमूना लेता है, और फिर नमूना किए गए विचार पथों को हाशिए पर रखकर सबसे सुसंगत उत्तर का चयन करता है। आत्म-संगति अंतर्ज्ञान का लाभ उठाती है कि एक जटिल सोच समस्या आमतौर पर कई अलग-अलग तरीकों को स्वीकार करती है यह सोचने से इसका अद्वितीय सही उत्तर प्राप्त होता है।”

मानव अनुभूति में दोहरी प्रक्रिया मॉडल

शोधकर्ता इस सिद्धांत से प्रेरित हैं कि कैसे मानव निर्णय सोच को मानव अनुभूति के दोहरे-प्रक्रिया मॉडल या दोहरे-प्रक्रिया सिद्धांत कहा जाता है।

मानव अनुभूति में दोहरी प्रक्रियाओं के मॉडल से पता चलता है कि मनुष्य दो प्रकार की निर्णय लेने की प्रक्रियाओं में संलग्न होंगे, एक सहज और तेज़ और दूसरा अधिक विचारशील और धीमा।

  • तेज़, स्वचालित, अचेतन
    इस स्थिति में तेज़, स्वचालित, अचेतन सोच शामिल होती है जिसे अक्सर अंतर्ज्ञान पर आधारित कहा जाता है।
  • धीमा, जानबूझकर, सचेत
    निर्णय लेने का यह तरीका एक धीमी, जानबूझकर और सचेत सोच प्रक्रिया है जिसमें अंतिम निर्णय लेने से पहले चरण दर चरण विचार, विश्लेषण और तर्क शामिल होता है।

ट्री ऑफ थॉट (टीओटी) मार्गदर्शन ढांचा सोच प्रक्रिया में प्रत्येक चरण की एक वृक्ष संरचना का उपयोग करता है जो भाषा मॉडल को प्रत्येक सोच कदम का मूल्यांकन करने और यह तय करने की अनुमति देता है कि तर्क में वह कदम व्यवहार्य है या नहीं और उत्तर की ओर ले जाता है। यदि भाषा मॉडल यह तय करता है कि सोचने के तरीके से उत्तर नहीं मिलेगा, तो मार्गदर्शन रणनीति के लिए उसे उस पथ (या शाखा) को छोड़ना होगा और दूसरी शाखा के साथ प्रगति जारी रखनी होगी, जब तक कि वह अंतिम परिणाम तक नहीं पहुंच जाती।

विचार का वृक्ष (टीओटी) बनाम विचार की श्रृंखला (सीओटी)

टीओटी और सीओटी के बीच अंतर यह है कि टीओटी में सोच प्रक्रिया के लिए एक पेड़ और शाखा ढांचा है जबकि सीओटी अधिक रैखिक पथ अपनाता है।

सीधे शब्दों में कहें तो, सीओटी भाषा मॉडल को किसी कार्य को करने के लिए चरणों की एक श्रृंखला करने के लिए कहता है, सिस्टम 1 संज्ञानात्मक मॉडल के समान जो तेज़ और स्वचालित है।

टीओटी सिस्टम 2 के संज्ञानात्मक मॉडल के समान है जो अधिक विचारशील है और भाषा मॉडल को चरणों की एक श्रृंखला का पालन करने के लिए कहता है, लेकिन प्रत्येक चरण को संपादित करने और समीक्षा करने के लिए एक मूल्यांकनकर्ता भी सम्मिलित करता है कि क्या यह आगे बढ़ने के लिए एक अच्छा कदम है और यदि नहीं। रुकना और अनुसरण करना. एक और तरीका।

उत्साहवर्धक रणनीतियों के उदाहरण

शोध पत्र में प्रत्येक निर्देशात्मक रणनीति के योजनाबद्ध चित्र प्रकाशित किए गए हैं, जिसमें आयताकार बक्से कार्य पूरा होने, समस्या समाधान की दिशा में प्रत्येक चरण के भीतर “विचार” का प्रतिनिधित्व करते हैं।
टीओटी के लिए तर्क प्रक्रिया कैसी दिखती है इसका एक स्क्रीनशॉट नीचे दिया गया है:

विचारों का वृक्ष जो बेहतर उत्पादक एआई परिणामों की ओर ले जाता हैविचारों का वृक्ष जो बेहतर उत्पादक एआई परिणामों की ओर ले जाता है

हालांकि संकेत की एक श्रृंखला का चित्रण

यह सीओटी का योजनाबद्ध चित्रण है, जो दिखाता है कि कैसे सोचने की प्रक्रिया एक सीधे (रैखिक) पथ की तरह है:

विचारों का वृक्ष जो बेहतर उत्पादक एआई परिणामों की ओर ले जाता हैविचारों का वृक्ष जो बेहतर उत्पादक एआई परिणामों की ओर ले जाता है

शोध पत्र बताता है:

“मानव समस्या समाधान पर शोध से पता चलता है कि लोग एक संयुक्त समस्या स्थान के माध्यम से खोज करते हैं – एक पेड़ जिसमें नोड्स आंशिक समाधान का प्रतिनिधित्व करते हैं, और शाखाएं ऑपरेटरों के अनुरूप होती हैं
जो उन्हें बदल दे. कौन सी शाखा लेनी है यह अनुमानों द्वारा निर्धारित किया जाता है जो समस्या स्थान को नेविगेट करने और समस्या समाधानकर्ता को समाधान की दिशा में मार्गदर्शन करने में मदद करता है।

यह परिप्रेक्ष्य मौजूदा दृष्टिकोणों की दो प्रमुख कमियों पर प्रकाश डालता है जो सामान्य समस्याओं को हल करने के लिए एलएम का उपयोग करते हैं:

1) स्थानीय स्तर पर, वे एक विचार प्रक्रिया के भीतर विभिन्न सातत्यों – पेड़ की शाखाओं – का पता नहीं लगाते हैं।

2) विश्व स्तर पर, वे इन विभिन्न संभावनाओं का मूल्यांकन करने में मदद करने के लिए किसी भी प्रकार की योजना, दूरंदेशी या पिछड़े-ट्रैकिंग को शामिल नहीं करते हैं – जिस प्रकार की अनुमानतः निर्देशित खोज मानव समस्या समाधान की विशेषता प्रतीत होती है।

इन कमियों को दूर करने के लिए, हम ट्री ऑफ थॉट (टीओटी) पेश करते हैं, एक प्रतिमान जो एलएम को विचारों के बीच सोच के कई मार्गों का पता लगाने की अनुमति देता है…”

गणित खेल के साथ परीक्षण किया गया

शोधकर्ताओं ने गणित के खेल गेम ऑफ 24 का उपयोग करके विधि का परीक्षण किया। गेम ऑफ 24 एक गणितीय कार्ड गेम है जिसमें खिलाड़ी ताश के डेक से चार संख्याओं (जिन्हें केवल एक बार इस्तेमाल किया जा सकता है) का उपयोग करके उन्हें बुनियादी अंकगणित (जोड़, घटाव) का उपयोग करके संयोजित करते हैं। , गुणा और भाग) 24 का परिणाम प्राप्त करने के लिए।

परिणाम और निष्कर्ष

शोधकर्ताओं ने अन्य तीन दृष्टिकोणों के मुकाबले टीओटी अनुदेशात्मक रणनीति का परीक्षण किया और पाया कि यह लगातार बेहतर परिणाम देता है।

हालाँकि, वे यह भी ध्यान देते हैं कि उन कार्यों को पूरा करने के लिए टीओटी की आवश्यकता नहीं हो सकती है जो जीपीटी-4 पहले से ही अच्छी तरह से करता है।

वे निष्कर्ष निकालते हैं:

किसी समस्या को हल करने के लिए संभावित रास्तों की ट्री खोज के आधार पर एलएम के सहयोगी सिस्टम 1 को सिस्टम 2 द्वारा उपयोगी रूप से संवर्धित किया जा सकता है।

माइंड ट्री फ्रेमवर्क समकालीन एलएम के लिए समस्या समाधान के बारे में शास्त्रीय अंतर्दृष्टि को कार्रवाई योग्य तरीकों में अनुवाद करने का एक तरीका प्रदान करता है।

साथ ही, एलएम इन शास्त्रीय तरीकों की कमजोरी को संबोधित करते हैं, जिससे जटिल समस्याओं को हल करने का एक तरीका प्रदान किया जाता है जिन्हें आसानी से औपचारिक नहीं किया जा सकता है, जैसे कि रचनात्मकता
लिखना।

हम एआई के शास्त्रीय दृष्टिकोण के साथ एलएम के इस प्रतिच्छेदन को एक रोमांचक दिशा के रूप में देखते हैं।

मूल शोध पत्र पढ़ें:

द माइंड ट्री: बड़े भाषा मॉडल के साथ निर्देशित समस्या समाधान

शटरस्टॉक/असियर रोमेरो द्वारा प्रदर्शित छवि

ibnkamal
ibnkamalhttps://iseotools.me
Wasim Ibn Kamal | founder of iseotools.me, newslike.site and healtinfo.space | A developer and UI/UX designer. Cluster-notes.blogspot.com and tsbdu.blogspot.com are two of my blogs.

कोई जवाब दें

कृपया अपनी टिप्पणी दर्ज करें!
कृपया अपना नाम यहाँ दर्ज करें

Popular Articles