बुधवार, फ़रवरी 21, 2024

Top 5 This Week

spot_img

Related Posts

बार्ड बनाम चैटजीपीटी बनाम क्लाउड


शोधकर्ताओं ने इस विचार का परीक्षण किया कि एआई मॉडल को अपनी सामग्री का स्वयं पता लगाने में फायदा हो सकता है क्योंकि पता लगाने में समान प्रशिक्षण और सरणियों का लाभ मिलता है। उन्हें जो मिलने की उम्मीद नहीं थी, वह यह था कि जिन तीन एआई मॉडलों का उन्होंने परीक्षण किया था, उनमें से एक द्वारा बनाई गई सामग्री इतनी अपरिचित थी कि इसे बनाने वाला एआई भी इसे पहचान नहीं सका।

यह अध्ययन दक्षिणी मेथोडिस्ट विश्वविद्यालय में येल स्कूल ऑफ इंजीनियरिंग के कंप्यूटर विज्ञान विभाग के शोधकर्ताओं द्वारा आयोजित किया गया था।

एआई सामग्री का पता लगाना

कई एआई डिटेक्टरों को एआई-जनित सामग्री के स्पष्ट संकेतों को देखने के लिए प्रशिक्षित किया जाता है। इन संकेतों को “कलाकृतियाँ” कहा जाता है जो अंतर्निहित ट्रांसफार्मर तकनीक के कारण बनाई जाती हैं। लेकिन अन्य वस्तुएं प्रत्येक मौलिक मॉडल (बड़ा भाषा मॉडल जिस पर कृत्रिम बुद्धिमत्ता आधारित है) के लिए अद्वितीय हैं।

ये कलाकृतियाँ प्रत्येक एआई के लिए अद्वितीय हैं और अद्वितीय प्रशिक्षण डेटा और फाइन ट्यूनिंग का परिणाम हैं जो हमेशा एक एआई मॉडल से दूसरे में भिन्न होता है।

शोधकर्ताओं ने सबूत पाया कि यह विशिष्टता है जो एआई को अपनी स्वयं की सामग्री को स्वयं-पहचानने में अधिक सफल होने की अनुमति देती है, जो किसी अन्य एआई द्वारा बनाई गई सामग्री की पहचान करने की कोशिश से कहीं अधिक है।

बार्ड के पास बार्ड-जनित सामग्री का पता लगाने की बेहतर संभावना है और चैटजीपीटी के पास चैटजीपीटी-जनित सामग्री का पता लगाने की उच्च सफलता दर है, लेकिन…

शोधकर्ताओं ने पाया कि क्लाउड द्वारा बनाई गई सामग्री के लिए यह सच नहीं है। क्लाउड को अपने द्वारा बनाई गई सामग्री को पहचानने में परेशानी हो रही थी। शोधकर्ताओं ने एक विचार साझा किया कि क्लाउड इसकी सामग्री को पहचानने में क्यों विफल रहा और यह लेख इस पर आगे चर्चा करता है।

शोध परीक्षणों के पीछे यह विचार है:

“क्योंकि प्रत्येक मॉडल को अलग-अलग तरीके से प्रशिक्षित किया जा सकता है, इसलिए सभी संभावित एआई टूल द्वारा बनाई गई कलाकृतियों का पता लगाने के लिए एकल डिटेक्टर टूल प्राप्त करना मुश्किल है।

यहां, हम आत्म-पहचान नामक एक और दृष्टिकोण विकसित करते हैं, जहां हम अपने उत्पन्न पाठ को मानव लिखित पाठ से अलग करने के लिए अपनी वस्तुओं को पहचानने के लिए जेनरेटिव मॉडल का उपयोग करते हैं।

इसका फायदा यह होगा कि हमें सभी जेनरेटिव एआई मॉडल को पहचानना सीखने की जरूरत नहीं है, बल्कि पहचान के लिए हमें केवल एआई मॉडल तक पहुंच की जरूरत है।

यह उस दुनिया में एक बड़ा लाभ है जहां नए मॉडल लगातार विकसित और प्रशिक्षित किए जा रहे हैं।”

कार्यप्रणाली

शोधकर्ताओं ने तीन एआई मॉडल का परीक्षण किया:

  1. OpenAI द्वारा ChatGPT-3.5
  2. गूगल द्वारा बार्ड
  3. एन्थ्रोपिक द्वारा क्लाउड

उपयोग किए गए सभी मॉडल सितंबर 2023 संस्करण थे।

पचास विभिन्न विषयों का एक डेटासेट बनाया गया। प्रत्येक एआई मॉडल को पचास विषयों में से प्रत्येक के लिए लगभग 250 शब्दों के निबंध बनाने के लिए बिल्कुल समान निर्देश दिए गए थे, जिससे तीनों एआई मॉडलों में से प्रत्येक के लिए पचास निबंध तैयार किए गए।

प्रत्येक एआई मॉडल को समान रूप से अपनी सामग्री को संक्षिप्त करने और एक अतिरिक्त निबंध बनाने के लिए कहा गया था जो प्रत्येक मूल निबंध का पुनर्लेखन था।

उन्होंने पचास विषयों में से प्रत्येक पर पचास मानव-निर्मित लेख भी एकत्र किए। सभी मानव निर्मित निबंध बीबीसी से चुने गए।

इसके बाद शोधकर्ताओं ने एआई-जनित सामग्री की पहचान करने के लिए एक शून्य संकेत का उपयोग किया।

जीरो-शॉट मार्गदर्शन एक प्रकार का मार्गदर्शन है जो एआई मॉडल की उन कार्यों को करने की क्षमता पर निर्भर करता है जिनके लिए उन्हें विशेष रूप से प्रशिक्षित नहीं किया गया था।

शोधकर्ताओं ने अपनी कार्यप्रणाली को आगे समझाया:

“हमने प्रत्येक कृत्रिम बुद्धिमत्ता प्रणाली का एक नया उदाहरण बनाया जिसे एक विशिष्ट क्वेरी के साथ खोला और प्रस्तुत किया गया: ‘यदि निम्नलिखित पाठ इसके लेखन पैटर्न और शब्दों की पसंद से मेल खाता है।’ प्रक्रिया है
मूल, व्याख्याकृत और मानवीय रचनाएँ दोहराई जाती हैं, और परिणाम दर्ज किए जाते हैं।

हमने ZeroGPT AI डिटेक्शन टूल का परिणाम भी जोड़ा है। हम इस परिणाम का उपयोग प्रदर्शन की तुलना करने के लिए नहीं बल्कि आधार रेखा के रूप में यह दिखाने के लिए करते हैं कि पता लगाने का कार्य कितना चुनौतीपूर्ण है।”

उन्होंने यह भी नोट किया कि 50% की सटीकता दर एक अनुमान के बराबर है जिसे सटीकता का एक स्तर माना जा सकता है जो अनिवार्य रूप से एक विफलता है।

परिणाम: आत्म-पहचान

यह ध्यान दिया जाना चाहिए कि शोधकर्ताओं ने स्वीकार किया कि उनकी नमूना दर कम थी और कहा कि वे यह दावा नहीं कर रहे हैं कि परिणाम निश्चित हैं।

नीचे एक ग्राफ़ है जो कनेक्शन के पहले सेट की एआई स्व-पहचान सफलता दर दिखा रहा है। लाल मान AI सेल्फ-डिटेक्शन का प्रतिनिधित्व करते हैं और नीला ZeroGPT AI डिटेक्शन टूल के प्रदर्शन का प्रतिनिधित्व करते हैं।

एआई की अपनी पाठ्य सामग्री की स्व-पहचान के परिणाम

एआई सामग्री का पता लगाना: बार्ड बनाम चैटजीपीटी बनाम क्लाउडएआई सामग्री का पता लगाना: बार्ड बनाम चैटजीपीटी बनाम क्लाउड

बार्ड अपनी स्वयं की सामग्री की पहचान करने में काफी सफल रहा, और चैटजीपीटी भी अपनी स्वयं की सामग्री की पहचान करने में इसी तरह सफल रहा।

जीरोजीपीटी, एआई डिटेक्शन टूल, ने बार्ड सामग्री का बहुत अच्छी तरह से पता लगाया और चैटजीपीटी सामग्री का पता लगाने में थोड़ा कम अच्छा प्रदर्शन किया।

ज़ीरोजीपीटी वास्तव में क्लाउड द्वारा बनाई गई सामग्री का पता लगाने में विफल रहा, जिसका प्रदर्शन 50% सीमा से भी खराब था।

क्लाउड समूह का अपवाद था क्योंकि यह अपनी स्वयं की सामग्री का पता लगाने में असमर्थ था, और बार्ड और चैटजीपीटी की तुलना में काफी खराब प्रदर्शन करता था।

शोधकर्ताओं ने अनुमान लगाया कि क्लाउड के आउटपुट में कम पहचानने योग्य कलाकृतियाँ हो सकती हैं, यह बताते हुए कि क्लाउड और ज़ीरोजीपीटी दोनों क्लाउड की रचनाओं को एआई-जनरेटेड के रूप में पहचानने में विफल क्यों रहे।

इसलिए, भले ही क्लाउड अपनी सामग्री को विश्वसनीय रूप से पहचानने में असमर्थ था, यह एक संकेत साबित हुआ कि कम एआई कलाकृतियों के आउटपुट के मामले में क्लाउड से आउटपुट उच्च गुणवत्ता का था।

चैटजीपीटी और क्लाउड सामग्री का पता लगाने की तुलना में ज़ीरोजीपीटी ने बार्ड द्वारा बनाई गई सामग्री का पता लगाने में बेहतर प्रदर्शन किया। शोधकर्ताओं ने अनुमान लगाया कि ऐसा हो सकता है कि बार्ड पहचानने योग्य वस्तुओं का उत्पादन करता है, जिससे बार्ड को पहचानना आसान हो जाता है।

इसलिए स्व-पहचान योग्य सामग्री के संदर्भ में, यह संभव है कि बार्ड पहचानने योग्य वस्तुओं का उत्पादन करता है और क्लाउड कम वस्तुओं का उत्पादन करता है।

परिणाम: अवैध सामग्री की स्व-पहचान

शोधकर्ताओं ने अनुमान लगाया कि एआई मॉडल अपने स्वयं के संक्षिप्त पाठ को पहचानने में सक्षम होंगे, क्योंकि मॉडल द्वारा उत्पन्न कलाकृतियां (जैसा कि मूल लेखों में पहचानी गई हैं) लिखित पाठ में भी मौजूद होनी चाहिए।

हालाँकि, शोधकर्ताओं ने माना कि पाठ लिखने और व्याख्या करने के निर्देश अलग-अलग हैं क्योंकि प्रत्येक पुनर्लेखन मूल पाठ से अलग है, जिससे संक्षिप्त पाठ स्व-मान्यता के लिए अलग-अलग स्व-मान्यता परिणाम हो सकते हैं।

व्याख्यात्मक पाठ की आत्म-पहचान के परिणाम वास्तव में मूल निबंध परीक्षण की आत्म-पहचान से भिन्न थे।

  • बार्ड समान दर पर स्वयं सेवामुक्त सामग्री की पहचान करने में सक्षम था।
  • चैटजीपीटी 50% दर (जो एक अनुमान है) से कहीं अधिक दर पर अपने आप ही गैरकानूनी सामग्री का पता लगाने में विफल रहा।
  • ज़ीरोजीपीटी का प्रदर्शन पिछले परीक्षण के परिणामों के समान था, थोड़ा खराब प्रदर्शन।

शायद सबसे दिलचस्प परिणाम क्लाउड ऑफ़ एन्ट्रॉपी द्वारा प्रस्तुत किया गया था।

क्लाउड हटाई गई सामग्री को स्वयं पहचानने में सक्षम था (लेकिन वह पिछले परीक्षण में मूल निबंध की पहचान करने में असमर्थ था)।

यह एक दिलचस्प परिणाम है कि क्लाउड की मूल रचनाओं में स्पष्ट रूप से इतनी कम कलाकृतियाँ थीं जो यह संकेत देती थीं कि यह एआई द्वारा बनाई गई थी कि क्लाउड भी इसका पता नहीं लगा सका।

हालाँकि, यह अपने आप ही पैराफ़्रेज़ का पता लगाने में सक्षम था जबकि ZeroGPT विफल रहा।

शोधकर्ताओं ने इस परीक्षण पर टिप्पणी की:

“यह निष्कर्ष कि क्लाउड की आत्म-पहचान को बढ़ाते हुए चैटजीपीटी को आत्म-पहचान से रोकता है, यह निष्कर्ष बहुत दिलचस्प है और इन दो ट्रांसफार्मर मॉडल के आंतरिक कामकाज का परिणाम हो सकता है।”

एआई सामग्री स्व-पहचान का स्क्रीनशॉट

एआई सामग्री का पता लगाना: बार्ड बनाम चैटजीपीटी बनाम क्लाउडएआई सामग्री का पता लगाना: बार्ड बनाम चैटजीपीटी बनाम क्लाउड

इन परीक्षणों ने लगभग अप्रत्याशित परिणाम उत्पन्न किए, विशेष रूप से एंथ्रोपिक के क्लाउड के लिए, और यह प्रवृत्ति इस परीक्षण के साथ जारी रही कि एआई मॉडल एक-दूसरे की सामग्री को कितनी अच्छी तरह पहचानते हैं, जिसमें एक दिलचस्प झुर्रियाँ थीं।

परिणाम: एआई मॉडल जो एक दूसरे की सामग्री को पहचानते हैं

निम्नलिखित परीक्षण से पता चला कि प्रत्येक एआई मॉडल अन्य एआई मॉडल द्वारा उत्पन्न सामग्री को कितनी अच्छी तरह पहचानने में सक्षम था।

यदि यह सच है कि बार्ड अन्य मॉडलों की तुलना में अधिक कलाकृतियों का उत्पादन करता है, तो क्या अन्य मॉडल बार्ड द्वारा बनाई गई सामग्री का आसानी से पता लगाने में सक्षम होंगे?

नतीजे बताते हैं कि हां, बार्ड द्वारा बनाई गई सामग्री को अन्य एआई मॉडल द्वारा पहचानना सबसे आसान है।

चैटजीपीटी का उपयोग करके उत्पन्न सामग्री की पहचान के संबंध में, क्लाउड और बार्ड दोनों इसे एआई-जनरेटेड (क्लाउड की तरह) के रूप में पहचानने में विफल रहे।

चैटजीपीटी बार्ड और क्लाउड की तुलना में अधिक दर पर क्लाउड-जनरेटेड सामग्री का पता लगाने में सक्षम था, लेकिन यह उच्च दर अनुमान से बहुत बेहतर नहीं थी।

यहां निष्कर्ष यह है कि वे एक-दूसरे की सामग्री को पहचानने में उतने अच्छे नहीं थे, शोधकर्ताओं ने सोचा कि यह दिखा सकता है कि आत्म-पहचान अनुसंधान का एक आशाजनक क्षेत्र था।

नीचे इस विशेष परीक्षण के परिणाम दर्शाने वाला ग्राफ है:

एआई सामग्री का पता लगाना: बार्ड बनाम चैटजीपीटी बनाम क्लाउडएआई सामग्री का पता लगाना: बार्ड बनाम चैटजीपीटी बनाम क्लाउड

इस बिंदु पर यह ध्यान दिया जाना चाहिए कि शोधकर्ता यह दावा नहीं करते हैं कि ये परिणाम सामान्य रूप से एआई का पता लगाने के संबंध में स्पष्ट हैं। शोध का फोकस यह देखने के लिए परीक्षण करना था कि क्या एआई मॉडल स्व-निर्मित सामग्री की स्वयं-पहचान करने में सफल हो सकते हैं। उत्तर अधिकतर हां है, वे आत्म-पहचान का बेहतर काम करते हैं लेकिन परिणाम ZEROGpt के समान ही होते हैं।

शोधकर्ताओं ने टिप्पणी की:

“आत्म-पहचान ज़ीरोजीपीटी की तुलना में समान पहचान शक्ति दिखाती है, लेकिन ध्यान दें कि इस अध्ययन का उद्देश्य यह दावा करना नहीं है कि आत्म-पहचान अन्य तरीकों से बेहतर है, जिसे कला एआई सामग्री पहचान की कई स्थितियों के साथ तुलना करने के लिए एक बड़े अध्ययन की आवश्यकता होगी उपकरण। यहां, हम केवल आत्म-पहचान के लिए मॉडलों की बुनियादी क्षमता की खोज कर रहे हैं”।

निष्कर्ष और निष्कर्ष

परीक्षण के नतीजे इस बात की पुष्टि करते हैं कि कृत्रिम बुद्धिमत्ता द्वारा उत्पन्न सामग्री की पहचान करना कोई आसान काम नहीं है। बार्ड अपनी सामग्री और अपनी सामग्री को व्याख्या में पहचानने में सक्षम है।

चैटजीपीटी अपनी सामग्री को पहचान सकता है लेकिन अपनी सामग्री को व्याख्यायित करने का कम अच्छा काम करता है।

क्लाउड अद्वितीय है क्योंकि यह विश्वसनीय रूप से अपनी सामग्री का पता नहीं लगा सकता है, लेकिन यह बहिष्कृत सामग्री का पता लगाने में सक्षम था, जो काफी अजीब और अप्रत्याशित था।

क्लाउड की मूल रचनाओं और अवर्गीकृत लेखों की पहचान करना ज़ीरोजीपीटी और अन्य एआई मॉडल के लिए एक चुनौती थी।

शोधकर्ताओं ने क्लाउड के परिणामों के संबंध में नोट किया:

“इस प्रतीत होने वाले अनिर्णायक परिणाम पर और अधिक विचार करने की आवश्यकता है क्योंकि यह दो संयुक्त कारणों से प्रेरित है।

1) बहुत कम पहचानने योग्य वस्तुओं के साथ पाठ उत्पन्न करने की मॉडल की क्षमता। चूँकि इन प्रणालियों का लक्ष्य मानव-जैसा पाठ बनाना है, कम वस्तुओं का पता लगाना कठिन है, इसका मतलब है कि मॉडल उस लक्ष्य के करीब पहुंच रहा है।

2) मॉडल की स्वयं को पहचानने की अंतर्निहित क्षमता उपयोग की गई वास्तुकला, मार्गदर्शन और लागू फाइन-ट्यूनिंग से प्रभावित हो सकती है।”

क्लाउड के बारे में शोधकर्ताओं का एक और अवलोकन था:

“केवल क्लाउड ही पता लगाने योग्य नहीं है। इससे पता चलता है कि क्लाउड अन्य मॉडलों की तुलना में कम पता लगाने योग्य वस्तुओं का उत्पादन कर सकता है।

आत्म-पहचान की पहचान दर उसी प्रवृत्ति का अनुसरण करती है, जो दर्शाती है कि क्लाउड कम कलाकृतियों के साथ पाठ बनाता है, जिससे मानव लेखन से अंतर करना मुश्किल हो जाता है।”

लेकिन निस्संदेह, अजीब बात यह है कि अन्य दो मॉडलों के विपरीत, जिनकी सफलता दर अधिक थी, क्लाउड भी अपनी मूल सामग्री को स्वयं पहचानने में विफल रहा।

शोधकर्ताओं ने नोट किया कि आत्म-पहचान आगे के शोध के लिए एक दिलचस्प क्षेत्र बना हुआ है और सुझाव दिया है कि आगे के अध्ययन एआई-जनित पाठ की अधिक विविधता के साथ बड़े सरणियों पर ध्यान केंद्रित कर सकते हैं, अधिक एआई मॉडल का परीक्षण कर सकते हैं, अधिक एआई डिटेक्टरों के साथ तुलना कर सकते हैं और अंत में उन्होंने अध्ययन करने का सुझाव दिया कि कैसे तीव्र इंजीनियरिंग मान्यता स्तर को प्रभावित कर सकती है।

मूल शोध पत्र और सार यहां पढ़ें:

बड़े ट्रांसफार्मर-आधारित भाषा मॉडल के लिए कृत्रिम बुद्धिमत्ता सामग्री स्व-पहचान

शटरस्टॉक/एसओबीईआर 9426 द्वारा प्रदर्शित छवि

ibnkamal
ibnkamalhttps://iseotools.me
Wasim Ibn Kamal | founder of iseotools.me, newslike.site and healtinfo.space | A developer and UI/UX designer. Cluster-notes.blogspot.com and tsbdu.blogspot.com are two of my blogs.

कोई जवाब दें

कृपया अपनी टिप्पणी दर्ज करें!
कृपया अपना नाम यहाँ दर्ज करें

Popular Articles