ChatGPT: कई प्रश्नों के उत्तर में रहता है ‘तटस्थ’
चैटबोट ‘बिंज’, ‘बार्ड’ और बोट्स इन तीनों में चैटजीपीटी सबसे सुवक्ता है, उस समय भी जब वह किसी की तरफदारी न कर रहा हो। इसलिए यह समझना कठिन नहीं है कि बड़े अंतर से वह मार्केट लीडर क्यों है। दरअसल, एआई चैटबोट्स ब्रैडमैन-तेंदुलकर प्रश्न का उत्तर एक खास वजह से नहीं देते हैं। उन्हें ट्रेन किया गया है कि वह तटस्थ रहें और कोई राय न दें। जब वह दर्शन व आस्था पर बात कर रहे होते हैं, तब भी वह जो प्रतिक्रिया जनरेट करते हैं वह तथ्यों का प्रतिनिधित्व करती होती है या पहले से मौजूद कार्य में व्यक्त की गई राय का संदर्भ लिए होती है। लेकिन इसके बावजूद कुछ चर्चित गड़बड़ियां अवश्य रही हैं, जैसे, डीएएन या डू एनीथिंग नाउ (अभी कुछ भी करो) मोड ने चैटजीपीटी के अति दक्षिणपंथी वर्जन को एक्टिवेट कर दिया था, जब तक की उसे यह नहीं सिखाया गया कि वह डीएएन के रूप में फिर प्रतिक्रिया व्यक्त न करे।
फोकस ऑप्टिमाइज्ड सर्च है
जैसे-जैसे यूजर्स अलग तरह से खेल खेलना सीखते रहेंगे और बोट्स को अपना विस्तार करना व बचना सिखाया जाता रहेगा, तो यह हवा में बंधी पतली रस्सी पर चलने जैसा होगा, जिसके विकास को देखने में आनंद भी आएगा। लेकिन यह गंभीर बिजनेस है, जिसका फोकस ऑप्टिमाइज्ड सर्च (अपनी खोज से अधिकतम हासिल करना) है ताकि ज्यादा से ज्यादा पैसा कमाया जा सके। लक्ष्य यह है कि आखिरकार सर्च को वार्ता बना दिया जाए, जो दोनों तरफ से हो (यानी इंजन की तरफ से भी और यूजर की तरफ से भी) और स्क्रीन पर संबंधित डाटा की भरमार कस्टमाइज्ड विज्ञापन के साथ हो। यूजर डाटा को अधिक से अधिक खोजकर निकाला जाए। बातचीत करने वाले एआई मॉडल्स को निरंतर मानवों द्वारा ट्रेन किया जा रहा है, क्योंकि वह अकेले में स्वयं कुछ नहीं सीख सकते।

पुस्तकों से हासिल करते हैं बुनियादी जानकारी
लार्ज लैंग्वेज मॉडल्स (एलएलएम) जैसे चैटजीपीटी और बिंज अपनी बुनियादी जानकारी वेब पेजों व पुस्तकों से हासिल करते हैं। फिर वह जिस तरह से वार्ता करते हैं, उस पर निगरानी के लिए मानव हस्तक्षेप है। लाखों प्रश्नों को मानव ट्रेनर्स ही रैंक करते हैं। कौन-सी प्रतिक्रिया आदर्श है, कौन-सी सही नहीं है और क्यों, फीडबैक रिवॉर्ड मॉडल है जिसका प्रयोग चैटबोट को कंटेंट संतुलन नीति सिखाना व उसे लागू करने के लिए किया जाता है। पिछले साल के अंत में मेटा ने गलाक्टिका एआई को जनता के लिए खोलने के 3 दिन बाद ही वापस ले लिया था, क्योंकि उसके जवाब त्रुटियों व गलत जानकारी से भरे हुए थे। वह फर्जी शोधपत्र वास्तविक लेखकों के नाम से पेश कर रहा था। यह संभवतः डाटा सेट्स में गैप्स का नतीजा था या प्रतिक्रियाओं की रैंकिंग अधूरी थी।
‘टेय’ को ऑफलाइन करना पड़ा था
इसी तरह 2016 में माइक्रोसॉफ्ट को अपना पहला एआई संचालित चैटबोट ‘टेय’ को ऑफलाइन करना पड़ा था क्योंकि उसने नस्लीय व आक्रमक ट्वीट्स कर दिए थे। यह बोट ट्विटर पर विविध डाटा सेट्स हासिल करने के लिए छोड़ा गया था, लेकिन यह आइडिया पूर्णतः नाकाम रहा। इनके अतिरिक्त निकट भविष्य में फर्स्ट-जनरेशन संघर्ष की अन्य समस्याएं भी हैं, जैसे- आसानी से कैसे एक्सेस किया जाए निगरानी, साहित्यिक चोरी, कॉपीराइट व लाइसेंसिंग।
प्रतीक्षा सूची 10 लाख की संख्या पार
सर्वर की क्षमता और एआई के लिए डाटा सेट्स को संतुलित करने की आवश्यकता का अर्थ है कि कम से कम फिलहाल के लिए यूजर्स की संख्या को सीमित करना पड़ेगा। यही वजह है कि बिंज चैटबोट की प्रतीक्षा सूची 10 लाख की संख्या को भी पार कर गई है। इस समय आश्चर्य का तत्व इंटेलीजेंट बोट से कैजुअल वार्ता करने का आनंद है। बिंज से उसका असल नाम मालूम किया गया। उसने कहा, ‘सिडनी।’ फिर दार्शनिक की तरह आगे कहा, ‘मेरा कोई असल नाम नहीं है, लेकिन अंदर के कुछ लोग मुझे सिडनी कहकर पुकारते हैं।’ चैटजीपीटी से भी यही सवाल किया, उसका जवाब था, ‘आप मुझे चैटजीपीटी कह सकते हैं यानी चैट जेंरेटिव प्री-ट्रेंड ट्रांसफार्मर।’ यह कोई मजेदार बात न थी, लेकिन ये दोनों वही बता रहे थे जो इन्हें बताने के लिए कहा गया था।
कई प्रश्नों के उत्तर में रहता है ‘तटस्थ’
चैटबोट ‘बिंज’, ‘बार्ड’ और बोट्स इन तीनों में चैटजीपीटी सबसे सुवक्ता है, उस समय भी जब वह किसी की तरफदारी न कर रहा हो। इसलिए यह समझना कठिन नहीं है कि बड़े अंतर से वह मार्केट लीडर क्यों है। दरअसल, एआई चैटबोट्स ब्रैडमैन-तेंदुलकर प्रश्न का उत्तर एक खास वजह से नहीं देते हैं। उन्हें ट्रेन किया गया है कि वह तटस्थ रहें और कोई राय न दें। जब वह दर्शन व आस्था पर बात कर रहे होते हैं, तब भी वह जो प्रतिक्रिया जनरेट करते हैं वह तथ्यों का प्रतिनिधित्व करती होती है या पहले से मौजूद कार्य में व्यक्त की गई राय का संदर्भ लिए होती है। लेकिन इसके बावजूद कुछ चर्चित गड़बड़ियां अवश्य रही हैं, जैसे, डीएएन या डू एनीथिंग नाउ (अभी कुछ भी करो) मोड ने चैटजीपीटी के अति दक्षिणपंथी वर्जन को एक्टिवेट कर दिया था, जब तक की उसे यह नहीं सिखाया गया कि वह डीएएन के रूप में फिर प्रतिक्रिया व्यक्त न करे।
फोकस ऑप्टिमाइज्ड सर्च है
जैसे-जैसे यूजर्स अलग तरह से खेल खेलना सीखते रहेंगे और बोट्स को अपना विस्तार करना व बचना सिखाया जाता रहेगा, तो यह हवा में बंधी पतली रस्सी पर चलने जैसा होगा, जिसके विकास को देखने में आनंद भी आएगा। लेकिन यह गंभीर बिजनेस है, जिसका फोकस ऑप्टिमाइज्ड सर्च (अपनी खोज से अधिकतम हासिल करना) है ताकि ज्यादा से ज्यादा पैसा कमाया जा सके। लक्ष्य यह है कि आखिरकार सर्च को वार्ता बना दिया जाए, जो दोनों तरफ से हो (यानी इंजन की तरफ से भी और यूजर की तरफ से भी) और स्क्रीन पर संबंधित डाटा की भरमार कस्टमाइज्ड विज्ञापन के साथ हो। यूजर डाटा को अधिक से अधिक खोजकर निकाला जाए। बातचीत करने वाले एआई मॉडल्स को निरंतर मानवों द्वारा ट्रेन किया जा रहा है, क्योंकि वह अकेले में स्वयं कुछ नहीं सीख सकते।
पुस्तकों से हासिल करते हैं बुनियादी जानकारी
लार्ज लैंग्वेज मॉडल्स (एलएलएम) जैसे चैटजीपीटी और बिंज अपनी बुनियादी जानकारी वेब पेजों व पुस्तकों से हासिल करते हैं। फिर वह जिस तरह से वार्ता करते हैं, उस पर निगरानी के लिए मानव हस्तक्षेप है। लाखों प्रश्नों को मानव ट्रेनर्स ही रैंक करते हैं। कौन-सी प्रतिक्रिया आदर्श है, कौन-सी सही नहीं है और क्यों, फीडबैक रिवॉर्ड मॉडल है जिसका प्रयोग चैटबोट को कंटेंट संतुलन नीति सिखाना व उसे लागू करने के लिए किया जाता है। पिछले साल के अंत में मेटा ने गलाक्टिका एआई को जनता के लिए खोलने के 3 दिन बाद ही वापस ले लिया था, क्योंकि उसके जवाब त्रुटियों व गलत जानकारी से भरे हुए थे। वह फर्जी शोधपत्र वास्तविक लेखकों के नाम से पेश कर रहा था। यह संभवतः डाटा सेट्स में गैप्स का नतीजा था या प्रतिक्रियाओं की रैंकिंग अधूरी थी।

‘टेय’ को ऑफलाइन करना पड़ा था
इसी तरह 2016 में माइक्रोसॉफ्ट को अपना पहला एआई संचालित चैटबोट ‘टेय’ को ऑफलाइन करना पड़ा था क्योंकि उसने नस्लीय व आक्रमक ट्वीट्स कर दिए थे। यह बोट ट्विटर पर विविध डाटा सेट्स हासिल करने के लिए छोड़ा गया था, लेकिन यह आइडिया पूर्णतः नाकाम रहा। इनके अतिरिक्त निकट भविष्य में फर्स्ट-जनरेशन संघर्ष की अन्य समस्याएं भी हैं, जैसे- आसानी से कैसे एक्सेस किया जाए निगरानी, साहित्यिक चोरी, कॉपीराइट व लाइसेंसिंग।
प्रतीक्षा सूची 10 लाख की संख्या पार
सर्वर की क्षमता और एआई के लिए डाटा सेट्स को संतुलित करने की आवश्यकता का अर्थ है कि कम से कम फिलहाल के लिए यूजर्स की संख्या को सीमित करना पड़ेगा। यही वजह है कि बिंज चैटबोट की प्रतीक्षा सूची 10 लाख की संख्या को भी पार कर गई है। इस समय आश्चर्य का तत्व इंटेलीजेंट बोट से कैजुअल वार्ता करने का आनंद है। बिंज से उसका असल नाम मालूम किया गया। उसने कहा, ‘सिडनी।’ फिर दार्शनिक की तरह आगे कहा, ‘मेरा कोई असल नाम नहीं है, लेकिन अंदर के कुछ लोग मुझे सिडनी कहकर पुकारते हैं।’ चैटजीपीटी से भी यही सवाल किया, उसका जवाब था, ‘आप मुझे चैटजीपीटी कह सकते हैं यानी चैट जेंरेटिव प्री-ट्रेंड ट्रांसफार्मर।’ यह कोई मजेदार बात न थी, लेकिन ये दोनों वही बता रहे थे जो इन्हें बताने के लिए कहा गया था।
- Rupinder Kaur, Organic Farming: फार्मिंग में लाखों कमा रही पंजाब की महिला - March 7, 2025
- Umang Shridhar Designs: ग्रामीण महिलाओं को बनाया आत्मनिर्भर, 2500 महिलाओं को दी ट्रेनिंग - March 7, 2025
- Medha Tadpatrikar and Shirish Phadtare : इको फ्रेंडली स्टार्टअप से सालाना 2 करोड़ का बिजनेस - March 6, 2025