OpenAI ने GPT-4 की कोड जनरेशन में गलतियों को पकड़ने के लिए नया आर्टिफिशियल इंटेलिजेंस (AI) मॉडल विकसित किया है
OpenAI ने गुरुवार को एक अध्ययन प्रकाशित किया जिसमें उन्होंने एक नए आर्टिफिशियल इंटेलिजेंस (AI) मॉडल के बारे में बताया जो GPT-4 की कोड जनरेशन में होने वाली गलतियों को पकड़ सकता है। AI फर्म ने बताया कि नए चैटबॉट को मानव प्रतिक्रिया से सुदृढ़न सीखने (RLHF) ढांचे का उपयोग करके प्रशिक्षित किया गया था और यह GPT-4 मॉडलों में से एक द्वारा संचालित था। इस विकासाधीन चैटबॉट को उपयोगकर्ताओं को बड़े भाषा मॉडलों से प्राप्त होने वाले AI-जनित कोड की गुणवत्ता में सुधार के लिए डिजाइन किया गया था। वर्तमान में, मॉडल उपयोगकर्ताओं या परीक्षकों के लिए उपलब्ध नहीं है। OpenAI ने मॉडल की कई सीमाओं को भी उजागर किया।
OpenAI ने CriticGPT के बारे में जानकारी साझा की
AI फर्म ने एक ब्लॉग पोस्ट में नए CriticGPT मॉडल के विवरण साझा किए, जिसमें कहा गया कि यह GPT-4 पर आधारित था और ChatGPT द्वारा उत्पन्न कोड में त्रुटियों की पहचान करने के लिए डिज़ाइन किया गया था। "हमने पाया कि जब लोग ChatGPT के कोड की समीक्षा के लिए CriticGPT की सहायता लेते हैं, तो वे बिना सहायता के मुकाबले 60 प्रतिशत अधिक सफल होते हैं,” कंपनी का दावा है। मॉडल को RLHF ढांचे का उपयोग करके विकसित किया गया और निष्कर्ष एक पेपर में प्रकाशित किए गए हैं।
RLHF एक मशीन लर्निंग तकनीक है जो मशीन आउटपुट को मनुष्यों के साथ मिलाकर AI सिस्टम को प्रशिक्षित करती है। इस प्रणाली में, मानव मूल्यांकनकर्ता AI के प्रदर्शन पर प्रतिक्रिया प्रदान करते हैं। इसका उपयोग मॉडल के व्यवहार को समायोजित और सुधारने के लिए किया जाता है। जो मानव AI को प्रतिक्रिया देते हैं उन्हें AI प्रशिक्षक कहा जाता है।
OpenAI का एडवांस्ड वॉयस मोड फीचर ChatGPT के लिए विलंबित हुआ
CriticGPT को बड़ी मात्रा में कोड डेटा पर प्रशिक्षित किया गया था जिसमें गलतियाँ थीं। AI मॉडल को इन गलतियों को खोजने और कोड की आलोचना करने का काम सौंपा गया था। इसके लिए, AI प्रशिक्षकों को कोड में मौजूद प्राकृतिक गलतियों के ऊपर गलतियाँ लिखने और फिर यह दिखाने के लिए प्रतिक्रिया लिखने के लिए कहा गया कि जैसे उन्होंने उन गलतियों को पकड़ा है।
एक बार जब CriticGPT ने अपनी कई प्रकार की आलोचनाएँ साझा कीं, तो प्रशिक्षकों से पूछा गया कि क्या उन्होंने जो गलतियाँ डाली थीं, वे AI द्वारा पकड़ी गईं, साथ ही स्वाभाविक रूप से होने वाली गलतियाँ भी। अपने शोध में, OpenAI ने पाया कि CriticGPT त्रुटियों को पकड़ने में ChatGPT से 63 प्रतिशत बेहतर प्रदर्शन करता है।
हालांकि, मॉडल में अभी भी कुछ सीमाएँ हैं। CriticGPT को OpenAI द्वारा उत्पन्न छोटी कोड स्ट्रिंग्स पर प्रशिक्षित किया गया था। मॉडल को अभी तक लंबी और जटिल कार्यों के सेट पर प्रशिक्षित नहीं किया गया है। AI फर्म ने यह भी पाया कि नया चैटबॉट अब भी भ्रम पैदा करता है (गलत तथ्यात्मक प्रतिक्रियाएं उत्पन्न करता है)। इसके अलावा, मॉडल को उन परिदृश्यों में परीक्षण नहीं किया गया है जहां कोड में कई गलतियाँ बिखरी हुई हों।
यह मॉडल सार्वजनिक रूप से उपलब्ध कराए जाने की संभावना नहीं है क्योंकि इसे OpenAI को बेहतर प्रशिक्षण तकनीकों को समझने में मदद करने के लिए डिज़ाइन किया गया है जो उच्च गुणवत्ता वाले आउटपुट उत्पन्न कर सकते हैं। अगर CriticGPT सार्वजनिक किया जाता है, तो माना जाता है कि इसे ChatGPT में एकीकृत किया जाएगा।
0 टिप्पणियाँ