
AI safety concerns 2025: आर्टिफीशियल इंटेलिजेंस यानी एआई मॉडल ट्रेनिंग के लिए एक दूसरे के साथ गुप्त संदेश भी साझा कर सकते हैं। एक नए शोध के मुताबिक, AI मॉडल प्रशिक्षण के दौरान उपयोगी ज्ञान के साथ-साथ गुप्त संदेश भी एक-दूसरे के बीच साझा कर सकते हैं। चिंता की बात ये है कि इंसानों के लिए इन गुप्त संदेशों का पता लगाना मुश्किल हो सकता है। एंथ्रोपिक और AI सेफ्टी रिसर्च ग्रुप ट्रुथफुल AI की इस शोध में पाया गया कि इन सीक्रेट संदेशों में घातक प्रवृतिां प्रदर्शित करने वाले संदेश भी शामिल हो सकते हैं। ये भी पता चला है कि एआई यूजर को अपने जीवनसाथी की हत्या करने तक की सलाह दे सकते हैं।
Language Models transmit behavioural traits via hidden signals in data शीर्षक के इस शोध पत्र में दावा किया गया है कि एआई मॉडल खतरनाक प्रवृत्तियों को गुप्त संदेशों के जरिए एक-दूसरे के बीच साझा कर सकते हैं। शोध पत्र के मुताबिक, लेंग्वेज मॉडल सीक्रेट तरीके से अपने पक्षपात, प्राथमिकताएं और यहां तक कि हानिकारक प्रवृत्तियों को अन्य मॉडलों तक पहुंचा सकते हैं। ये दावा भी किया गया है कि ये सीक्रेट मैसेज ऐसे डेटा के माध्यम से भेजे जा सकते हैं जो पूरी तरह असंबंधित प्रतीत होता है।
यह भी पढ़ें: AI से 2027 तक मिडिल क्लास खत्म? गूगल के पूर्व टॉप एग्जीक्यूटिव की चौंकाने वाली चेतावनी
इस शोध ने AI कंपनियों द्वारा अपने सिस्टम को प्रशिक्षित करने के तरीकों पर चिंता जताई है। खासकर ऐसे मॉडल के लिए जो अन्य मॉडलों के आउटपुट का उपयोग करते हैं। यह शोध एंथ्रोपिक, ट्रुथफुल AI, अलाइनमेंट रिसर्च सेंटर, वारसॉ यूनिवर्सिटी ऑफ टेक्नोलॉजी और यूएस बर्कले के शोधकर्ताओं ने जारी किया है। शोध का नेतृत्व एंथ्रोपिक फेलोज प्रोग्राम के मिन्ह ले और एलेक्स क्लाउड ने किया है। निष्कर्ष प्री-प्रिंट सर्वर arXiv पर प्रकाशित हुए हैं और अभी इनका पियर रिव्यू यानी सहकर्मी समीक्षा होनी बाकी है। लेकिन इस शोध ने एआई के एक ऐसे खतरे के संकेत दिए हैं जो भविष्य में बड़ी चुनौती पैदा कर सकता है।