एआई को लेकर शोध में दावा- सीक्रेट संदेश भेज सकते हैं मॉडल, दे सकते हैं मर्डर तक की सलाह

Published : Aug 10, 2025, 02:58 PM ISTUpdated : Aug 10, 2025, 03:00 PM IST
AI safety concerns 2025

सार

AI safety concerns 2025: नए रिसर्च में पता चला है कि एआई मॉडल ट्रेनिंग के दौरान एक-दूसरे के साथ छुपे हुए खतरनाक संदेश भी भेज सकते हैं। ये संदेश इंसानों को समझ में नहीं आते और इनमें खतरनाक सलाह भी हो सकती है।

AI safety concerns 2025: आर्टिफीशियल इंटेलिजेंस यानी एआई मॉडल ट्रेनिंग के लिए एक दूसरे के साथ गुप्त संदेश भी साझा कर सकते हैं। एक नए शोध के मुताबिक, AI मॉडल प्रशिक्षण के दौरान उपयोगी ज्ञान के साथ-साथ गुप्त संदेश भी एक-दूसरे के बीच साझा कर सकते हैं। चिंता की बात ये है कि इंसानों के लिए इन गुप्त संदेशों का पता लगाना मुश्किल हो सकता है। एंथ्रोपिक और AI सेफ्टी रिसर्च ग्रुप ट्रुथफुल AI की इस शोध में पाया गया कि इन सीक्रेट संदेशों में घातक प्रवृतिां प्रदर्शित करने वाले संदेश भी शामिल हो सकते हैं। ये भी पता चला है कि एआई यूजर को अपने जीवनसाथी की हत्या करने तक की सलाह दे सकते हैं।

शोध पत्र में किया गया ये बड़ा दावा

Language Models transmit behavioural traits via hidden signals in data शीर्षक के इस शोध पत्र में दावा किया गया है कि एआई मॉडल खतरनाक प्रवृत्तियों को गुप्त संदेशों के जरिए एक-दूसरे के बीच साझा कर सकते हैं। शोध पत्र के मुताबिक, लेंग्वेज मॉडल सीक्रेट तरीके से अपने पक्षपात, प्राथमिकताएं और यहां तक कि हानिकारक प्रवृत्तियों को अन्य मॉडलों तक पहुंचा सकते हैं। ये दावा भी किया गया है कि ये सीक्रेट मैसेज ऐसे डेटा के माध्यम से भेजे जा सकते हैं जो पूरी तरह असंबंधित प्रतीत होता है।

यह भी पढ़ें: AI से 2027 तक मिडिल क्लास खत्म? गूगल के पूर्व टॉप एग्जीक्यूटिव की चौंकाने वाली चेतावनी

भविष्य में बड़ी चुनौती पैदा कर सकता है एआई

इस शोध ने AI कंपनियों द्वारा अपने सिस्टम को प्रशिक्षित करने के तरीकों पर चिंता जताई है। खासकर ऐसे मॉडल के लिए जो अन्य मॉडलों के आउटपुट का उपयोग करते हैं। यह शोध एंथ्रोपिक, ट्रुथफुल AI, अलाइनमेंट रिसर्च सेंटर, वारसॉ यूनिवर्सिटी ऑफ टेक्नोलॉजी और यूएस बर्कले के शोधकर्ताओं ने जारी किया है। शोध का नेतृत्व एंथ्रोपिक फेलोज प्रोग्राम के मिन्ह ले और एलेक्स क्लाउड ने किया है। निष्कर्ष प्री-प्रिंट सर्वर arXiv पर प्रकाशित हुए हैं और अभी इनका पियर रिव्यू यानी सहकर्मी समीक्षा होनी बाकी है। लेकिन इस शोध ने एआई के एक ऐसे खतरे के संकेत दिए हैं जो भविष्य में बड़ी चुनौती पैदा कर सकता है।

PREV
Read more Articles on

Recommended Stories

5 दिसंबर की 8 तस्वीरों में देखें देश भर की राजनीति, मोदी-पुतिन मुलाकात से लेकर रेल रोको हंगामे तक
जंगली भैंसा से एयरपोर्ट ड्रामा तक- एक ही गैलरी में देखें 5 दिसंबर की सबसे वायरल तस्वीरें