सार
गूगल ने गुरुवार को अपना नया इमेज जेनरेशन आर्टिफिशियल इंटेलिजेंस (AI) मॉडल, Imagen 3, लॉन्च कर दिया। हालाँकि, गूगल ने आधिकारिक तौर पर इसकी कोई घोषणा नहीं की।
लेकिन, इस इमेज जेनरेशन मॉडल के काम करने के तरीके के बारे में एक लेख एक ऑनलाइन पत्रिका में प्रकाशित हुआ है। शब्दों को छवियों में बदलने वाला यह टेक्स्ट-टू-इमेज AI मॉडल वर्तमान में केवल अमेरिका में उपयोगकर्ताओं के लिए उपलब्ध है।
अन्य क्षेत्रों में इसके रिलीज होने के बारे में कोई जानकारी नहीं है। उपयोगकर्ता अपने गूगल अकाउंट से साइन इन करके इमेज बना सकते हैं। इस नए AI मॉडल में टेक्सचर जेनरेशन, शब्दों को समझने की क्षमता आदि में सुधार होने की बात कही गई है।
इस मॉडल को रिलीज होते ही इस्तेमाल करके देखने वाले कुछ लोगों ने अपने अनुभव साझा किए हैं। एक यूजर ने बताया कि "एक कप कॉफी पकड़े हुए लड़का" जैसा सिंपल कमांड देने पर भी यह AI मॉडल गलत रिजल्ट देता है।
एक रेडिट यूजर का कहना है कि वह निकॉन डीएसएलआर क्वालिटी, गोप्रो स्टाइल, वाइड एंगल लेंस आदि जैसे अलग-अलग फॉर्मेट में इमेज बनाने में कामयाब रहा। हालाँकि, उनका कहना है कि यह AI मॉडल कई लोगों वाली इमेज, क्लोज़-अप इमेज और कम रोशनी वाली इमेज बनाने में औसत ही है।
गूगल के एक अन्य आर्टिफिशियल इंटेलिजेंस प्रोडक्ट, जेमिनी चैटबॉट के जरिए भी इमेज बनाई जा सकती हैं। यह भी जेमिनी की क्षमताओं का ही हिस्सा है। लेकिन, Imagen 3 मॉडल के डेटासेट में ज्यादातर इमेज ही हैं, इसलिए इसे इमेज बनाने के लिए बेहतर ट्रेनिंग दी गई है।