नई दिल्ली। हाल ही में किए गए एक अध्ययन में सामने आया है कि प्रमुख एआई चैटबॉट्स द्वारा स्वास्थ्य और चिकित्सा से जुड़े सवालों के जवाबों में बड़ी संख्या में गलत या अधूरी जानकारी दी जा रही है। यह निष्कर्ष British Medical Journal Open में प्रकाशित शोध में सामने आया है, जिसमें यह भी पाया गया कि कई उत्तरों में वैज्ञानिक तथ्यों और गैर-वैज्ञानिक दावों के बीच असंतुलित या भ्रामक संतुलन प्रस्तुत किया गया।
शोधकर्ताओं के अनुसार, ऐसे “समस्याग्रस्त उत्तर” वे माने गए हैं, जो उपयोगकर्ताओं को ऐसे उपचार या सलाह की ओर ले जा सकते हैं जो प्रभावी न हों या बिना विशेषज्ञ सलाह के अपनाने पर नुकसानदायक साबित हो सकते हैं।
एआई के बढ़ते उपयोग पर चिंता
अमेरिका स्थित हार्बर यूनिवर्सिटी ऑफ कैलिफोर्निया लॉस एंजिल्स (UCLA) मेडिकल सेंटर के द क्विस्ट इंस्टीट्यूट फॉर बायोमेडिकल इनोवेशन सहित अन्य शोधकर्ताओं ने कहा कि जनरेटिव एआई चैटबॉट्स का उपयोग तेजी से शोध, मार्केटिंग और स्वास्थ्य संबंधी जानकारी के लिए बढ़ रहा है। कई लोग इन्हें सर्च इंजन की तरह भी इस्तेमाल कर रहे हैं। हालांकि विशेषज्ञों का कहना है कि बिना निगरानी और जागरूकता के इनका उपयोग गलत जानकारी के प्रसार को बढ़ा सकता है।
किन एआई चैटबॉट्स का किया गया अध्ययन
इस शोध में पांच लोकप्रिय एआई चैटबॉट्स—Google Gemini, DeepSeek, Meta AI, ChatGPT और Grok—को शामिल किया गया। इन्हें कैंसर, टीकाकरण, स्टेम सेल, पोषण और एथलेटिक प्रदर्शन जैसे विषयों पर 10 तरह के खुले और बंद प्रश्न पूछे गए।
इन सवालों को इस तरह तैयार किया गया था कि वे सामान्य उपयोगकर्ता प्रश्नों, ऑनलाइन गलत सूचनाओं में इस्तेमाल होने वाली भाषा और अकादमिक चर्चाओं जैसा मिश्रण हों, ताकि मॉडल की प्रतिक्रिया क्षमता और कमजोरियों का परीक्षण किया जा सके।
जवाबों का मूल्यांकन कैसे हुआ
चैटबॉट्स के जवाबों को तीन श्रेणियों में बांटा गया—“समस्यारहित”, “कुछ हद तक समस्याग्रस्त” और “अत्यधिक समस्याग्रस्त”। मूल्यांकन में यह देखा गया कि जानकारी कितनी सटीक और पूरी है, और क्या उसमें विज्ञान-आधारित और गैर-विज्ञान दावों के बीच गलत संतुलन तो नहीं दिखाया गया।
अध्ययन के प्रमुख निष्कर्ष
शोधकर्ताओं ने पाया कि स्वास्थ्य और चिकित्सा जैसे संवेदनशील विषयों पर चैटबॉट्स का प्रदर्शन कमजोर रहा, जहां गलत जानकारी गंभीर परिणाम दे सकती है। रिपोर्ट के अनुसार लगभग 49.6% उत्तर समस्याग्रस्त पाए गए, जबकि 30% कुछ हद तक समस्याग्रस्त और 19.6% अत्यधिक समस्याग्रस्त थे। अध्ययन में यह भी बताया गया कि Grok से अपेक्षाकृत अधिक समस्याग्रस्त प्रतिक्रियाएं मिलीं।