वैज्ञानिक साहित्य और रिसर्च पेपर्स की दुनिया में एआई द्वारा तैयार किए गए फर्जी संदर्भों या साइटेशन्स की बाढ़ आ गई है। नए अध्ययन के अनुसार, साल 2025 में लगभग 1.5 लाख मनगढ़ंत और नकली रेफरेंस वैज्ञानिक रिकॉर्ड का हिस्सा बन गए। इनमें से अधिकांश फर्जी साइटेशन्स पहले प्री-प्रिंट के रूप में सामने आए और बाद में मुख्य पीयर-रिव्यूड जर्नल्स में भी शामिल हो गए।
यह चौंकाने वाला खुलासा कॉर्नेल यूनिवर्सिटी, यूसीएलए और यूसी बर्कले के शोधकर्ताओं द्वारा किए गए बड़े पैमाने के अध्ययन में हुआ है। इस स्टडी का शीर्षक एलएलएम हैलुसिनेशन्स इन द वाइल्ड है।
इस अध्ययन के दौरान शोधकर्ताओं ने साल 2020 से 2025 के बीच arXiv, bioRxiv, SSRN और PubMed Central जैसे प्रमुख प्लेटफॉर्म्स पर प्रकाशित 25 लाख रिसर्च पेपर्स के करीब 11.1 करोड़ साइटेशन्स का बारीकी से विश्लेषण किया।
ऐसे पकड़ी गई एआई की मनगढ़ंत बातें
इस स्टडी के तहत शोधकर्ताओं ने ऐसे साइटेशन्स को ट्रैक किया जिनके शीर्षकों का सिमेंटिक स्कॉलर, ओपनएलेक्स और गूगल स्कॉलर जैसे बड़े अकादमिक डेटाबेस से मिलान नहीं किया जा सका। इसके बाद, साल 2022 के बाद के ट्रेंड्स की तुलना उससे पहले के एरर बेसलाइन से की गई।
इस तुलना से यह साफ हो गया कि साइटेशन्स में आई इस अचानक तेजी के पीछे मुख्य रूप से एआई टूल्स द्वारा पैदा किए गए मनगढ़ंत या फर्जी आंकड़े ही जिम्मेदार हैं।
साल 2024 के मध्य से आई सबसे तेज उछाल
अध्ययन के मुताबिक, फर्जी साइटेशन्स में सबसे तेज बढ़ोतरी साल 2024 के मध्य से शुरू हुई, जो चैटजीपीटी के आम लोगों के लिए लॉन्च होने के लगभग 18 महीने बाद का समय था। ऐसा इसलिए हुआ क्योंकि इस अवधि के दौरान एआई टूल्स केवल लिखने वाले असिस्टेंट से आगे बढ़कर सीधे साइटेशन जनरेट करने वाले इंजन के रूप में विकसित हो चुके थे।
चिंता की बात यह है कि यह गड़बड़ी किसी स्पष्ट रूप से फर्जी या धोखाधड़ी वाले पेपर्स तक ही सीमित नहीं है। अध्ययन में पाया गया कि ये नकली रेफरेंस आमतौर पर पूरी तरह से वैध और असली दिखने वाले शोध पत्रों के बीच बहुत चालाकी से और कम संख्या में बिखरे होते हैं।
इससे यह संकेत मिलता है कि कई शोधकर्ता एआई द्वारा तैयार किए गए इन साइटेशन्स की बिना जांच किए ही उन्हें सीधे अपने पेपर्स में कॉपी कर रहे हैं। वर्तमान में जर्नल्स के पास मौजूद सुरक्षा उपाय इस धोखाधड़ी को रोकने में पूरी तरह विफल साबित हो रहे हैं।
बायोमेडिकल रिसर्च में भी मंडराया खतरा
बायोमेडिकल रिसर्च पेपर्स को लेकर किए गए एक दूसरे अध्ययन में भी मनगढ़ंत साइटेशन्स में भारी उछाल दर्ज किया गया है। आंकड़ों के अनुसार, साल 2023 में जहां बायोमेडिकल के लगभग हर 2,828 पेपर्स में से केवल 1 पेपर में फर्जी साइटेशन होता था, वहीं साल 2026 की शुरुआत तक यह अनुपात खतरनाक रूप से बढ़कर हर 277 पेपर्स में से 1 पेपर तक पहुंच चुका है।
शोधकर्ताओं ने चेतावनी दी है कि यह समस्या अब सेल्फ-रिनफोर्सिंग बनती जा रही है, जहां एआई टूल्स भविष्य में नए पेपर्स लिखने के लिए इंटरनेट पर मौजूद इन्हीं पुराने एआई-जनरेटेड फर्जी संदर्भों को सच मानकर दोबारा इस्तेमाल करने लगेंगे।
