पारदर्शिता या तोड़फोड़? Anthropic ने Claude Fable प्रतिबंधों पर अपना रुख बदला
Anthropic ने माना: नए मॉडल के सुरक्षा मानकों (guardrails) में 'हमने गलत समझौता किया'
डेवलपर समुदाय से भारी विरोध का सामना करने के बाद, Anthropic ने स्वीकार किया है कि नए Claude Fable मॉडल पर उसके सख्त सुरक्षा मानक एक गलती थे।
टेक जगत में इस सप्ताह तब हलचल मच गई जब प्रमुख AI लैब Anthropic को सार्वजनिक रूप से अपने कदम वापस लेने पड़े। जब कंपनी ने Claude Fable 5—जो उसके शक्तिशाली Mythos मॉडल का 'सुरक्षित' सार्वजनिक संस्करण है—को पेश किया, तो उसने शुरुआत में चुप्पी साधे रखने की रणनीति अपनाई। उपयोगकर्ताओं ने पाया कि साइबर सुरक्षा, जीव विज्ञान और रसायन विज्ञान से संबंधित प्रॉम्प्ट्स को चुपचाप पुराने और कम सक्षम मॉडलों पर भेजा जा रहा था। इससे भी ज्यादा विवाद तब हुआ जब पता चला कि कंपनी उन लोगों के लिए प्रदर्शन को चुपचाप कम कर रही थी जो AI विकास के लिए मॉडल का उपयोग करने की कोशिश कर रहे थे, जिससे कई लोगों को संदेह हुआ कि यह प्रतिद्वंद्वी प्रणालियों को रोकने का एक जानबूझकर किया गया प्रयास है।
विरोध बहुत तेज था। डेवलपर्स और स्वतंत्र शोधकर्ताओं ने शिकायत की कि मॉडल व्यावहारिक रूप से बेकार हो गया है, कुछ ने तो यह भी कहा कि सिस्टम 'हेलो' लिखने पर भी अनुरोधों को ब्लॉक कर रहा था। जैसे-जैसे इन प्रतिबंधों की खबरें Business Insider और The Wall Street Journal जैसे आउटलेट्स में आईं, चर्चा सुरक्षा से हटकर कॉर्पोरेट गेटकीपिंग (corporate gatekeeping) की ओर मुड़ गई। इसके पीछे का तनाव—microsoft anthropic claude fable restriction विमर्श—इस बढ़ती चिंता को उजागर करता है कि लैब्स को अपने द्वारा जारी किए गए टूल्स पर कितना नियंत्रण रखना चाहिए।
रणनीति में बदलाव
बुधवार तक, Anthropic ने एक बयान जारी कर स्वीकार किया कि उसने "गलत समझौता" किया था। लैब ने पुष्टि की है कि अब वह अपनी सीमाओं के बारे में पारदर्शी रहेगी। आगे बढ़ते हुए, यदि सिस्टम द्वारा किसी प्रॉम्प्ट को फ्लैग किया जाता है, तो Fable 5 स्पष्ट रूप से उपयोगकर्ता को सूचित करेगा कि अनुरोध को अस्वीकार किया जा रहा है या Opus 4.8 मॉडल पर भेजा जा रहा है। API स्तर पर, उपयोगकर्ताओं को अंततः किसी भी इनकार के लिए स्पष्ट स्पष्टीकरण प्राप्त होगा।
कंपनी का कहना है कि ये सुरक्षा मानक राष्ट्रीय सुरक्षा के लिए महत्वपूर्ण हैं। चूंकि Mythos को दुनिया के सबसे शक्तिशाली सिस्टम में से एक के रूप में डिज़ाइन किया गया है—जो उन्नत तर्क करने में सक्षम है और गलत हाथों में साइबर हमलों या जैविक हथियारों के विकास में मदद कर सकता है—लैब का तर्क है कि उसे विदेशी विरोधियों को अपनी तकनीक का लाभ उठाने से रोकना होगा। Anthropic का जोर है कि मशीन लर्निंग और कोडिंग का अधिकांश काम इन फिल्टरों से प्रभावित नहीं होता है, लेकिन विशेष शोध समुदाय के लिए, पारदर्शिता की शुरुआती कमी विश्वासघात जैसी लगी।
बड़ी तस्वीर
यह घटना मौजूदा AI गोल्ड रश में एक बुनियादी घर्षण बिंदु को उजागर करती है: खुली नवाचार और अस्तित्व संबंधी सुरक्षा के बीच का संतुलन। Anthropic जैसी लैब्स के लिए, डर यह है कि उनके सबसे उन्नत मॉडल "दोहरे उपयोग" वाले हथियार बन जाएं—ऐसे उपकरण जो एक दुष्ट देश के लिए उतने ही सहायक हों जितने कि बेंगलुरु के किसी कोडर के लिए।
हालांकि, इन मॉडलों को कैसे और क्यों नियंत्रित किया जा रहा है, इसे अस्पष्ट रखकर कंपनियां उन शोधकर्ताओं को ही खोने का जोखिम उठाती हैं जो कमजोरियों की पहचान करने में मदद करते हैं। "सुरक्षा-पहले" का मंत्र, हालांकि नेक है, लेकिन डेवलपर की उपयोगिता की कीमत पर नहीं हो सकता। Anthropic की माफी एक संकेत है कि सबसे अच्छी फंडिंग वाली लैब्स भी एक खतरनाक फ्रंटियर मॉडल को सुरक्षित रखने और पारिस्थितिकी तंत्र को उस पर निर्माण करने देने के बीच संतुलन बनाने के लिए संघर्ष कर रही हैं। फिलहाल, पारदर्शिता एक बुनियादी अपेक्षा है; क्या ये मॉडल वास्तविक दुनिया के शोध के लिए बहुत अधिक प्रतिबंधात्मक बने रहेंगे, यह अगली चुनौती है।
अर्जुन मेहता पॉलिटिकलपीडिया के लिए सरकार, नीति और संसद पर रिपोर्ट करते हैं।