Post

भारतीय कंपनियों द्वारा बड़े भाषा मॉडल (LLMs) का प्रशिक्षण

February 26, 2026 hi 1048 words

Sarvam AI के LLMs: एक ऐतिहासिक क्षण या एक और प्रारंभिक कदम?

25 फरवरी, 2026 को, बेंगलुरु स्थित Sarvam AI ने स्वदेशी बड़े भाषा मॉडल (LLMs) के विकास के क्षेत्र में प्रवेश की घोषणा की। 35 अरब और 105 अरब पैरामीटर पर प्रशिक्षित मॉडल और बहुभाषी कार्यक्षमता पर जोर देते हुए, यह विकास भारत की बढ़ती महत्वाकांक्षा को दर्शाता है कि वह वैश्विक एआई दौड़ में अपनी पहचान बनाए। हालांकि, इस मील के पत्थर के पीछे एक जटिल वास्तविकता छिपी हुई है: एक ऐसा पारिस्थितिकी तंत्र जो एक साथ आशाजनक और अस्थिर है।

विशेष रूप से, ये मॉडल भारतीय क्षेत्रीय भाषाओं में पहुंच की दिशा में एक निर्णायक मोड़ का वादा करते हैं। चूंकि 90% से अधिक भारतीयों ने अपनी मातृभाषा में सामग्री को प्राथमिकता दी है, ऐसी क्षमता एआई-संचालित सेवाओं तक पहुंच को लोकतांत्रिक बना सकती है। हालांकि, महत्वपूर्ण प्रश्न यह है: क्या ये मॉडल उन वाणिज्यिक और बुनियादी ढांचे की चुनौतियों से बच पाएंगे जो ऐतिहासिक रूप से भारत की तकनीकी महत्वाकांक्षाओं को सीमित करती रही हैं?

संस्थागत ढांचा और IndiaAI की भूमिका

भारत की एआई महत्वाकांक्षाओं के केंद्र में IndiaAI मिशन है, जो देश के लिए एआई संप्रभुता स्थापित करने के लिए envisioned प्रमुख नीति पहल है। कंप्यूटेशनल बुनियादी ढांचे के निर्माण और स्वदेशी अनुसंधान और विकास को बढ़ावा देने पर इसके दोहरे ध्यान ने Sarvam AI के मॉडलों को जन्म देने वाले पारिस्थितिकी तंत्र का एक हिस्सा प्रदान किया। निम्नलिखित उपलब्धियों पर विचार करें:

भारत अब 38,000 GPUs के नेटवर्क का दावा करता है, जो देश में एआई विकास के लिए एक आवश्यक आधार है।
यह मिशन IIT बॉम्बे जैसे प्रमुख संस्थानों के साथ सहयोग करता है, जिसने BharatGen का विकास किया, जो शिक्षा और स्वास्थ्य सेवा के लिए 17 अरब पैरामीटर वाला बहुभाषी मॉडल है।
Gnani.ai जैसे एआई-केंद्रित स्टार्टअप को समर्थन दिया जा रहा है, जिसने संक्षिप्त भाषण और टेक्स्ट-टू-स्पीच मॉडल को विकसित किया है।

हालांकि ये प्रयास कागज पर उल्लेखनीय हैं, उनका प्रभाव कार्यान्वयन पर निर्भर करेगा। Sarvam AI के मॉडल ओपन-सोर्स होने का दावा करते हैं, जो संभावित पहुंच में वृद्धि का संकेत देता है। फिर भी, बिना कठोर सहकर्मी समीक्षा और अंतर-संस्थागत सहयोग के, व्यापक एआई अनुसंधान समुदाय पूरी तरह से जुड़ने में हिचकिचा सकता है। इलेक्ट्रॉनिक्स और आईटी मंत्रालय (MeitY), जिसे IndiaAI ढांचे के तहत इन मॉडलों की देखरेख का कार्य सौंपा गया है, को यह सुनिश्चित करना चाहिए कि बयानबाजी का अर्थपूर्ण अपनाने में अनुवाद हो।

हाइप से परे: जमीनी चुनौतियाँ

LLMs को प्रशिक्षित करना संसाधन-गहन कार्य है। Sarvam AI के मॉडल, जबकि आकार में प्रभावशाली हैं, भारत में एआई महत्वाकांक्षाओं के सामने आने वाली संरचनात्मक बाधाओं को उजागर करते हैं। निम्नलिखित पर विचार करें:

पहला, डेटा की कमी। जबकि Sarvam AI ने भारतीय भाषाओं में उच्च गुणवत्ता वाले डेटासेट को संकलित करने का दावा किया है, बड़े पारिस्थितिकी तंत्र में संरचित, उच्च-परिमाण क्षेत्रीय भाषा कॉर्पस की कमी है। यह विशेष रूप से समस्याग्रस्त है जब आधे से अधिक उपयोगकर्ता जो डिजिटल प्लेटफार्मों के साथ भारतीय भाषाओं में संलग्न होते हैं, व्यक्तिगतकरण में कमी की रिपोर्ट करते हैं।

दूसरा, पहुँच की लागत। Sarvam AI के जैसे मॉडल को प्रशिक्षित करने के लिए GPU क्लस्टर के साथ लंबे समय तक जुड़ाव की आवश्यकता होती है – ऐसे संचालन जो महीनों तक चलते हैं और विशाल पूंजी की मांग करते हैं। उदाहरण के लिए, OpenAI ने GPT-3 के लिए सीधे प्रशिक्षण लागत में 5 मिलियन डॉलर से अधिक का खर्च किया। भारतीय स्टार्टअप, बिना सुनिश्चित वाणिज्यिक लाभ के, महत्वपूर्ण स्थिरता जोखिमों का सामना करते हैं। यह IndiaAI ढांचे के तहत सब्सिडी या साझा बुनियादी ढांचे की आवश्यकता को उजागर करता है।

तीसरा, प्रदर्शन का प्रश्न है। जबकि Sarvam AI का भारतीय भाषाओं पर ध्यान मिशन के अनुरूप प्रतीत होता है, प्रारंभिक परिणाम इंगित करते हैं कि प्रदर्शन में असंगतता है, जो अंग्रेजी मानकों की तुलना में है। यह BharatGen और अन्य स्वदेशी मॉडलों से सीखे गए पाठों को दर्शाता है, जिनमें से कई ने गैर-अंग्रेजी उपयोगकर्ताओं के लिए अनुप्रयोग स्तर की परीक्षणों के दौरान सटीकता में उल्लेखनीय गिरावट दिखाई है।

गहरे स्तर पर, अनुवाद-केंद्रित कार्यप्रवाहों पर निर्भरता – जहां क्षेत्रीय भाषाओं में इनपुट वाक्य अक्सर प्रक्रिया से पहले अंग्रेजी में अनुवादित होते हैं – विलंबता जोड़ता है और व्याख्या की गुणवत्ता को कमजोर करता है। इससे भी बुरी बात यह है कि ऐसे दृष्टिकोण लागत बढ़ाते हैं क्योंकि टोकन की आवश्यकताएँ बढ़ जाती हैं। निर्बाध बहुभाषी एआई का सपना बस एक सपना बना हुआ है: जब तक संरचनात्मक सुधार बड़े पैमाने पर लागू नहीं होते।

संरचनात्मक दोष: पूंजी और समन्वय

भारत की एआई क्रांति भी महत्वाकांक्षा से नहीं, बल्कि अर्थशास्त्र और संघीय डिज़ाइन से बाधित होने का जोखिम उठाती है। Sarvam AI की GPU-आधारित प्रशिक्षण पर निर्भरता में एक स्पष्ट उदाहरण है। जबकि भारत के 38,000 GPUs महत्वपूर्ण लगते हैं, जब किसी स्टार्टअप और क्षेत्र के अनुसार उपलब्धता पर विचार किया जाता है, तो वास्तविकता काफी भिन्न होती है। इसके अलावा, ऐसे संसाधनों का पैमाना वैश्विक हाइपरस्केलर्स जैसे Microsoft या Google द्वारा होस्ट किए गए संसाधनों के स्तर का नहीं है।

फंडिंग अंतर इसे और बढ़ाता है। भारत का विभिन्न बजटीय शीर्षकों के तहत एआई पहलों के लिए आवंटन मिलाकर ₹4,500 करोड़ से अधिक है, लेकिन एक महत्वपूर्ण हिस्सा अल्पकालिक परियोजना मील के पत्थरों से बंधा हुआ है न कि बड़े पैमाने पर बुनियादी निवेशों से। इसके विपरीत, चीन ने केवल अपने एक क्षेत्रीय एआई हब ग्वांगझोउ में लगभग $1.6 बिलियन का निवेश किया है – यह एक पैमाना है जिसे भारत अभी तक हासिल नहीं कर सका है।

अंतर-मंत्रालयीय समन्वय एक और चुनौती प्रस्तुत करता है। जबकि MeitY IndiaAI मिशन का मार्गदर्शन करता है, कौशल विकास और उद्यमिता मंत्रालय (MSDE) एआई के लिए समर्पित प्रशिक्षित कार्यबल बनाने में पीछे है। इन संस्थानों के बीच समन्वय की कमी उद्योग स्तर पर एआई अपनाने में बाधाएँ उत्पन्न कर सकती है।

अंतरराष्ट्रीय दृष्टिकोण: चीन से सबक (और चेतावनियाँ)

चीन एक विपरीत कार्यान्वयन मॉडल प्रस्तुत करता है। राज्य-समर्थित शोध कार्यक्रमों और निजी साझेदारियों के माध्यम से, चीन ने Wu Dao 2.0 जैसे LLMs को प्रशिक्षित किया है, जिसमें 1.75 ट्रिलियन पैरामीटर हैं। इस सफलता के लिए महत्वपूर्ण रहा है निर्बाध डेटा-शेयरिंग समझौते, उच्च-प्रदर्शन राष्ट्रीय सुपरकंप्यूटिंग केंद्र, और एआई क्लस्टर में बहु-करोड़ डॉलर का निवेश।

हालांकि भारत की कंप्यूट और डेटा पर संप्रभुता के प्रति प्रतिबद्धता सराहनीय है, इसकी स्वायत्तता का दृष्टिकोण प्रभावशीलता का जोखिम उठाता है। बीजिंग की बंद डेटा पारिस्थितिकी प्रणालियों और एकल-पार्टी समन्वय पर उच्च निर्भरता भारत के लिए सबक हो सकती है: यदि हम चीन की संसाधन तीव्रता से मेल नहीं खा सकते, तो क्या हम कम से कम Sarvam AI, IISc, और वैश्विक तकनीकी खिलाड़ियों के बीच साझेदारी को व्यवस्थित कर सकते हैं?

आगे के कदम: सफलता की मांग

Sarvam AI या किसी भी स्वदेशी LLM परियोजना की वास्तविक सफलता तीन महत्वपूर्ण क्षेत्रों पर निर्भर करेगी। पहला, क्षेत्रीय भाषा डेटासेट तक पहुंच का विस्तार करना। इसके लिए संसाधनों और ज्ञान को कॉर्पस निर्माण में एकत्रित करने के लिए एक सार्वजनिक-निजी साझेदारी की आवश्यकता है।

दूसरा, IndiaAI को GPU-स्केल बहसों से आगे बढ़कर सस्ती राष्ट्रीय एआई बुनियादी ढांचे के निर्माण पर विचार करना चाहिए। साझा क्लाउड प्लेटफॉर्म, जैसे सिंगापुर के राष्ट्रीय एआई कार्यक्रम के समान, संसाधन बाधाओं को कम करेंगे और घरेलू स्टार्टअप के लिए परिचालन लागत को घटाएंगे।

अंत में, सफलता के लिए मापदंड स्थापित किए जाने चाहिए और स्वतंत्र रूप से ऑडिट किए जाने चाहिए। न केवल अपनाने की दर बल्कि भाषा प्रसंस्करण समय में कमी और डोमेन अनुकूलता जैसे मापदंडों की निगरानी की जानी चाहिए ताकि दीर्घकालिक लाभ सुनिश्चित हो सके।

प्रारंभिक प्रश्न

निम्नलिखित में से कौन सी विधि LLMs को मानव इरादे के साथ संरेखित करने के लिए उपयोग की जाती है?
- a) ट्रांसफर लर्निंग
- b) मानव फीडबैक से सुदृढ़ लर्निंग
- c) ग्रेडिएंट डीसेंट क्लस्टरिंग
- d) टोकन ऑग्मेंटेशन
Sarvam AI के मॉडल जैसे LLMs को प्रशिक्षित करने में प्राथमिक बाधा क्या है?
- a) GPU-आधारित प्रशिक्षण सुविधाओं की कमी
- b) उच्च गणना लागत
- c) क्षेत्रीय भाषा कॉर्पस की कमी
- d) ओपन-सोर्स उपकरणों की अनुपस्थिति

मुख्य प्रश्न

स्वदेशी LLMs के विकास में भारत की संप्रभु एआई महत्वाकांक्षाएँ क्या डेटा की पहुंच, कंप्यूट बुनियादी ढांचे, और अंतर-संस्थागत समन्वय में संरचनात्मक सीमाओं को पर्याप्त रूप से संबोधित करती हैं, इसका समालोचनात्मक मूल्यांकन करें।