डीपसीक ने एआई की सोचने-समझने की क्षमता बढ़ाने के लिए नया R1 मॉडल पेश किया

चीनी एआई कंपनी डीपसीक ने अपना नया ओपन-सोर्स रीजनिंग मॉडल DeepSeek-V2-R1+ पेश किया है। यह उन्नत संस्करण अब एक साथ 128,000 टोकन तक के लंबे इनपुट को प्रोसेस कर सकता है और गणित, प्रोग्रामिंग व तर्क आधारित कार्यों में पहले से बेहतर प्रदर्शन देने का दावा करता है।

मूल R1 मॉडल अप्रैल 2024 में जारी किया गया था। इसका नया संस्करण “मिक्सचर ऑफ एक्सपर्ट्स” (MoE) तकनीक पर आधारित है, जिसमें मॉडल केवल आवश्यक हिस्सों को सक्रिय करता है। इससे संसाधनों की खपत कम होती है और प्रदर्शन की गुणवत्ता बनी रहती है। इसी प्रकार की तकनीक का उपयोग Google DeepMind और Mistral जैसी प्रमुख एआई कंपनियां भी करती हैं।

मॉडल के स्कोर प्रमुख परीक्षणों में बेहतर हुए हैं

डीपसीक के मुताबिक, नया R1+ मॉडल विभिन्न मानक एआई टेस्टों में उत्कृष्ट परिणाम प्रदान करता है। इनमें शामिल हैं :

  • गणित: 81.3
  • GSM8K (विद्यालय स्तर की गणित): 80.4
  • HumanEval (कोड लेखन): 83.9
  • GPQA (स्नातक स्तर के प्रश्न): 92.1

ये आंकड़े पिछले मॉडल की तुलना में मामूली लेकिन निरंतर सुधार को दर्शाते हैं। हालांकि यह OpenAI के GPT-4 या Google के Gemini जैसे अग्रणी एआई मॉडल से पीछे है, फिर भी ओपन-सोर्स मॉडलों में इसकी अच्छी पकड़ है।

विस्तारित कंटेक्स्ट विंडो एक महत्वपूर्ण प्रगति है। इससे मॉडल लंबी बातचीत को समझने, बड़े दस्तावेज़ों का सार निकालने और जटिल समस्याओं को हल करने में सक्षम होता है, जो छोटे कंटेक्स्ट मॉडल के लिए मुश्किल होता है।

चीन के बढ़ते ओपन-सोर्स एआई समुदाय का हिस्सा

डीपसीक कई चीनी कंपनियों में से एक है जो ओपन-सोर्स एआई टूल्स विकसित कर रही है। अन्य प्रमुख कंपनियों में बैइचुआन, इंटर्नएलएम और मूनशॉट एआई शामिल हैं। ये कंपनियां अपने मॉडल को सार्वजनिक करके शोधकर्ताओं और डेवलपर्स को बंद और वाणिज्यिक टूल्स से बेहतर विकल्प उपलब्ध कराना चाहती हैं।

चीन की ओपन-सोर्स रणनीति को एआई के क्षेत्र में वैश्विक प्रतिस्पर्धा बढ़ाने का माध्यम माना जा रहा है, खासकर पश्चिमी तकनीकों की पहुंच घटने के दौर में।

फिर भी शीर्ष वैश्विक मॉडलों से पीछे है

हालांकि इस अपडेट के बाद भी R1+ GPT-4 या Claude 3 जैसे प्रमुख वाणिज्यिक मॉडलों जितना सक्षम नहीं है। यह खास तर्क संबंधी कामों में ठीक काम करता है, लेकिन इसकी समग्र क्षमता अभी भी उनसे कम है।

डीपसीक ने प्रशिक्षण डेटा और कंप्यूटिंग पावर जैसी सभी तकनीकी जानकारी सार्वजनिक नहीं की है। फिर भी, इस रिलीज़ से स्पष्ट होता है कि चीनी शोधकर्ता लगातार विकास कर रहे हैं और वैश्विक एआई मुकाबले में अपनी जगह मजबूत करने के लिए प्रतिबद्ध हैं।

Leave a Reply

Your email address will not be published. Required fields are marked *