ચાઈનીઝ એઆઈ સ્ટાર્ટઅપ ડીપસીકે ડીપસીક-આર1 રજૂ કર્યું છે, જે ગણિત, કોડિંગ અને સામાન્ય જ્ઞાન સાથે સંબંધિત કાર્યોમાં ઓપનએઆઈના ઓ1 જેવા હાલના મોડલને પાછળ રાખવા માટે રચાયેલ અદ્યતન તર્કસંગત AI મોડલ છે. ડીપસીક-આર1 મોડલ નોંધપાત્ર કામગીરી અને પોષણક્ષમતા ધરાવે છે, જે o1 કરતાં 90-95% વધુ ખર્ચ-અસરકારક હોવાનું કહેવાય છે. આ નવું ઓપન સોર્સ AI ટૂલ એઆઈ સિસ્ટમ્સમાં સમસ્યાનું નિરાકરણ અને વિશ્લેષણાત્મક ક્ષમતાઓને વધારવા માટે બનાવવામાં આવ્યું છે.
ડીપસીક-આર1 શું છે?
DeepSeek-R1 એ અત્યાધુનિક રિઝનિંગ AI મોડલ્સમાંનું એક છે, જેનો હેતુ જટિલ સમસ્યાની વધુ સમજદાર સમજ ઊભી કરવાનો છે. ત્યાં બે વર્ઝન છે: કોર ડીપસીક-આર1-ઝીરો અને ડીપસીક-આર1.
R1-Zero ને RL પ્રક્રિયાનો ઉપયોગ કરીને તાલીમ આપવામાં આવે છે, જેમાં કોઈ ફાઈન-ટ્યુનિંગ વગરની દેખરેખ રાખવામાં આવે છે. બદલામાં, DeepSeek-R1 બહુ-તબક્કાની RL પ્રક્રિયાને અનુસરે છે અને કોલ્ડ-સ્ટાર્ટ સાથે શરૂ થાય છે જ્યાં ક્યુરેટેડ ડેટા તર્ક અને વાંચનક્ષમતાને વધુ વધારશે.
બેન્ચમાર્ક કામગીરી
DeepSeek-R1 એ ઘણા બેન્ચમાર્ક પર મજબૂત પ્રદર્શન આપ્યું છે: ગણિત (AIME 2024): OpenAI ખાતે o1 સાથે તુલનાત્મક પાસ@1 સ્કોર 79.8%. MATH-500 (મેથેમેટિક્સ બેન્ચમાર્ક): 93% ચોકસાઈ સ્કોર કરી, જે મોટાભાગના અન્ય AI મોડલ્સથી ઉપર છે. કોડફોર્સ (કોડિંગ બેન્ચમાર્ક): 96.3મા પર્સેન્ટાઈલ પર રેન્કિંગ, જે દર્શાવે છે કે મોડેલ નિષ્ણાત-સ્તરનું કોડર છે. સામાન્ય જ્ઞાન (MMLU અને GPQA ડાયમંડ): અનુક્રમે 90.8% અને 71.5% ચોકસાઈ મેળવી. AlpacaEval 2.0 (લેખન અને QA બેન્ચમાર્ક): લેખન અને પ્રશ્નોત્તરીના 87.6% કાર્યો જીત્યા.
આ પરિણામો દર્શાવે છે કે DeepSeek-R1 મોડલ સમગ્ર ડોમેન્સમાં વિવિધ શક્તિઓ ધરાવે છે, જે તેને હાલના AI મોડલ્સ સામે મજબૂત હરીફ બનાવે છે.
ડીપસીક-આર1 માટે કેસોનો ઉપયોગ કરો
ડીપસીક-આર1 તેની ઉત્તમ તર્ક અને ગાણિતિક સમસ્યા હલ કરવાની ક્ષમતાઓને કારણે અદ્યતન શિક્ષણ અને ટ્યુટરિંગ સિસ્ટમ્સમાં વિશાળ સંભાવના ધરાવે છે. તે કોડિંગ બેન્ચમાર્ક્સમાં ઉત્કૃષ્ટ પ્રદર્શન ધરાવે છે, જે તેને કોડ જનરેશન અને ડીબગીંગ કાર્યોમાં સોફ્ટવેર ડેવલપમેન્ટ માટે ખૂબ જ ઉપયોગી સાધન બનાવે છે. લાંબા-સંદર્ભ સમસ્યાઓ ઉકેલવા અને જટિલ પ્રશ્નોના જવાબ આપવાની તેની ક્ષમતા પણ તેને સંશોધન અને શૈક્ષણિક હેતુઓ માટે મૂલ્યવાન સંપત્તિ બનાવે છે.
આ પણ વાંચો: યુકે સરકાર સિવિલ સર્વિસ વર્કને ઓવરહોલ કરવા માટે ‘હમ્ફ્રી’ AI ટૂલ્સ બહાર પાડે છે
DeepSeek-R1 એ AI ટેક્નોલોજીમાં સૌથી નોંધપાત્ર એડવાન્સ છે, કારણ કે તે અગાઉના મોડલ કરતાં વધુ અદ્યતન ક્ષમતાઓ સાથે ઓછા ખર્ચે ઉકેલો પ્રદાન કરે છે જેનો ઉપયોગ શિક્ષણથી લઈને સોફ્ટવેર ડેવલપમેન્ટ સુધીના વિવિધ ક્ષેત્રોમાં થઈ શકે છે.