બેંગલુરુ સ્થિત સર્વમ એઆઈએ નવું લાર્જ લેંગ્વેજ મોડલ (LLM), સર્વમ-1 લોન્ચ કર્યું છે. આ 2-બિલિયન-પેરામીટર મોડલ અંગ્રેજીની સાથે બંગાળી, ગુજરાતી, હિન્દી, કન્નડ, મલયાલમ, મરાઠી, ઉડિયા, પંજાબી, તમિલ અને તેલુગુ સહિત દસ મુખ્ય ભારતીય ભાષાઓને સમર્થન આપવા માટે ઑપ્ટિમાઇઝ કરવામાં આવ્યું છે. આ મોડેલ ભારતીય ભાષાઓના અબજો બોલનારાઓ દ્વારા સામનો કરવામાં આવેલ તકનીકી અંતરને સંબોધિત કરે છે, જે હાલના મોટા ભાષાના મોડલ (LLM) દ્વારા મોટાભાગે ઓછી સેવા આપવામાં આવી છે.
આ પણ વાંચો: Mistral AI ઓન-ડિવાઈસ AI કમ્પ્યુટિંગ માટે નવા મોડલ્સનું અનાવરણ કરે છે
મુખ્ય લક્ષણો અને પ્રદર્શન ઉન્નતીકરણો
સર્વમ-1 બે મહત્વપૂર્ણ ક્ષેત્રોને સુધારવા માટે જમીનથી બનાવવામાં આવ્યું હતું: ટોકન કાર્યક્ષમતા અને ડેટા ગુણવત્તા. કંપનીના જણાવ્યા મુજબ, પરંપરાગત બહુભાષી મોડલ ભારતીય સ્ક્રિપ્ટો માટે ઉચ્ચ ટોકન ફળદ્રુપતા (શબ્દ દીઠ જરૂરી ટોકન્સની સંખ્યા) દર્શાવે છે, જેને અંગ્રેજી માટે 1.4ની સરખામણીમાં ઘણી વખત પ્રતિ શબ્દ 4-8 ટોકનની જરૂર પડે છે. તેનાથી વિપરિત, સર્વમ-1નું ટોકનાઇઝર તમામ સમર્થિત ભાષાઓમાં માત્ર 1.4-2.1 ના ટોકન પ્રજનન દર સાથે, સુધારેલ કાર્યક્ષમતા પ્રાપ્ત કરે છે.
સર્વમ-2ટી કોર્પસ
ભારતીય ભાષાઓ માટે અસરકારક ભાષા મોડલ વિકસાવવામાં એક નોંધપાત્ર પડકાર ઉચ્ચ ગુણવત્તાની તાલીમ ડેટાનો અભાવ છે. “જ્યારે વેબ-ક્રોલ કરેલ ભારતીય ભાષા ડેટા અસ્તિત્વમાં છે, ત્યારે તેમાં ઘણી વખત ઊંડાણ અને ગુણવત્તાનો અભાવ હોય છે,” સર્વમ એઆઈએ નોંધ્યું.
આને સંબોધવા માટે, ટીમે સર્વમ-2ટી બનાવ્યું, જે લગભગ 2 ટ્રિલિયન ટોકન્સ ધરાવે છે, જે દસ ભાષાઓમાં સમાનરૂપે વિતરિત કરવામાં આવે છે, જેમાં હિન્દી ડેટાનો 20 ટકા હિસ્સો ધરાવે છે. અદ્યતન સિન્થેટિક-ડેટા-જનરેશન તકનીકોનો ઉપયોગ કરીને, કંપનીએ ખાસ કરીને આ ભારતીય ભાષાઓ માટે ઉચ્ચ-ગુણવત્તાવાળી કોર્પસ વિકસાવી છે.
એજ ઉપકરણ જમાવટ
કંપનીના જણાવ્યા અનુસાર, સર્વમ-1 એ પ્રમાણભૂત બેન્ચમાર્ક્સ પર અસાધારણ પ્રદર્શન દર્શાવ્યું છે, જેમ્મા-2-2B અને લામા-3.2-3B જેવા તુલનાત્મક મોડલ્સને આઉટપર્ફોર્મ કર્યું છે, જ્યારે લામા 3.1 8B જેવા જ પરિણામો પ્રાપ્ત કર્યા છે. તેનું કોમ્પેક્ટ કદ 4-6x ઝડપી અનુમાન માટે પરવાનગી આપે છે, તે ખાસ કરીને એજ ડિવાઇસ ડિપ્લોયમેન્ટ સહિત વ્યવહારુ એપ્લિકેશન માટે યોગ્ય બનાવે છે.
આ પણ વાંચો: ગૂગલે ભારતમાં હેલ્થકેર, ટકાઉપણું અને કૃષિ માટે AI સહયોગની જાહેરાત કરી
મુખ્ય સુધારાઓ
સર્વમ-2ટીમાં મુખ્ય સુધારાઓમાં હાલના ડેટાસેટ્સની તુલનામાં દસ્તાવેજની સરેરાશ લંબાઈ કરતાં બમણી, ઉચ્ચ-ગુણવત્તાના નમૂનાઓમાં ત્રણ ગણો વધારો અને વૈજ્ઞાનિક અને તકનીકી સામગ્રીની સંતુલિત રજૂઆતનો સમાવેશ થાય છે.
સર્વમ દાવો કરે છે કે સર્વમ-1 એ પ્રથમ ભારતીય ભાષા એલએલએમ છે. આ મોડલને યોટ્ટાના શક્તિ ક્લસ્ટર પર તાલીમ આપવામાં આવી હતી, જેમાં Nvidia નું NeMo ફ્રેમવર્ક તાલીમ પ્રક્રિયાની સુવિધા સાથે પાંચ દિવસના સમયગાળામાં 1,024 GPU નો ઉપયોગ કરે છે.