હજુ સુધી અન્ય ટેક સ્ટાર્ટઅપ એનવીડિયાને ‘ઓર્ડર્સ ઓફ મેગ્નિટ્યુડ’ બહેતર ઉર્જા કાર્યક્ષમતા સાથે પછાડવા માંગે છે; Llama2-70B પર 666K ટોકન્સ/સે વિતરિત કરવા માટે સેજેન્સ AI એનાલોગ ઇન-મેમરી કમ્પ્યુટ પર બેટ્સ કરે છે

AI જાહેર ક્ષેત્રના અબજો બચાવી શકે છે - જો તે ખોલવા માટે તૈયાર હોય

સેજેન્સ AI અનુમાનને પુનઃવ્યાખ્યાયિત કરવા માટે એનાલોગ ઇન-મેમરી કમ્પ્યુટ લાવે છે દસ ગણી ઓછી શક્તિ અને 20 ગણી ઓછી કિંમત પણ PyTorch અને TensorFlow સાથે એકીકરણ ઓફર કરે છે

સેજેન્સ AI એ એઆઈ અનુમાનમાં પાવર, ખર્ચ અને માપનીયતાના મુદ્દાઓને સંબોધવા માટે રચાયેલ અદ્યતન એનાલોગ ઇન-મેમરી કમ્પ્યુટ આર્કિટેક્ચર રજૂ કર્યું છે.

એનાલોગ-આધારિત અભિગમનો ઉપયોગ કરીને, આર્કિટેક્ચર ઉર્જા કાર્યક્ષમતા અને ખર્ચ-અસરકારકતામાં સુધારણા પ્રદાન કરે છે જ્યારે હાલની ઉચ્ચ-અંતિમ GPU અને CPU સિસ્ટમો સાથે તુલનાત્મક કામગીરી પ્રદાન કરે છે.

આ બોલ્ડ પગલું સેજેન્સ AI ને Nvidia દ્વારા પ્રભુત્વ ધરાવતા બજારમાં સંભવિત વિક્ષેપકર્તા તરીકે સ્થાન આપે છે.

કાર્યક્ષમતા અને કામગીરી

Llama2-70B જેવા મોટા લેંગ્વેજ મોડલ્સની પ્રક્રિયા કરતી વખતે સેજેન્સ આર્કિટેક્ચર લાભો પ્રદાન કરે છે. જ્યારે 666,000 ટોકન્સ પ્રતિ સેકન્ડમાં સામાન્ય કરવામાં આવે છે, ત્યારે સેજેન્સની ટેક્નોલોજી અગ્રણી GPU-આધારિત સોલ્યુશન્સની તુલનામાં 10 ગણી ઓછી પાવર વપરાશ, 20 ગણી ઓછી કિંમત અને 20 ગણી નાની રેક સ્પેસ સાથે તેના પરિણામો આપે છે.

આ ડિઝાઇન તાલીમ પર અનુમાનની માંગને પ્રાધાન્ય આપે છે, જે ડેટા કેન્દ્રોમાં AI કમ્પ્યુટ ફોકસમાં ફેરફારને પ્રતિબિંબિત કરે છે. તેની કાર્યક્ષમતા અને પોષણક્ષમતા સાથે, સેજેન્સ રોકાણ પર વળતર (ROI) સુનિશ્ચિત કરવાના વધતા પડકારનો ઉકેલ આપે છે કારણ કે AI એપ્લિકેશન્સ મોટા પાયે જમાવટમાં વિસ્તરે છે.

સેજેન્સની નવીનતાના કેન્દ્રમાં તેની એનાલોગ ઇન-મેમરી કોમ્પ્યુટીંગ ટેકનોલોજી છે, જે મેમરી કોષોમાં સંગ્રહ અને ગણતરીને મર્જ કરે છે. અલગ સ્ટોરેજ અને સુનિશ્ચિત મલ્ટીપ્લાય-એકમ્યુલેટ સર્કિટની જરૂરિયાતને દૂર કરીને, આ અભિગમ ચિપ ડિઝાઇનને સરળ બનાવે છે, ખર્ચ ઘટાડે છે અને પાવર કાર્યક્ષમતામાં સુધારો કરે છે.

સ્કેલેબલ AI અનુમાન માટે જરૂરી કાર્યક્ષમતા પ્રાપ્ત કરવા માટે – સેજેન્સ મલ્ટિ-લેવલ મેમરી કોષોમાં ડીપ સબથ્રેશોલ્ડ કમ્પ્યુટિંગનો પણ ઉપયોગ કરે છે – એક ઉદ્યોગ-પ્રથમ નવીનતા -.

પરંપરાગત CPU અને GPU-આધારિત સિસ્ટમો જટિલ ગતિશીલ સમયપત્રક પર આધાર રાખે છે, જે હાર્ડવેરની માંગ, બિનકાર્યક્ષમતા અને પાવર વપરાશમાં વધારો કરે છે. સેજેન્સનું સ્ટેટિકલી સુનિશ્ચિત આર્કિટેક્ચર આ પ્રક્રિયાઓને સરળ બનાવે છે, જૈવિક ન્યુરલ નેટવર્કને પ્રતિબિંબિત કરે છે.

સિસ્ટમને PyTorch, ONNX અને TensorFlow જેવા હાલના AI ડેવલપમેન્ટ ફ્રેમવર્ક સાથે એકીકૃત કરવા માટે પણ ડિઝાઇન કરવામાં આવી છે. એકવાર પ્રશિક્ષિત ન્યુરલ નેટવર્ક્સ આયાત કરવામાં આવે તે પછી, સેજેન્સનું આર્કિટેક્ચર વધુ GPU-આધારિત પ્રક્રિયા, જમાવટને સરળ બનાવવા અને ખર્ચ ઘટાડવાની જરૂરિયાતને નકારી કાઢે છે.

“AI અનુમાન હાર્ડવેરમાં મૂળભૂત ઉન્નતિ એઆઈના ભવિષ્ય માટે મહત્વપૂર્ણ છે. મોટા લેંગ્વેજ મોડલ્સ (LLMs) અને જનરેટિવ AI નો ઉપયોગ કમ્પ્યુટિંગના ન્યુક્લિયસમાં ઝડપી અને મોટા પાયે ફેરફારની માંગને આગળ ધપાવે છે, જેમાં સૌથી ઓછી શક્તિ અને અર્થશાસ્ત્ર પર ઉચ્ચતમ પ્રદર્શનના અભૂતપૂર્વ સંયોજનની જરૂર છે જે બનાવેલ મૂલ્ય સાથે મેળ ખાય છે,” વિશાલ સરીને જણાવ્યું હતું. અને સ્થાપક, સેજેન્સ AI.

“આજે લેગસી કમ્પ્યુટિંગ ઉપકરણો કે જેઓ અત્યંત ઉચ્ચ-પ્રદર્શન AI અનુમાન માટે સક્ષમ છે તે આર્થિક રીતે સધ્ધર બનવા માટે ખૂબ ખર્ચ કરે છે અને પર્યાવરણીય રીતે ટકાઉ રહેવા માટે ખૂબ વધારે ઊર્જા વાપરે છે. અમારું ધ્યેય પર્યાવરણીય રીતે જવાબદાર રીતે તે કામગીરી અને આર્થિક મર્યાદાઓને તોડવાનું છે,” સરીને ઉમેર્યું.

વાયા IEEE સ્પેક્ટ્રમ

તમને પણ ગમશે

Exit mobile version