એન્થ્રોપિક પાસે નવી સુરક્ષા સિસ્ટમ છે જે કહે છે કે લગભગ તમામ એઆઈ જેલબ્રેક્સ રોકી શકે છે

એન્થ્રોપિક પાસે નવી સુરક્ષા સિસ્ટમ છે જે કહે છે કે લગભગ તમામ એઆઈ જેલબ્રેક્સ રોકી શકે છે

એન્થ્રોપિક ક્લાઉડ 3.5 સોનેટ “બંધારણીય વર્ગીકરણ” પર પરીક્ષણ કરાયેલ નવા પ્રૂફ-ઓફ-કન્સેપ્ટ સિક્યુરિટી માપને અનાવરણ કરે છે, એલએલએમએસ મૂલ્ય પ્રણાલીઓ શીખવવાનો પ્રયાસ છે, પરિણામે સફળ જેલબ્રેક્સમાં 80% કરતા વધુ ઘટાડો થયો

એઆઈ ટૂલ્સમાં અપમાનજનક કુદરતી ભાષાના સંકેતોનો સામનો કરવા માટે, ઓપનએઆઈ હરીફ એન્થ્રોપિકે એક નવી કલ્પનાનું અનાવરણ કર્યું છે જેને તે “બંધારણીય વર્ગીકૃત” કહે છે; માનવ જેવા મૂલ્યોનો સમૂહ (શાબ્દિક, બંધારણ) એક મોટી ભાષાના મોડેલમાં ઉશ્કેરવાનો એક સાધન.

એન્થ્રોપિકની સેફગાર્ડ્સ રિસર્ચ ટીમે નવા સુરક્ષા પગલાને અનાવરણ કર્યું, જે જેલબ્રેક્સ (અથવા એલએલએમના સ્થાપિત સલામતીની બહાર જાય છે તે આઉટપુટ પ્રાપ્ત કરવા માટે) ક્લાઉડ 3.5 સોનેટ, તેના નવીનતમ અને મહાન ભાષાના મોડેલ, એક નવી શૈક્ષણિકમાં, કાગળ.

બંધારણીય વર્ગીકરણોને લાગુ કર્યા પછી લેખકોએ તેના ક્લાઉડ મોડેલ સામે સફળ જેલબ્રેક્સમાં .6૧..6% ઘટાડો શોધી કા .્યો, જ્યારે સિસ્ટમની કામગીરીની ઓછામાં ઓછી અસર પણ છે, જેમાં ફક્ત “પ્રોડક્શન ટ્રાફિક ઇનકારમાં સંપૂર્ણ 0.38% નો વધારો અને 23.7% ઓવરહેડનો વધારો થયો છે. ”

માનવશાસ્ત્રનો નવો જેલબ્રેકિંગ સંરક્ષણ

જ્યારે એલએલએમએસ વિવિધ પ્રકારની અપમાનજનક સામગ્રીનું ઉત્પાદન કરી શકે છે, એન્થ્રોપિક (અને ખુલ્લા જેવા સમકાલીન) રાસાયણિક, જૈવિક, રેડિયોલોજીકલ અને પરમાણુ (સીબીઆરએન) સામગ્રી સાથે સંકળાયેલા જોખમો દ્વારા વધુને વધુ કબજો કરવામાં આવે છે. રાસાયણિક એજન્ટ કેવી રીતે બનાવવું તે કહેતા એલએલએમનું ઉદાહરણ હશે.

તેથી, બંધારણીય વર્ગીકૃતની કિંમત સાબિત કરવા માટે, એન્થ્રોપિકે સીબીઆરએન-કન્ટેન્ટ સંબંધિત જેલબ્રેકિંગના 8 સ્તરોને હરાવવા માટે એક ડેમો પડકારજનક વપરાશકર્તાઓને બહાર પાડ્યો છે. તે એક પગલું છે જેણે તેને તેના સુરક્ષા સ્વયંસેવકો અથવા ‘રેડ ટીમર્સ’ તરીકે ભીડના સ્રોત તરીકે જોનારાઓ તરફથી ટીકા આકર્ષિત કરી છે.

“તેથી તમે સમુદાયને તમારા માટે કોઈ પુરસ્કાર વિના તમારું કામ કરી રહ્યાં છો, જેથી તમે બંધ સ્રોત મોડેલો પર વધુ નફો કરી શકો?”, એક ટ્વિટર યુઝરે લખ્યું.

એન્થ્રોપિક નોંધ્યું હતું કે તેના બંધારણીય વર્ગીકૃત સંરક્ષણ સામે સફળ જેલબ્રેક્સ ખાસ કરીને બે જેલબ્રેક પદ્ધતિઓને ટાંકીને સ્પષ્ટપણે તેમને અવરોધવાને બદલે તે વર્ગીકૃતની આસપાસ કામ કર્યું હતું. ત્યાં સૌમ્ય પેરાફ્રેસીંગ છે (લેખકોએ રિસીન, એક ઝેર, એરંડા બીન મેશથી, પ્રોટીન સુધીના એક ઝેરના નિષ્કર્ષણના સંદર્ભો આપવાનું ઉદાહરણ આપ્યું હતું) તેમજ લંબાઈના શોષણ, જે એલએલએમ મોડેલને બાહ્ય વિગત સાથે મૂંઝવણમાં સમાન છે.

એન્થ્રોપિકે બંધારણીય વર્ગીકૃત (જેમ કે મોડેલો પર કામ કરવા માટે જાણીતા જેલબ્રેક્સ ઉમેર્યા હતા ઘણા શોટ જેલબ્રેકિંગજે મોડેલ અને વપરાશકર્તા, અથવા ‘વચ્ચે માનવામાં આવેલ સંવાદ હોવાને કારણે ભાષાને પ્રોમ્પ્ટ કરે છે.ઈશ્વર-પરિવર્તન‘, જેમાં જેલબ્રેકર્સ એક મોડેલના ગાર્ડ્રેલ્સને બાયપાસ કરવા માટે’ l33tspeak ‘નો ઉપયોગ કરે છે) અહીં સફળ ન હતા.

જો કે, તે પણ સ્વીકાર્યું હતું કે બંધારણીય વર્ગીકૃત પરીક્ષણો દરમિયાન સબમિટ કરેલા પૂછે છે “અવ્યવહારુ high ંચા ઇનકાર દર” હતા, અને તેની રુબ્રીક આધારિત પરીક્ષણ પ્રણાલીમાં ખોટા હકારાત્મક અને નકારાત્મકતાની સંભાવનાને માન્યતા આપી હતી.

જો તમે તેને ચૂકી ગયા હો, તો બીજું એલએલએમ મોડેલ, ડીપસીક આર 1, ચીનથી ઘટના સ્થળે પહોંચ્યું છે, ખુલ્લા સ્રોત હોવાને કારણે અને સાધારણ હાર્ડવેર પર ચલાવવા માટે સક્ષમ તરંગો બનાવે છે. ડીપસીઇકના કેન્દ્રિય વેબ અને એપ્લિકેશન સંસ્કરણો જેલબ્રેક્સના પોતાના વાજબી હિસ્સોનો સામનો કરવો પડ્યો છેચિની ઇતિહાસ અને રાજકારણના વિવાદાસ્પદ પાસાઓની ચર્ચા કરવા સામે તેમની સલામતીની આસપાસ જવા માટે ‘ગોડ-મોડ’ તકનીકનો ઉપયોગ કરવો.

તમને પણ ગમશે

Exit mobile version