Nvidia એ તેના નવા Fugatto જનરેટિવ AI ઓડિયો ટૂલની જાહેરાત કરી છે તે તમામ પ્રકારની રીતે ઓડિયો બનાવી અને મિક્સ કરી શકે છે, પરંતુ હજુ સુધી ફ્યુગાટ્ટો અનન્ય અવાજો, ઓડિયો મિક્સ, સ્પીચ અને વધુ બનાવવાનું વચન આપે છે.
Nvidia જાહેરાત કરી છે ફુગાટ્ટો નામનું એક નવું જનરેટિવ AI ઓડિયો ટૂલ, જેને તે “વિશ્વનું સૌથી લવચીક સાઉન્ડ મશીન” તરીકે વર્ણવે છે – જે તમામ પ્રકારના સંગીત, વાણી અને અન્ય ઑડિયો અને તે અનોખા અવાજો પણ ઉત્પન્ન કરવામાં સક્ષમ છે જે પહેલાં ક્યારેય સાંભળ્યા ન હોય.
ફ્યુગાટ્ટો, જે ફાઉન્ડેશનલ જનરેટિવ ઓડિયો ટ્રાન્સફોર્મર ઓપસ 1 માટે ટૂંકું છે, તે ટેક્સ્ટ પ્રોમ્પ્ટ અને ઓડિયો નમૂનાઓ સાથે કામ કરી શકે છે. તમે જે સાંભળવા માંગો છો તેનું તમે સરળ રીતે વર્ણન કરી શકો છો અથવા હાલની ઓડિયો ક્લિપ્સને સંશોધિત કરવા અથવા સંયોજિત કરવા માટે AI મોડલ મેળવી શકો છો.
ઉદાહરણ તરીકે, તમે ટ્રેનના ધ્વનિને રસદાર ઓર્કેસ્ટ્રલ વ્યવસ્થામાં રૂપાંતરિત કરી શકો છો અથવા વરસાદના અવાજો સાથે બેન્જો મેલોડી મિક્સ કરી શકો છો. તમે ફક્ત પ્રોમ્પ્ટમાં ટાઇપ કરીને સેક્સોફોનનો અવાજ, અથવા વાંસળીના મ્યાવિંગનો અવાજ સાંભળી શકો છો.
ફુગાટ્ટો ટ્રેકમાંથી ગાયકને અલગ પણ કરી શકે છે અને વોકલ ડિલિવરી શૈલીને બદલી શકે છે, તેમજ શરૂઆતથી ભાષણ જનરેટ કરી શકે છે. હાલની મેલોડીમાં ફીડ કરો, અને તમે તેને ગમે તે વાદ્ય પર, કોઈપણ પ્રકારની શૈલીમાં વગાડી શકો છો.
ખરાબ સમાચાર – તે હજુ સુધી ઉપલબ્ધ નથી
ઑડિયો AI Fugatto ટેક્સ્ટમાંથી સાઉન્ડ જનરેટ કરે છે | NVIDIA સંશોધન – YouTube
તો તમે આ પ્રભાવશાળી નવી AI ટેકનોલોજીને કેવી રીતે અજમાવી શકો? તમે આ સમય માટે કરી શકતા નથી: તમારે Nvidia’s સાથે કરવું પડશે પ્રોમો વિડિઓ અને એ નમૂનાઓની વેબસાઇટ. ફુગાટ્ટો જાહેર પરીક્ષણ માટે ક્યારે ઉપલબ્ધ થશે તે અંગે હજુ સુધી કોઈ શબ્દ નથી.
Nvidia દ્વારા પ્રકાશિત કરાયેલા કેટલાક નમૂનાઓમાં સ્ત્રીના અવાજનો ભસવાનો અવાજ, ફેક્ટરી મશીનની ચીસો, ટાઈપરાઈટર વ્હીસ્પરિંગ અને ગુસ્સાથી બૂમો પાડતો સેલોનો સમાવેશ થાય છે. તમે ઑડિયો ઇફેક્ટ્સની વિશાળ વિવિધતા જોઈ શકો છો જે શક્ય છે.
Nvidia એ એ પણ દર્શાવ્યું છે કે કેવી રીતે AI એન્જિન બોલાતી શબ્દ ક્લિપ્સ ઉત્પન્ન કરવામાં સક્ષમ છે, જે પછી વિવિધ લાગણીઓ (ગુસ્સાથી ખુશ સુધી) અને વિવિધ ઉચ્ચારો લાગુ કરીને પણ વિતરિત કરી શકાય છે.
“અમે એક એવું મોડેલ બનાવવા માંગીએ છીએ જે માણસોની જેમ અવાજને સમજે અને ઉત્પન્ન કરે.” Nvidia ના રાફેલ વાલે કહે છેફુગાટો ટીમમાંથી એક. “ફ્યુગાટો એ ભવિષ્ય તરફનું અમારું પ્રથમ પગલું છે જ્યાં ઑડિઓ સિન્થેસિસ અને ટ્રાન્સફોર્મેશનમાં દેખરેખ વિનાનું મલ્ટિટાસ્ક લર્નિંગ ડેટા અને મોડલ સ્કેલમાંથી બહાર આવે છે.”