Gigantul tehnologic Microsoft face un pas important în cursa globală a inteligenței artificiale, anunțând lansarea a trei modele dezvoltate intern: MAI-Transcribe-1, MAI-Voice-1 și MAI-Image-2.
Noile modele acoperă principalele direcții de dezvoltare AI:
- MAI-Transcribe-1 este un model de recunoaștere vocală care transformă vorbirea în text și, potrivit Microsoft, depășește ca acuratețe modelul Whisper (varianta large-v3). Acesta înregistrează o rată de eroare de doar 3,8% în 25 de limbi.
- MAI-Voice-1 generează voce sintetică realistă și poate produce un minut de audio în doar o secundă. Costul este de 22 de dolari pentru un milion de caractere generate.
- MAI-Image-2 este dedicat generării de imagini și va fi integrat în produse precum Bing și Microsoft PowerPoint. Tarifele pornesc de la 5 dolari per milion de token-uri pentru text și ajung la 33 de dolari pentru imaginile generate.
MAI-Transcribe-1 suportă fișiere audio în formate WAV, FLAC și MP3, de până la 200 MB, și oferă o viteză de procesare de aproximativ 2,5 ori mai mare decât soluțiile actuale Azure.
Modelele reprezintă primele rezultate ale noii echipe de „superinteligență”, creată în urmă cu șase luni și condusă de Mustafa Suleyman. Obiectivul declarat este atingerea unei „autosuficiențe în domeniul inteligenței artificiale”, reducând dependența de tehnologii externe.
Această direcție marchează o evoluție strategică pentru Microsoft, care până recent s-a bazat puternic pe parteneriatul cu OpenAI.
Anunțul vine într-un context delicat pentru companie. Acțiunile Microsoft au înregistrat cel mai slab trimestru de la criza financiară din 2008, iar presiunea pe livrarea de rezultate concrete în zona AI este în creștere.
Fii la curent cu tot ce contează în business-ul din România și abonează-te la canalul nostru de Whatsapp Forbes Romania.