Alibaba a lansat un model de AI care poate înțelege imagini

Gigantul tehnologic chinez Alibaba a lansat vineri un nou model de inteligență artificială (AI) despre care spune că poate înțelege imaginile și poate purta conversații mai complexe.

Compania a precizat că cele două noi modele ale sale, Qwen-VL și Qwen-VL-Chat, vor fi open source, ceea ce înseamnă că academicienii, cercetătorii și companiile din întreaga lume le pot folosi pentru a-și crea propriile aplicații AI fără a fi nevoie să își antreneze propriile sisteme, economisind astfel timp și bani, potrivit CNBC.

Modelul Qwen-VL poate răspunde la întrebări deschise legate de diferite imagini și poate genera subtitrări.

Qwen-VL-Chat oferă o „interacțiune mai complexă”, cum ar fi compararea mai multor imagini și răspunsul la mai multe runde de întrebări.

Unele sarcini pe care Alibaba spune că Qwen-VL-Chat le poate îndeplini includ scrierea de povești și crearea de imagini bazate pe fotografii, precum și rezolvarea ecuațiilor matematice prezentate într-o imagine.

Până acum, o mare parte din IA generativă s-a concentrat pe răspunsul la texte. Cea mai recentă versiune a ChatGPT de la OpenAI are, de asemenea, capacitatea de a înțelege imagini și de a răspunde în scris, la fel ca Qwen-VL-Chat.