Compania chineză de tehnologie Alibaba a prezentat miercuri, 29 ianuarie, o nouă versiune a modelului său de inteligență artificială (IA) Qwen 2.5, care, conform afirmațiilor acesteia, depășește apreciatul DeepSeek-V3.
Momentul neobișnuit de lansare al Qwen 2.5-Max în prima zi a Anului Nou Chinezesc, când majoritatea oamenilor din China sunt în vacanță cu familiile, reflectă presiunea pe care ascensiunea rapidă a startup-ului chinez DeepSeek în ultimele trei săptămâni a creat-o nu doar pentru concurenții internaționali, ci și pentru cei locali, transmite epravda.com.ua cu un link către reuters.com.
„Qwen 2.5-Max depășește aproape toate modelele, inclusiv GPT-4o, DeepSeek-V3 și Llama-3.1-405B”, a declarat platforma de cloud Alibaba într-o postare pe contul oficial WeChat, referindu-se la cele mai noi modele de inteligență artificială deschise de OpenAI și Meta.
Lansarea pe 10 ianuarie a asistentului IA DeepSeek, care funcționează pe modelul DeepSeek-V3, precum și lansarea modelului R1 pe 20 ianuarie, au șocat Silicon Valley și au provocat o scădere a acțiunilor tehnologice.
Potrivit companiei, costurile reduse de dezvoltare și utilizare ale modelelor DeepSeek au făcut ca investitorii să pună la îndoială cheltuielile mari ale companiilor de top de inteligență artificială din SUA.
Cu toate acestea, succesul DeepSeek a împins și concurenții chinezi să își actualizeze modelele proprii de IA.
La doar două zile după lansarea DeepSeek-R1, compania ByteDance, proprietara TikTok, a prezentat o actualizare a modelului său de inteligență artificială de top, care, conform afirmațiilor sale, depășește modelul OpenAI o1 în testul AIME, care măsoară capacitatea modelelor IA de a înțelege și răspunde la instrucțiuni complexe.
Acest lucru reflectă afirmațiile DeepSeek conform cărora modelul său R1 concurează cu OpenAI o1 pe mai multe criterii de performanță.