20/03/2026 11:35
【AI】Qwen3.5預覽版模型首亮相,阿里居中國大模型公司排行首位
今日,阿里巴巴千問最新旗艦模型預覽版Qwen3.5-Max-Preview首次亮相全球大模型競技平台LM Arena,並獲得1464分的綜合得分。憑借這一成績,阿里千問在LM Arena全球大模型公司排行榜升至全球第五位,位列中國公司首位;字節、智譜、月之暗面、百度等五家中國公司進入全球前十。
據阿里雲介紹,LM Arena是由國際開源研究機構LMSYS組織的第三方大模型評測平台,其評測機制採用模型兩兩匿名對戰,由全球開發者進行盲測投票,最終根據勝負結果形成模型分數與排名。由於採用開放式對戰與人工評估相結合的方式,該榜單被業界視為當前最具參考價值的大模型性能評測之一。
在本次評測中,Qwen3.5-Max-Preview在沒有風格控制(without style control)的絕對勝率比拼中,整體性能排名全球第六。在細分任務層面,該模型的數學能力排名全球第五,專家級文本處理能力排名全球第十。此次亮相也是千問3.5系列首次以旗艦級模型身份參與國際第三方評測。
《經濟通通訊社20日專訊》
據阿里雲介紹,LM Arena是由國際開源研究機構LMSYS組織的第三方大模型評測平台,其評測機制採用模型兩兩匿名對戰,由全球開發者進行盲測投票,最終根據勝負結果形成模型分數與排名。由於採用開放式對戰與人工評估相結合的方式,該榜單被業界視為當前最具參考價值的大模型性能評測之一。
在本次評測中,Qwen3.5-Max-Preview在沒有風格控制(without style control)的絕對勝率比拼中,整體性能排名全球第六。在細分任務層面,該模型的數學能力排名全球第五,專家級文本處理能力排名全球第十。此次亮相也是千問3.5系列首次以旗艦級模型身份參與國際第三方評測。
《經濟通通訊社20日專訊》
【你點睇?】伊朗續封鎖霍爾木茲海峽油道,你是否擔心緊張局勢導致本港急劇通脹? ► 立即投票