客畅网5月6日讯,国际权威人工智能测评体系LiveBench最新榜单揭晓,阿里研究院推出的通义千问第三代开源模型Qwen3(通称"千问3")荣登全球开源AI模型榜首。
该模型在核心能力指标"指令执行"维度表现尤为突出,超越o3 High、o4-Mini High及Gemini 2.5 pro等国际知名闭源系统,稳居全球首位。
据资料显示,该测评体系由纽约大学联合团队与Meta首席人工智能专家杨立昆共同研发,从多模态推理、数学演算、代码生成等七大技术维度展开系统性评估。
基于其独创的动态迭代评估机制,该体系被业内称为"全球首个防作弊AI能力评估基准"。
此次发布的千问3采用创新架构设计,在参数量仅为DeepSeek-R1模型三分之一的情况下,综合性能反超R1系列与OpenAI-o1等国际顶尖模型,实现训练成本指数级优化。
技术专家透露,该模型开创性地融合"实时响应"与"深度推演"双模运算架构,针对基础查询实施轻量化处理,面对复杂任务则启动多层级思维链解析,实现算力资源的智能分配。
在硬件适配方面取得突破性进展,仅需四张H20计算卡即可完整运行千问3全量版本,显存资源消耗较同级别模型缩减66%。