阿里通义千问 Qwen3-4B-2507 双料更新:手机也能轻松跑,AI 体积小、性能强

发布时间:2025-08-07 14:07:18 来源:互联网

感谢本站网友 软媒用户1369491 的线索投递!

本站 8 月 7 日消息,通义千问 Qwen 昨日(8 月 6 日)发布公告,宣布,推出 Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507 两个模型,大幅提升性能。

官方表示,SLM(Small Language Models)对 Agentic AI 的发展极具价值,“2507”版本的 Qwen3-4B 模型,体积小,性能强,对手机等端侧硬件部署尤为友好。

本站援引博文介绍,在非推理(non-thinking)领域,Qwen3-4B-Instruct-2507 显著提升通用能力,目标成为更全能的端侧利器。

该模型掌握更多语言和长尾知识,上下文理解扩展至 256K,小模型也能处理长文本。该模型通用能力超越了闭源的小尺寸模型 GPT-4.1-nano,性能接近等规模的 Qwen3-30B-A3B(non-thinking)。

官方表示该模型更像一位高效的“执行专家”,遵循指令、迅速响应,更适合用于内容创作、工具调用等。

在推理(thinking)领域,Qwen3-4B-Thinking-2507 大幅提升了推理能力,AIME25 高达 81.3 分。Qwen3-4B-Thinking-2507 的推理表现可媲美中等模型 Qwen3-30B-Thinking,在聚焦数学能力的 AIME25 测评中,以 4B 参数量斩获惊人的 81.3 分的好成绩。

官方表示该模型像一位严谨的“学术专家”,面对复杂问题逐步推理,完成任务更深入可靠。

本周热门教程

1
原神甘雨被x哭还不断流东西是什么梗,甘雨被淦哭图片漫画

原神甘雨被x哭还不断流东西是什么梗,甘雨被淦哭图片漫画

2025/02/20

2
黄冈B站入口在哪里?如何快速进入B站并畅享精彩视频?

黄冈B站入口在哪里?如何快速进入B站并畅享精彩视频?

2025/03/12

3
如何顺利下载并使用足迹直播iOS版?详细教程与常见问题解答

如何顺利下载并使用足迹直播iOS版?详细教程与常见问题解答

2025/03/17

4
17草名字是什么?它们对健康的影响与实际应用有哪些不可忽视的关键点?

17草名字是什么?它们对健康的影响与实际应用有哪些不可忽视的关键点?

2025/03/01

5
如何通过成品网站CRM系统提升短视频营销效果:精准推送与客户关系管理的新趋势

如何通过成品网站CRM系统提升短视频营销效果:精准推送与客户关系管理的新趋势

2025/03/09

6
亚洲经典一曲二曲三曲的区别与特点解析

亚洲经典一曲二曲三曲的区别与特点解析

2025/03/10

7
爸爸吃女儿奶奶的祝福语电视剧:这部家庭剧到底讲了什么?为何能引发观众热议?

爸爸吃女儿奶奶的祝福语电视剧:这部家庭剧到底讲了什么?为何能引发观众热议?

2025/04/09

8
如何在视频约会软件上找到心仪的TA?寻找真爱的秘密武器是什么?

如何在视频约会软件上找到心仪的TA?寻找真爱的秘密武器是什么?

2025/03/16

9
妖精漫画sss究竟为什么如此受欢迎?揭秘背后的魅力与发展趋势

妖精漫画sss究竟为什么如此受欢迎?揭秘背后的魅力与发展趋势

2025/03/24

10
小草神被丘丘人抓去繁殖后代:玩家为何如此想象这段荒诞剧情?

小草神被丘丘人抓去繁殖后代:玩家为何如此想象这段荒诞剧情?

2025/03/11