首页
留言
关于
统计
更多
友链
壁纸
直播
推荐
实得惠
爱步街
Search
1
M4 Mac mini一键开启2K HiDPI终极教程:告别模糊,解锁高清显示!
4,175 阅读
2
《扫毒风暴》2025 4K国语中字:兄弟对决的缉毒生死战,网盘资源速存
4,107 阅读
3
《朝雪录》2025古装悬疑剧:李兰迪敖瑞鹏揭秘惊天宫闱秘案
3,886 阅读
4
哔哩哔哩BBLL v1.5.2_4 修复神秘力量第三方TV电视版版评测:智能大屏优化全解析
3,531 阅读
5
战·争/战争/遗军之战 Warfare (2025) 4K 1080p 中英字幕 动作电影
2,438 阅读
生活
电子书
音乐
视频
短剧
技术
教程
软件
游戏
登录
Search
标签搜索
1080P高清资源
1080P高清
1080P
蓝光原盘REMUX
中文字幕
4K HDR
1080P蓝光原盘REMUX
夸克网盘
人性探讨
2025
电子书下载
内封简繁字幕
高清资源下载
高清画质
内容创作
蓝光原盘
4K高清资源
电商运营
抖音爆款短剧
韩国电影
智汇资源库
累计撰写
5,037
篇文章
累计收到
10
条评论
首页
栏目
生活
电子书
音乐
视频
短剧
技术
教程
软件
游戏
页面
留言
关于
统计
友链
壁纸
直播
推荐
实得惠
爱步街
搜索到
1
篇与
256K上下文开源模型
的结果
2025-07-31
阿里通义千问Qwen3-30B-A3B-Thinking-2507开源:256K上下文推理怪兽
阿里通义千问 Qwen3 开源全新推理模型!阿里通义千问Qwen3-30B-A3B-Thinking-2507开源:256K上下文推理怪兽在数学与代码领域全面碾压Gemini2.5-Flash,原生256K上下文可扩展至1M,轻量体积本地部署零门槛,开源社区即刻体验。三个月磨一剑,Qwen3-30B-A3B-Thinking-2507强势登场距离4月29日开源的Qwen3-30-A3B仅过去三个月,阿里通义千问团队再次放大招。今日,官方公众号低调宣布推出全新推理模型Qwen3-30B-A3B-Thinking-2507,用“再进化”来形容都显得保守。它不仅在数学与代码两项硬核指标上双双刷新开源天花板,还把上下文长度一口气拉到1M tokens,堪称“小而美”的推理怪兽。数学85分、代码66分,硬核成绩一览AIME25数学评测:85.0分直接超越Gemini2.5-Flash(thinking)与自家大哥Qwen3-235B-A22B(thinking),在奥数级难题面前依旧稳如老狗。LiveCodeBench v6代码评测:66.0分在真实编程场景里,模型不仅写得出,还能跑得通,Debug能力肉眼可见地提升。GPQA、MMLU-Pro知识基准通用知识水平较上一代显著跃升,真正做到“既专又博”。256K→1M tokens,长文本理解一步到位过去,30B级别模型常被吐槽“记不住前文”。Qwen3-30B-A3B-Thinking-2507原生支持256K tokens,借助稀疏注意力机制可扩展至1M tokens,一口气读完一本《三体》三部曲毫无压力。官方建议:面对复杂推理任务时,把思考预算(thinking budget)调高,模型会像资深顾问一样层层推演,给出滴水不漏的结论。通用能力全面开花,写作Agent多轮对话全拿捏除了硬核推理,新模型在“软实力”上也毫不含糊:WritingBench写作评测:长文结构、文采与逻辑并重,写论文、写脚本、写小红书文案统统拿下。BFCL-v3 Agent能力:函数调用、工具使用一气呵成,开发者可以把复杂任务放心交给它。MultiIF多语言指令遵循:中英日韩法德西,一句话切换,跨语种场景零门槛。消费级显卡即可本地部署,魔搭与HuggingFace同步开源体积依旧轻盈,单张RTX 4090即可流畅推理。魔搭社区与HuggingFace已同步放出权重,开发者只需两行命令即可把这位“推理怪兽”请回家。想先尝后买?官方在线体验地址也已上线,打开浏览器就能开聊。官网在线体验地址:https://chat.qwen.ai/{anote icon="fa-download" href="https://modelscope.cn/models/Qwen/Qwen3-30B-A3B-Thinking-2507" type="error" content="模型下载"/}
2025年07月31日
5 阅读
0 评论
0 点赞