近日消息,阶跃星辰开源 Agent 基座模型 Step 3.5 Flash 上线仅两天成功登顶 OpenRouter 平台 Trending 榜单。该榜单排名来自全球知名大模型聚合平台 OpenRouter 数据,数据基于全球开发者与用户的实际模型调用量,直观反映出模型在真实应用场景中的受欢迎程度与市场接受度。

阶跃星辰 Step 3.5 Flash 荣登 OpenRouter Trending 榜首,不仅验证了该模型作为技术黑马在高吞吐与复杂推理场景下的强劲实力,更彰显了其作为兼具极致性能与稳定性的实战首选地位作为面向实时 Agent 工作流场景的模型,Step 3.5 Flash 在推理效率上表现突出,最高推理速度可达每秒 350 个 token。该模型款稀疏混合专家(MoE)架构,在保持较为精巧的1960总参数量的同时,每个 token 在处理过程中仅需激活约 110 亿个参数,在保障模型性能的同时实现运行效率的优化,从而弥合前沿级智能体智能与计算效率之间的鸿沟。
在官方发布的Step 3.5 Flash Tech Report里显示,该模型聚焦于构建智能体的精准推理能?以及快速可靠的执行效率。Step 3.5 Flash 通过交错的 3:1 滑动窗口/全注意力机制(Sliding Window/Full Attention)和多 Token 预测(MTP-3)进行优化,以最小化多轮智能体交互的延迟和成本。为实现前沿级智能,Step 3.5 Flash 还采用了可扩展的强化学习(RL)框架,推动模型在数学、代码和?具使用等领域持续自我提升。
Step 3.5 Flash 在智能体、编码和数学任务中展现出卓越性能:在 IMO-AnswerBench 上达到 85.4% 的准确率,在 LiveCodeBench-v6(2024.08?2025.05)上达到 86.4%,在 τ2-Bench 上达到 88.2%,在 BrowseComp(含上下文管理)上达到 69.0%,在 Terminal-Bench 2.0 上达到 51.0%——其性能与 GPT-5.2 xHigh、Gemini 3.0 Pro 等前沿模型相当。通过重新定义效率边界,Step 3.5 Flash 为在真实工业环境中部署复杂智能体提供了高密度基础。Step3.5Flash 仅1960亿总参数、110亿激活参数,就能做到与前沿“巨模”在推理能力、智能体能力上性能相当。

上图:Step 3.5 Flash 仅需 110 亿激活参数(1960 亿 MoE 总参数)即可实现前沿级智能,性能比肩主流闭源和开源模型。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
上一篇:资讯频道 2026-02-06 13:36
热点 2026-02-06 13:29
热点 2026-02-06 12:57
热点 2026-02-06 12:37
热点 2026-02-06 11:42
