3月4日开源,3月5日便登顶全球知名开源项目OpenClaw调用量榜首!徐汇人工智能企业频传喜讯,这次是阶跃星辰。3月4日,阶跃星辰宣布,将新一代Agent基座模型Step 3.5 ...
AIPress.com.cn报道 3月4日消息,阶跃星辰宣布,在此前开源 Step 3.5 Flash 模型的基础上,进一步开放该模型的预训练权重、中训练权重以及完整训练框架,实现从模型参数到训练流程的系统性开源。 此次开放内容包括 Base 权重、Midtrain 权重以及名为 Steptron 的训练框架。其中,Base ...
值得一提的是,1月26日,阶跃星辰完成超50亿元人民币B+轮融资,一举刷新过去12个月中国大模型赛道单笔最高融资纪录。参与机构包括上国投先导基金、国寿股权、浦东创投、徐汇资本、无锡梁溪基金、厦门国贸、华勤技术等产业投资人,腾讯、启明、五源等老股东进一步跟投。本轮融资将用于基础模型研发,打造全球顶尖基座模型,加速AI+终端战略落地。
据了解,Step 3.5 Flash采用稀疏MoE架构,总参数1960亿,但推理时仅激活约110亿参数,单请求代码任务下的推理速度最高可达350TPS。该模型专为智能体(Agent)场景设计,在复杂推理和长链任务中表现出色。
开源社区对这项技术成果表现出极大热情。数据显示,Step 3.5 Flash模型在Hugging Face平台的累计下载量已突破30万次,并连续两周占据OpenRouter趋势榜首位。在由中国开发者主导的开源项目OpenClaw(昵称"小龙虾")中,该模型更是一举冲入综合排名前二,成为亚洲地区首个进入该榜单前列的超大规模模型。
阶跃星辰全面开源Step 3.5 Flash OpenClaw 调用量飙至 Top2,flash,step,阶跃 ...
3月4日消息,中国大模型创业公司阶跃星辰继开源 Step 3.5 Flash 模型后,又开源了这款 Agent 基座模型的预训练权重(Base)、中训练权重(Midtrain)以及配套的 Steptron 训练框架。这一举动在当 ...
据了解,Step 3.5 Flash 采用稀疏 MoE 架构,总参数 1960 亿,但推理时仅激活约 110 亿参数,单请求代码任务下推理速度最高可达 350 TPS。该模型专为智能体(Agent)场景设计,在复杂推理和长链任务中表现出色,官方称其推理深度可媲美部分顶级闭源模型。 在开发者社区和实际应用中,Step 3.5 Flash 已经迅速获得了市场验证。截至目前,这款模型在 Hugging ...
据了解,Step 3.5 Flash采用稀疏MoE架构,总参数1960亿,但推理时仅激活约110亿参数,单请求代码任务下推理速度最高可达350TPS。该模型专为智能体(Agent)场景设计,在复杂推理和长链任务中表现出色,官方称其推理深度可媲美部分顶级闭源模型。
如果一个模型既能很好地实现 Agent(智能体)的能力,还能跑得足够快,不会在多轮推理中途「卡壳」,又有很低的幻觉率,会发生什么事情?答案是: 一线的开发者和用户很快就会用真金白银的 Token「投票」。 这就是全球 AI 圈正在发生的事情。阶跃星辰开源 ...