今天,階躍星辰發(fā)布新一代開源 Agent 基座模型 Step 3.5 Flash。該模型面向?qū)崟r(shí) Agent 工作流場(chǎng)景打造,兼顧推理速度、智能水平與使用成本,在單請(qǐng)求代碼類任務(wù)上,Step 3.5 Flash 最高推理速度可達(dá)每秒 350 個(gè) token。Step 3.5 Flash 提供了一個(gè)“更快更強(qiáng)更穩(wěn)”的 Agent 底層模型選項(xiàng),希望能夠成為受大家喜愛的“Agent 搭子”。
來源:視覺中國
Step 3.5 Flash 采用稀疏MoE架構(gòu),每個(gè) token 僅激活約 110 億個(gè)參數(shù)(總計(jì) 1960 億參數(shù)),在保證模型能力的同時(shí)顯著提升推理效率,為 Agent 類應(yīng)用提供更高效、可負(fù)擔(dān)的底層模型選擇。包括華為昇騰、沐曦股份、壁仞科技、燧原科技、天數(shù)智芯、阿里平頭哥在內(nèi)的多家芯片廠商,已率先完成對(duì) Step 3.5 Flash 的適配,通過底層聯(lián)合創(chuàng)新提升模型適配性和算力效率。模型與算力的協(xié)同發(fā)展,有效降低推理成本,降低企業(yè)和開發(fā)者在應(yīng)用大模型時(shí)的綜合門檻,加快大模型在實(shí)際應(yīng)用場(chǎng)景中的落地。
公開信息顯示,階躍星辰于 2025 年 7 月聯(lián)合近 10 家芯片及基礎(chǔ)設(shè)施廠商發(fā)起「模芯生態(tài)創(chuàng)新聯(lián)盟」,旨在打通芯片、模型與平臺(tái)之間的技術(shù)壁壘,通過聯(lián)合優(yōu)化提升算力利用效率,加速大模型在各行業(yè)場(chǎng)景中的應(yīng)用落地。業(yè)內(nèi)認(rèn)為,隨著推理模型成為主流,模型與算力的深度協(xié)同將成為推動(dòng)大模型規(guī)?;瘧?yīng)用的重要路徑。
古月 小風(fēng)
校對(duì) 王菲