7 月 31 日消息,字節跳動旗下云和 AI 服務平臺火山引擎于 30 日發布全新的豆包 · 圖像編輯模型 3.0、豆包 · 同聲傳譯模型 2.0,豆包大模型 1.6 系列升級版等產品。
同時,面向 Agent 智能體開發和落地,火山引擎持續優化 AI 云原生全棧服務,并發布企業自有模型托管方案、Responses API 等多個模型服務和工具產品,并利用 Agent 技術提供數字員工解決方案。
火山引擎總裁譚待表示,截至今年 5 月,豆包大模型日均 tokens 使用量超過 16.4 萬億,較去年 5 月首次發布(1200 億)時增長 137 倍。據 IDC 報告,豆包大模型在中國公有云大模型服務調用量上位居第一,占比達 46.4%。
據悉,過去一年,豆包大模型全面加速技術迭代、應用場景拓展和商業化落地。
今年 6 月,豆包大模型升級為 1.6 版,同時發布了豆包 · 視頻生成模型 Seedance 1.0 pro、豆包語音播客模型等新模型。
應用場景拓展和商業化層面,隨著生成式 AI 產業已經從 " 百模大戰 ",轉向通過 AI Agent 智能化實現商業落地,AI 正從 " 工具 " 升級為 " 助手 ",甚至 " 代理人 "。因此,如何將大模型能力轉化為具備商業價值的應用,已經成為企業發展的關鍵要素。
據 IDC 發布的《中國公有云大模型服務市場格局分析,2025 年一季度》報告顯示,2024 年,中國公有云大模型調用量達 114.2 萬億 tokens。按照大模型調用量的市場份額來看,火山引擎獨占 46.4% 的市場份額,位列第一,超過百度智能云(19.3%)和阿里云(19.3%)的總和。其余的 15% 則由騰訊云、移動云、天翼云等其他廠商獲得。
今年 6 月譚待透露,8-10 年(2030 年左右),只要世界和平,經濟發展,火山引擎或將達到年收入 1000 億元。" 馬拉松剛跑了 500 米,未來市場空間最少會擴大 100 倍,火山會持續保持國內 AI 第一。"
此次,火山引擎團隊加速技術迭代,發布一系列產品和服務。
其中,全新豆包 · 圖像編輯模型 3.0(SeedEdit 3.0)。該模型通過強化指令遵循能力、圖像保持能力及生成質量,讓用戶僅憑自然語言即可完成消除冗余、調整光影、替換元素等操作,還能實現風格轉換、材質變換、姿勢調整等創新修圖場景,從而廣泛適用于影像創作、廣告營銷等領域,企業用戶可在火山方舟調用其 API,個人用戶則能通過即夢或豆包 app 體驗。
豆包 · 同聲傳譯模型 2.0。采用全雙工框架,將語音延遲從 8-10 秒降至 2-3 秒,較傳統系統降低超 60%,實現文本與語音同步生成。更支持 0 樣本聲音復刻,無需提前錄制即可實時生成同音色外語語音。
豆包大模型 1.6 系列全面升級。其中,極速版 Doubao-Seed-1.6-flash 模型在強視覺理解能力外,還強化了代碼、推理、數學等語言模型能力,以更全模型能力,更快速度和更低成本,適配智能巡檢、手機助手等大規模商業化場景,該模型首 Token 輸出時間(PerToken 延遲)低至 10ms,為業界領先;成本上,在 0-32k 輸入文本長度區間(企業最常用),每百萬 tokens 輸入僅 0.15 元、輸出 1.5 元,在客戶使用案例中,已實現延遲下降 60%、成本降低 70%;而全模態向量化模型 Seed 1.6-Embedding 首次實現 " 文本 + 圖像 + 視頻 " 混合模態融合檢索,在圖片模態 MMEB_v2 Image 榜單中領先第二名 5.6 分,超過 Qwen2 7B 等模型。
AI Agent 開發平臺扣子核心能力正式開源,涵蓋一站式可視化開發工具扣子開發平臺(Coze Studio),和全鏈路管理工具扣子羅盤(Coze Loop)。開源僅三天,Coze Studio 星標數破萬,Coze Loop 星標數超 3000。
火山方舟升級 API 體系,推出 Responses API。該 API 具備原生上下文管理能力,支持多輪對話鏈式管理及文本、圖像等多模態數據銜接,結合緩存能力可降低 80% 成本;還支持單次請求聯動多工具與模型組合響應,將智能助手 Agent 開發從 460 行代碼、1-2 天,縮減至 60 行代碼、1 小時,大幅提升效率。
同時,隨著扣子核心能力開源,火山引擎對大模型 RLHF 訓練框架 veRL、Coze Studio、Coze Loop、分布式操作系統 KubeWharf、DeepResearch 開源項目 Deerflow 等多個技術棧進行開源。
譚待表示,未來,火山引擎會持續開源更多的高質量項目,幫助企業做好產品設計,助力開發者 AI 創新,為共建繁榮開源生態貢獻自己的力量。
火山引擎副總裁張鑫表示,很多人上班的一天日常是執行代辦、開會、數據處理、會議紀要等,整個過程會面臨內容、執行流程等問題。如果從系統工程角度看,這暴露了企業效率的三個瓶頸:第一、大量的工時被這種規則性任務所消耗;第二、系統來回切換,導致上下文中斷;第三、信息的孤島制約了決策的效率。因此,HiAgent 作為企業一站式智能體工作臺,希望通過幫企業源源不斷派遣 " 數字員工 ",拓展人類服務邊界和認知邊界,從而解決上述問題。
具體來說,HiAgent 數字員工提供千人千面的畫布形態作為數字員工的交互入口,銷售人員看到的是客戶管理的看板,而 HR 看到的則是招聘助手和績效管理助手,讓每個人的工作臺都在自己的需求方向上。另外,通過畫布連接企業所有的系統,讓 " 數字員工 " 充當中轉站,搞定所有流程,從而讓人可以專注在自己的目標上。
目前,HiAgent 數字員工方案已經開始落地。例如,廣交數科基于 HiAgent 平臺打造 AI 數字員工平臺解決方案,覆蓋車輛維修、公交廣告、經濟運行分析等場景,支撐企業快速實現 AI 轉型、管理變革和競爭力重塑;廈門大學基于 HiAgent 平臺打造廈門大學招生咨詢助手 " 廈小招 ",為考生及家長提供招生政策解讀、 專業特色介紹、校園生活咨詢、錄取流程指導等一站式咨詢服務,支撐招生咨詢效率提升與考生服務體驗優化等。
實際上,盡管 " 數字員工 " 這一理念提出了很多年,之前也有很多初創公司進行研發和提供解決方案,但如今,火山引擎的加入,將加速 " 數字員工 " 領域的商業落地。
那么,現在 AI 不僅可以幫我寫內容、剪輯視頻、生成圖片,甚至機器人、數字人可以替代我說話,而如今," 數字員工 " 的落地,已經讓我感受到了濃濃的危機感。
據了解,目前豆包團隊依然在發力全模態模型,并且豆包同聲傳譯模型即將在 8 月上線到 Ola Friend 耳機當中。
譚待認為,云計算行業的第一次浪潮是在線化,在線化積累了很多數據,但這些數據價值可能只發揮了 1% 到 5%。第二次浪潮是智能化,智能化不只能發揮出數據的價值,還能端到端地做很多事,包括 MaaS(模型即服務)、AI Agent(智能體),而在智能化的浪潮下,大家都在同一條起跑線上,都要使勁跑。" 我的要求是不能有短板,因為云計算的客戶很多元,行業差異很大。當然智能化的事情,比如豆包大模型、AI 云原生要做得更好。"
譚待強調,火山引擎希望用更好的技術和產品,持續幫助企業和開發者,在 AI 時代不斷創新、加速發展。(本文首發于鈦媒體 App,作者|林志佳,編輯|蓋虹達)