2026年4月24日——商汤绝影在本届北京车展重磅发布SageBox(千机智盒),为自主智能体进化提供了一套全栈量产级创新方案,以颠覆性技术突破,为车企破解行业痛点的同时,带来从成本到体验的多重价值革新。

作为面向全场景的端侧智能中枢,SageBox 最具革命性的突破是通过搭载端侧多模态智能体基座大模型 Sage 32B,实现“一次投入、Token 永久免费”。按单台车日均节省 30 元云端成本计算,每 1 万辆车每年可为车企节省至少 1 亿元,彻底摆脱了云端按次计费的成本枷锁。

Sage Box以“Sage 32B 端侧模型+千机系统(Sage AIOS)+New Member 原生智能体执行” 三层架构为支撑。 Sage 大模型采用 MoE 架构,激活参数仅 3B,在 Orin X 等主流车规平台即可高效运行,突破原车 SoC 算力天花板;基于 Harness 架构的千机 AIOS,大幅提升多任务调度效率并降低开发壁垒,解决系统开发难题;本地部署模式彻底摆脱云端依赖,从根源上消除 Token 成本无底洞,同时保障交互低时延与数据安全。
SageBox 的发布,不仅为车企打造高性能、低成本、可量产的高阶智能座舱方案,更依托一脑多形核心架构打破车载场景边界。依托端侧原生与全栈自研技术优势,它可灵活适配多元场景,实现全域能力复用,推动行业向超级智能体进化的全新路径。
零成本、快响应、高精准,商汤绝影引领座舱智能体新发展
Sage Box 依托专为原生智能体座舱打造的端侧大模型,凭借 Token(词元) 零成本交互、Always-on 实时响应、超 90% 场景推理精度三大核心优势,从成本、体验、智能三大维度突破行业瓶颈,全面升级智能座舱交互体验,为座舱智能体落地奠定坚实基础。

针对行业普遍存在的云端 API 调用 Token 计费痛点,Sage 32B 依托端侧原生部署架构实现 Token 零成本交互。经轻量化优化与车载算力深度适配,满足全场景用车需求,日均可节省30 元 Token 使用费,年均节省 Token 使用费万元左右。对车企而言,可彻底免除云端服务费用,打破规模化运营成本壁垒;对用户来说,交互无次数限制,可自由畅聊并下达指令。
在响应速度上,Sage 端侧大模型实现 Always-on 全天候待命,指令整体延迟低于 0.5 秒,单次推理延迟仅 0.03 秒,生成吞吐达80 token/秒。不同于云端模型易受网络波动影响,该模型常驻本地算力单元,无需联网与云端调度,隧道、车库等弱网环境也能即时反馈。
在智能理解层面,Sage 端侧大模型场景推理精度超 90%,可一次性解析用户复杂需求,自动联动空调、影音、导航等车载系统完成任务闭环,还能结合传感器感知乘员与路况信息,提供儿童模式、智能路线调整等主动服务。
94%高成功率超旗舰模型,Sage 模型性能超越一线云端大模型
商汤绝影发布的 Sage 端侧多模态智能体基座大模型,以 MoE 架构、自研后训练技术与车端原生优化,实现了端侧模型性能反超云端旗舰的突破,为车载智能体规模化落地提供了兼具高性能、低成本与高可靠的核心支撑。

Sage 采用 32B 总参的 MoE 架构,激活参数仅 3B,是行业首款能在车端实现复杂智能体能力的基座大模型。在国际公开评测 PinchBench 中,其最佳任务完成率达 94%,超越 Claude、GPT、Gemini 等一众云端大模型,打破“只有大模型才能做好智能体任务”的惯性认知。对比小米 MiMo-v2-Pro,Sage 激活算力仅为其1/14,显存占用约1/31,却实现了6.6个百分点的任务完成率领先,展现出端侧原生路线的极致高效。目前该模型已在英伟达 Orin X 平台完成部署,为量产落地奠定基础。


支撑 Sage 性能突破的,是商汤绝影自研的 SCOUT 与 ERL 两大后训练技术。SCOUT 分级协同学习框架创新采用“小模型探路、大模型吸收”的机制,让模型学习复杂出行场景任务时节省60%的 GPU 算力,大幅降低训练成本与周期,快速掌握多设备联动、多步决策等用车场景技能;ERL 可擦除强化学习技术,能让模型自动识别并擦除推理过程中的错误步骤,阻断偏差扩散,使复杂任务完成率提升20%,解决了多步推理中“一步错、步步错”的行业难题,该技术已被机器学习顶会 ICLR 2026 收录。
在 Orin X 平台上,Sage 实现0.5秒首字响应、0.03秒单 Token 推理延迟与80tk/S生成吞吐,平均任务时长优于主流 API 模型。其场景推理精度超 90%,长链路工具调用、逻辑规划、环境感知任务成功率分别达92%、89%、94%,复杂指令遵循率提升40%。模型可一次性解析复合指令,联动空调、影音、导航完成任务闭环;结合传感器感知乘员状态与路况,还能主动提供儿童模式、路线调整等服务,彻底告别 “被动唤醒、单次响应” 的传统语音助手,进化为懂场景、会思考、能服务的出行伙伴。
此外,Sage 支持 OpenClaw、Hermes 等主流智能体框架,可覆盖出行、家庭等全场景,为更多端侧智能体落地提供核心支撑。
40%决策提速、百种工具调用,New Member 让车载智能 “说到做到”
New Member 是商汤绝影 SageBox 千机智盒的执行层原生智能体,作为车载版“Claw”,它是连接“思考层”与真实场景的关键桥梁,为车载自主智能体提供从感知到执行的全链路闭环能力。

它以 Always-on 多模态感知为基础,实现小于1秒的低时延响应,可实时捕捉座舱内外的多模态信号,为后续决策提供毫秒级输入,支撑主动交互与环境理解。
结合专属认知记忆框架,通过沉淀用户习惯与场景数据,在意图理解与任务规划时快速匹配最优策略,将决策效率提升40%;同时内置超100种车控及生态工具技能,通过“意图理解→任务规划→工具调用→记忆迭代”的完整执行闭环,将 Sage 端侧模型的“思考指令”转化为可落地的车控、服务动作,让智能体从“会想”真正走向“会做”,赋能座舱实现全场景自主执行。
以 AIOS 为核心、打造高效安全智能中枢
Sage AIOS是商汤绝影 SageBox 的核心调度中枢,基于 Harness 架构深度打造,为车载自主智能体提供高效、低成本、高安全的底层支撑,破解行业 AIOS 开发难题。

对比通用 OpenClaw 架构,Harness 架构通过工具、资源、环境等多维度约束,实现了Tokens 消耗降低 50%、多任务调度效率提升 30%,大幅降低车载大模型运行成本,为智能体规模化落地扫清成本障碍。
安全层面,千机系统构建了三层加固体系:运行沙盒隔离、工具调用管控、数据访问防护,为智能体运行筑牢全链路安全屏障,确保复杂车载环境下的稳定可控。
系统内核以多模融合、模型调度、记忆服务、本地 RAG 等模块为核心,为 New Member 原生智能体提供上下文窗口、任务调度、提示词构建等基础能力;向下对接多模态模型与数据底座,向上支撑全场景智能体任务,实现从感知到执行的全链路协同调度,成为千机智盒实现 “能思考、善调度、会执行” 闭环的关键支撑,为智能座舱向自主智能体进化提供坚实系统底座。
一脑多形全域赋能,构筑全场景智能新生态
商汤绝影 SageBox 千机智盒以“一脑多形”核心能力,打破单一设备的智能边界,为车载、家用、陪伴等全场景智能终端注入统一的可进化 AI 大脑,构建起覆盖生活全维度的智能生态。

作为核心智能中枢,千机智盒向下兼容车载座舱、家用边缘设备、陪伴机器人等多元终端,向上支撑个性化场景需求。在车载座舱场景,它化身专属座舱大脑,依托生成式智驾与原生智能体,打造舱驾融合的智慧出行体验;在家用边缘场景,可成为智能家居控制中枢,联动灯光、家电实现无感智能交互;在陪伴机器人场景,则能赋予设备拟人化感知与执行能力,提供情感陪伴、任务协助等全场景服务。
千机智盒凭借端侧大模型、AIOS 调度与原生智能体三层技术架构,实现跨终端的统一智能能力输出,无需为不同设备单独开发智能系统。这种“一脑驱动多终端”的模式,不仅降低智能设备研发成本,更让各场景终端共享自主智能体能力,推动智能终端从单一功能工具,进化为可感知、会思考、能执行的全场景智能伙伴,加速全场景智能生态的落地普及。
立足全栈 AI 技术积淀,商汤绝影 SageBox 千机智盒以端侧超强模型能力、零 Token 极致降本、全链路智能体闭环三大核心优势,从车载座舱的自主智能体升级,到一脑多形的全场景生态延伸,为车企带来亿元级规模化降本红利,更以领先行业的 AI 底座技术,重新定义终端智能体的发展范式。
未来,商汤绝影将持续深耕生成式 AI 前沿领域,携手产业伙伴协同共进,加速智能汽车向超级智能体全面进化,以全域、高效、普惠的智能技术,赋能智慧出行与全场景智慧生活,开启自主智能体规模化落地的全新时代。






