零Token成本助力车企年省数亿元，商汤绝影 Sage Box以顶级端侧模型、软硬一体解决方案打造车载超级智能体

2026年4月24日——商汤绝影在本届北京车展重磅发布SageBox（千机智盒），为自主智能体进化提供了一套全栈量产级创新方案，以颠覆性技术突破，为车企破解行业痛点的同时，带来从成本到体验的多重价值革新。

作为面向全场景的端侧智能中枢，SageBox 最具革命性的突破是通过搭载端侧多模态智能体基座大模型 Sage 32B，实现“一次投入、Token 永久免费”。按单台车日均节省 30 元云端成本计算，每 1 万辆车每年可为车企节省至少 1 亿元，彻底摆脱了云端按次计费的成本枷锁。

Sage Box以“Sage 32B 端侧模型+千机系统（Sage AIOS）+New Member 原生智能体执行” 三层架构为支撑。 Sage 大模型采用 MoE 架构，激活参数仅 3B，在 Orin X 等主流车规平台即可高效运行，突破原车 SoC 算力天花板；基于 Harness 架构的千机 AIOS，大幅提升多任务调度效率并降低开发壁垒，解决系统开发难题；本地部署模式彻底摆脱云端依赖，从根源上消除 Token 成本无底洞，同时保障交互低时延与数据安全。

SageBox 的发布，不仅为车企打造高性能、低成本、可量产的高阶智能座舱方案，更依托一脑多形核心架构打破车载场景边界。依托端侧原生与全栈自研技术优势，它可灵活适配多元场景，实现全域能力复用，推动行业向超级智能体进化的全新路径。

零成本、快响应、高精准，商汤绝影引领座舱智能体新发展

Sage Box 依托专为原生智能体座舱打造的端侧大模型，凭借 Token（词元）零成本交互、Always-on 实时响应、超 90% 场景推理精度三大核心优势，从成本、体验、智能三大维度突破行业瓶颈，全面升级智能座舱交互体验，为座舱智能体落地奠定坚实基础。

针对行业普遍存在的云端 API 调用 Token 计费痛点，Sage 32B 依托端侧原生部署架构实现 Token 零成本交互。经轻量化优化与车载算力深度适配，满足全场景用车需求，日均可节省30 元 Token 使用费，年均节省 Token 使用费万元左右。对车企而言，可彻底免除云端服务费用，打破规模化运营成本壁垒；对用户来说，交互无次数限制，可自由畅聊并下达指令。

在响应速度上，Sage 端侧大模型实现 Always-on 全天候待命，指令整体延迟低于 0.5 秒，单次推理延迟仅 0.03 秒，生成吞吐达80 token/秒。不同于云端模型易受网络波动影响，该模型常驻本地算力单元，无需联网与云端调度，隧道、车库等弱网环境也能即时反馈。

在智能理解层面，Sage 端侧大模型场景推理精度超 90%，可一次性解析用户复杂需求，自动联动空调、影音、导航等车载系统完成任务闭环，还能结合传感器感知乘员与路况信息，提供儿童模式、智能路线调整等主动服务。

94%高成功率超旗舰模型，Sage 模型性能超越一线云端大模型

商汤绝影发布的 Sage 端侧多模态智能体基座大模型，以 MoE 架构、自研后训练技术与车端原生优化，实现了端侧模型性能反超云端旗舰的突破，为车载智能体规模化落地提供了兼具高性能、低成本与高可靠的核心支撑。

Sage 采用 32B 总参的 MoE 架构，激活参数仅 3B，是行业首款能在车端实现复杂智能体能力的基座大模型。在国际公开评测 PinchBench 中，其最佳任务完成率达 94%，超越 Claude、GPT、Gemini 等一众云端大模型，打破“只有大模型才能做好智能体任务”的惯性认知。对比小米 MiMo-v2-Pro，Sage 激活算力仅为其1/14，显存占用约1/31，却实现了6.6个百分点的任务完成率领先，展现出端侧原生路线的极致高效。目前该模型已在英伟达 Orin X 平台完成部署，为量产落地奠定基础。

支撑 Sage 性能突破的，是商汤绝影自研的 SCOUT 与 ERL 两大后训练技术。SCOUT 分级协同学习框架创新采用“小模型探路、大模型吸收”的机制，让模型学习复杂出行场景任务时节省60%的 GPU 算力，大幅降低训练成本与周期，快速掌握多设备联动、多步决策等用车场景技能；ERL 可擦除强化学习技术，能让模型自动识别并擦除推理过程中的错误步骤，阻断偏差扩散，使复杂任务完成率提升20%，解决了多步推理中“一步错、步步错”的行业难题，该技术已被机器学习顶会 ICLR 2026 收录。

在 Orin X 平台上，Sage 实现0.5秒首字响应、0.03秒单 Token 推理延迟与80tk/S生成吞吐，平均任务时长优于主流 API 模型。其场景推理精度超 90%，长链路工具调用、逻辑规划、环境感知任务成功率分别达92%、89%、94%，复杂指令遵循率提升40%。模型可一次性解析复合指令，联动空调、影音、导航完成任务闭环；结合传感器感知乘员状态与路况，还能主动提供儿童模式、路线调整等服务，彻底告别 “被动唤醒、单次响应” 的传统语音助手，进化为懂场景、会思考、能服务的出行伙伴。

此外，Sage 支持 OpenClaw、Hermes 等主流智能体框架，可覆盖出行、家庭等全场景，为更多端侧智能体落地提供核心支撑。

40%决策提速、百种工具调用，New Member 让车载智能 “说到做到”

New Member 是商汤绝影 SageBox 千机智盒的执行层原生智能体，作为车载版“Claw”，它是连接“思考层”与真实场景的关键桥梁，为车载自主智能体提供从感知到执行的全链路闭环能力。

它以 Always-on 多模态感知为基础，实现小于1秒的低时延响应，可实时捕捉座舱内外的多模态信号，为后续决策提供毫秒级输入，支撑主动交互与环境理解。

结合专属认知记忆框架，通过沉淀用户习惯与场景数据，在意图理解与任务规划时快速匹配最优策略，将决策效率提升40%；同时内置超100种车控及生态工具技能，通过“意图理解→任务规划→工具调用→记忆迭代”的完整执行闭环，将 Sage 端侧模型的“思考指令”转化为可落地的车控、服务动作，让智能体从“会想”真正走向“会做”，赋能座舱实现全场景自主执行。

以 AIOS 为核心、打造高效安全智能中枢

Sage AIOS是商汤绝影 SageBox 的核心调度中枢，基于 Harness 架构深度打造，为车载自主智能体提供高效、低成本、高安全的底层支撑，破解行业 AIOS 开发难题。

对比通用 OpenClaw 架构，Harness 架构通过工具、资源、环境等多维度约束，实现了Tokens 消耗降低 50%、多任务调度效率提升 30%，大幅降低车载大模型运行成本，为智能体规模化落地扫清成本障碍。

安全层面，千机系统构建了三层加固体系：运行沙盒隔离、工具调用管控、数据访问防护，为智能体运行筑牢全链路安全屏障，确保复杂车载环境下的稳定可控。

系统内核以多模融合、模型调度、记忆服务、本地 RAG 等模块为核心，为 New Member 原生智能体提供上下文窗口、任务调度、提示词构建等基础能力；向下对接多模态模型与数据底座，向上支撑全场景智能体任务，实现从感知到执行的全链路协同调度，成为千机智盒实现 “能思考、善调度、会执行” 闭环的关键支撑，为智能座舱向自主智能体进化提供坚实系统底座。

一脑多形全域赋能，构筑全场景智能新生态

商汤绝影 SageBox 千机智盒以“一脑多形”核心能力，打破单一设备的智能边界，为车载、家用、陪伴等全场景智能终端注入统一的可进化 AI 大脑，构建起覆盖生活全维度的智能生态。

作为核心智能中枢，千机智盒向下兼容车载座舱、家用边缘设备、陪伴机器人等多元终端，向上支撑个性化场景需求。在车载座舱场景，它化身专属座舱大脑，依托生成式智驾与原生智能体，打造舱驾融合的智慧出行体验；在家用边缘场景，可成为智能家居控制中枢，联动灯光、家电实现无感智能交互；在陪伴机器人场景，则能赋予设备拟人化感知与执行能力，提供情感陪伴、任务协助等全场景服务。

千机智盒凭借端侧大模型、AIOS 调度与原生智能体三层技术架构，实现跨终端的统一智能能力输出，无需为不同设备单独开发智能系统。这种“一脑驱动多终端”的模式，不仅降低智能设备研发成本，更让各场景终端共享自主智能体能力，推动智能终端从单一功能工具，进化为可感知、会思考、能执行的全场景智能伙伴，加速全场景智能生态的落地普及。

立足全栈 AI 技术积淀，商汤绝影 SageBox 千机智盒以端侧超强模型能力、零 Token 极致降本、全链路智能体闭环三大核心优势，从车载座舱的自主智能体升级，到一脑多形的全场景生态延伸，为车企带来亿元级规模化降本红利，更以领先行业的 AI 底座技术，重新定义终端智能体的发展范式。

未来，商汤绝影将持续深耕生成式 AI 前沿领域，携手产业伙伴协同共进，加速智能汽车向超级智能体全面进化，以全域、高效、普惠的智能技术，赋能智慧出行与全场景智慧生活，开启自主智能体规模化落地的全新时代。

零Token成本助力车企年省数亿元，商汤绝影 Sage Box以顶级端侧模型、软硬一体解决方案打造车载超级智能体

全新BMW 7系及新世代车型领衔宝马集团携16款首秀车型震撼亮相北京车展

归本溯元守正创新，长城欧拉5多动力版本重磅上市，限时换新价6.98万元起

诠释契约的力量，长城汽车全明星阵容登陆2026北京车展

零Token成本助力车企年省数亿元，商汤绝影 Sage Box以顶级端侧模型、软硬一体解决方案打造车载超级智能体

零Token成本助力车企年省数亿元，商汤绝影 Sage Box以顶级端侧模型、软硬一体解决方案打造车载超级智能体

全新BMW 7系及新世代车型领衔 宝马集团携16款首秀车型震撼亮相北京车展

归本溯元守正创新，长城欧拉5多动力版本重磅上市，限时换新价6.98万元起

诠释契约的力量，长城汽车全明星阵容登陆2026北京车展

零Token成本助力车企年省数亿元，商汤绝影 Sage Box以顶级端侧模型、软硬一体解决方案打造车载超级智能体

全新BMW 7系及新世代车型领衔宝马集团携16款首秀车型震撼亮相北京车展