为帮助行业破解这一难题,国内领先的芯片IP设计与服务提供商安谋科技(中国)有限公司(以下简称“安谋科技 Arm China”)于近日正式发布了新一代NPU IP——“周易”X3。该产品采用专为大模型打造的最新 DSP+DSA架构,不仅聚焦硬件性能的飞跃,更通过软硬协同与生态开放,重新定义了端侧AI计算效率,为基础设施、智能汽车、移动终端、智能物联网四大领域带来前所未有的AI计算体验。
安谋科技Arm China产品研发副总裁刘浩表示:“在‘All in AI’产品战略的指引下,我们将持续加大投入,以前瞻性视野整合顶尖研发资源,秉持开放合作理念,为生态伙伴提供业界领先的从硬件、软件到服务的端到端解决方案,全力赋能伙伴的产品创新和商业化落地。”
安谋科技Arm China产品研发副总裁刘浩
技术突破:DSP+DSA架构实现端侧AI计算效能跃升
随着生成式AI(AIGC)和大模型技术的快速发展, 智能手机、AI PC、智能汽车等端侧设备对AI能力的需求正呈爆发式增长。然而,端侧AI的核心痛点在于“有限资源承载复杂计算”。此外,在 半导体IP领域,“面向未来5年的产品方向进行前瞻布局”已成为行业共识,这让 IC设计人员在定义下一代端侧AI计算芯片时面临极大挑战。
为解决这些产业难题,“周易”X3 NPU IP应运而生,旨在打造端侧AI计算效率的新标杆。“周易”X3采用专为大模型打造的DSP+DSA融合架构,突破了传统NPU架构的局限——纯DSA架构虽能高效处理固定 算法,但面对大模型的灵活迭代易陷入“硬管道”困境,而DSP的加入有效弥补了通用计算的短板。同时,“周易”X3的架构也兼顾了CNN与Transformer的通用架构,支持全算力类型并增强浮点运算FLOPS,助力实现从定点到浮点计算的关键转变。
在架构创新方面,“周易”X3还集成了自研解压硬件W DC,通过软件无损压缩+硬件解压的方式,可额外获得15%-20%的等效带宽;配合W4A8/W4A16计算加速模式,有效破解了端侧大模型的带宽消耗难题;通过集成AI专属硬件引擎AIFF(AI Fixed-Func tion)与专用硬化调度器,将 CPU负载压低至0.5%,确保多任务场景下的低延迟响应;支持int4/int8/int16/int32/fp4/fp8/fp16/bf16/fp32多精度融合计算及强浮点计算,可灵活适配智能手机边缘部署、AI PC推理、智能汽车等从传统CNN到前沿大模型的数据类型需求,实现性能与能效的平衡。
谈及W4A8/W4A16计算加速模式创新,安谋科技Arm China产品总监鲍敏祺形象地比喻道:“W4A8/W4A16是混合量化策略,旨在平衡模型精度与计算效率,通过降低权重的比特数来减少显存占用,同时保持激活值较高的精度以最小化推理误差。如果W4A16计算是1秒输出,那么到了W4A8就可能是600毫秒输出。因为在保证精度的前提下,‘A’(即 Activation,激活值)的数值降低了,就相当于算力翻倍。当然,端侧需优先定义可用模型,再解决系统问题——早期端侧聚焦1B-3B模型,但7B模型才具备实用价值。当端侧要承载更大参数规模的AI模型(比如从3B扩大到7B),‘W’(即Weight,权重)也要随之降低,安谋科技Arm China也在协同合作伙伴着力优化W2A8,以支持7B模型在 手机等终端部署,而保证精度是前提。”
安谋科技Arm China产品总监鲍敏祺
这些创新为“周易”X3带来了显著的性能提升:“周易”X3单Cluster支持8-80 FP8 TFLOPS算力灵活配置,单Core带宽高达256GB/s。相较于“周易”X2产品,“周易”X3的CNN模型性能提升30%~50%,多核算力线性度达到70%~80%;在同算力规格下,AIGC大模型能力较上一代产品实现10倍增长。实测数据显示,在Llama2 7B大模型中,Prefill阶段算力利用率达72%,Decode阶段在自研解压硬件WDC加持下,有效带宽利用率超100%。
创新亮点:软硬协同,破解端侧AI开发痛点
“周易”X3不仅在硬件上实现突破,还配套了完善易用的“周易”Compass AI软件平台。通过“软硬一体”的协同设计,让 开发者从“能用”到“好用”,显著提升开发部署效率,破解端侧AI行业“适配难、周期长、门槛高”的痛点。
对此,鲍敏祺指出:“‘周易’X3遵循‘软硬协同、全周期服务与成就客户’的产品准则,提供从硬件、软件到售后服务的全链路支持,以前瞻性设计、专业团队交付与深度服务投入,全面助力客户产品成功与商业化落地。”
Compass AI软件平台实现了从模型导入到部署的端到端支持,兼容 TensorFlow、ONNX、PyTorch等主流AI框架,覆盖超160种算子与270多种模型,提供开箱即用的Model Zoo。其创新的Hugging Face模型“一键部署”功能,让开发者无需复杂适配即可实现大模型的端侧落地,大幅缩短开发周期。
针对大模型的动态特性,Compass AI平台具备业界领先的动态Shape支持能力,可高效处理任意长度输入序列;同时支持GPTQ等主流量化方案及 Tensor/Channel/Token Level多样量化方式,配合Bit精度软件 仿真平台,让开发者在平衡性能与精度时更具灵活性。丰富的调试工具与白盒部署能力,更满足了深度开发场景下的定制需求。
同时,安谋科技Arm China深知生态的核心在于“开放”,已将Compass AI平台的Pa rser、Optimizer、 Linux Driver等核心组件开放,成为行业内少数开放量化能力的厂商。通过支持DSL算子 编程语言,客户可自主开发自定义算子或打造专属模型编译器,实现差异化创新。这种“开放”的策略,既降低了中小开发者的入门门槛,也为大客户提供了深度定制的空间。
安谋科技Arm China NPU产品线负责人兼首席架构师舒浩博士总结道:“‘周易’X3的产品优势,源于通用、灵活、高效且软硬协同的系统架构设计,这一设计使其兼具广泛的行业适用性与灵活的边端侧AI应用场景匹配能力。”
应用场景:从“可用”到“好用”的端侧AI革命
“周易”X3的产品定位精准覆盖基础设施、智能汽车、移动终端、智能物联网四大核心领域,将算力转化为实实在在的应用价值。
在基础设施领域,其支持CNN与大模型的混合加速,为边缘计算节点与加速卡提供核心算力,成为数据 中心算力的重要补充;在智能汽车领域,“周易”X3既可以在 ADAS系统中为自动泊车等辅助驾驶功能提供高性能AI算力支持,也可以在IVI(车载信息娱乐系统)中支持基于语音与车内外视频图像输入的智能互动;在移动终端方面,可在AI PC与AI手机上实现超分渲染与AI Agent应用,让端侧多模态交互更流畅;在智能物联网领域,通过本地AI推理提升智能网关、IPC等设备的响应速度,兼顾实时性与隐私保护。
从产品家族演进来看,“周易”系列已形成从Z1到X3的完整布局,覆盖从入门级AIoT到高端智能设备的全场景需求。现场展示的DeepSeek-R1-Distill-Qwen-1.5B文生文、Stable Diffusion v1.5文生图等Demo,直观呈现了端侧大模型的落地效果。
结语
“周易”X3 NPU IP的发布,不仅是安谋科技Arm China技术实力的体现,更是端侧AI规模化部署的关键一步。通过软硬协同、前瞻布局和生态开放,它有望推动端侧AI从“功能实现”走向“场景深化”,为智能汽车、移动终端等领域注入新动力。随着行业对算力、精度和易用性需求的持续演化,安谋科技Arm China的战略实践或将成为中国AI芯片IP发展的参考范式。- 随机文章
- 热门文章
- 热评文章
- “影视+文旅+新消费” 《长安的荔枝》带动“荔枝热潮”,“影视+文旅+新消费” 《长安的荔枝》带动“荔枝热潮”
- 纪念冼星海诞辰120周年系列活动广州启幕,纪念冼星海诞辰120周年系列活动广州启幕
- 董寿平主题竹画展在山西太原龙山石窟博物馆开展,董寿平主题竹画展在山西太原龙山石窟博物馆开展
- 全面升级 《诛仙》动画第三季开播,全面升级 《诛仙》动画第三季开播
- 中美青年音乐家联合音乐会在中国驻纽约总领馆举行,中美青年音乐家联合音乐会在中国驻纽约总领馆举行
- 聚焦长剧之精品化打磨 电视剧《藏海传》研讨会在京举行,聚焦长剧之精品化打磨 电视剧《藏海传》研讨会在京举行
- 国铁太原局开行今年首批“歌迷专列”,国铁太原局开行今年首批“歌迷专列”
- 第16届巴黎中国电影节落下帷幕,第16届巴黎中国电影节落下帷幕
- 1沃野铁岭迎丰收 欢歌笑语庆丰年
- 2告别WiFi局限!这款国产ZigBee模块,让你的智能家居更稳定更省电
- 3港股异动 | 机器人领域催化密集 三花智控(02050)涨超7% 德昌电机控股(00179)涨超6%
- 42025中国公路自行车公开赛(眉山彭山站)在四川眉山鸣笛开赛2025中国公路自行车公开赛(眉山彭山站)在四川眉山鸣笛开赛
- 5成本惊人!英伟达“烧钱”散热 单套液冷组件将飙至近40万元(附股)
- 6自动化冷库PLC数据采集解决方案
- 7无电镀通孔形成印刷基板技术介绍
- 8十五运会火炬传递启动仪式将于11月2日举行十五运会火炬传递启动仪式将于11月2日举行
- 1歌声里的乡村振兴:侗族大歌如何唱出文旅新篇章,歌声里的乡村振兴:侗族大歌如何唱出文旅新篇章
- 2跨越千年 黄帝文化与浙江缙云“同行”,跨越千年 黄帝文化与浙江缙云“同行”
- 3湖北武当山持续推进文物本体保护修缮工作,湖北武当山持续推进文物本体保护修缮工作
- 4“广交会创办初期档案(1956-1959)”入选第六批《中国档案文献遗产名录》,“广交会创办初期档案(1956-1959)”入选第六批《中国档案文献遗产名录》
- 5陕西省非遗体验中心正式对外开放,陕西省非遗体验中心正式对外开放
- 6彩陶双连壶等400余件文物回郑州大河村“省亲”,彩陶双连壶等400余件文物回郑州大河村“省亲”
- 7“粤唱粤强”华人粤语歌唱大赛举办,“粤唱粤强”华人粤语歌唱大赛举办
- 8《长安的荔枝》北京见面礼举办 马伯庸希望剧集表达小说未尽之意,《长安的荔枝》北京见面礼举办 马伯庸希望剧集表达小说未尽之意




