AMD Strix Halo与NVIDIA GB10谁更适合中小规模AI开发者
【ZOL中关村在线原创分析】近两年,端侧AI发展速度之快超乎想像。2年前AI PC刚刚诞生,是什么、能干什么、和传统PC有何区别是摆在大众面前的灵魂三问;1年前,伴随稳定扩散模型和大语言模型的陆续爆发,人们开始对AI PC有了实质性概念;而今年,随着AMD锐龙AI Max+ 395这样的超大统一内存+可分配显存技术(VGM)的出现,端侧运行大模型的参数规模和运行效率得到了史诗级强化,至此,AI赋能的高效体验逐渐深入人心,越来越多的生产力、创意、甚至游戏用户从AI中获益。
在这样的背景之下,AI端侧计算设备的竞争也随之进入新的阶段。以AMD锐龙AI Max+ 395以及NVIDIA GB10 Grace Blackwell平台形成的两大高算力技术路线,开拓了小型化、低成本、高算力MiniAI工作站时代,相对于动辄数十万元的AI一体机而言,AMD锐龙AI Max+ 395以及NVIDIA GB10 Grace Blackwell力求通过更低的价格成本让AI开发者、有本地化AI大模型需求的中小企业等用户突破算力桎梏。

不过,二者的目标虽然一致,但生态却大有不同。AMD锐龙AI Max+ 395依托极为成熟的x86+Windows生态的深厚积淀,直接抹平了本地化AI计算的软硬件门槛,并保持了相关设备的泛用性;而以ARM+Linux生态为核心构建的NVIDIAGB10 Grace Blackwell,则有着更加垂直的赛道,因此在泛用性、兼容性等方面,相对AMD锐龙AI Max+ 395而言并不适合大众用户。这意味着AMD锐龙AI Max+ 395可能是更适合AI入门开发者的优选方案。

·x86 Windows成熟生态能大幅降低入门开发者技术门槛和中小企业部署门槛
x86与ARM、Windows与Linux,简简单单的两组名词道尽了PC行业的生态体系与目标群体。
从软件层面来看,x86 Windows生态经过数十年发展,已为AI入门级到专家级开发者们构建了极为便利的资源链路。几乎所有主流AI开发工具和应用均提供Windows原生版本,无需复杂的环境配置即可直接安装,如LM Studio、Ollama等等,支持通过图形化界面一键部署和加载Llama、Qwen、DeepSeek等开源模型,AI开发者甚至无需掌握命令行即可完成基础层面的开发。同时,Windows生态下进行开发的学习成本相对较低,比如很多AI开发教程的系统环境均基于Windows,可以轻松复现。
而NVIDIAGB10 Grace Blackwell的ARM+Linux生态,其实对于不少入门开发者来说就比较难以上手了。首先,部分AI开发工具即便提供ARM版本,但可能相应的功能也会有些许缺失,如ARM版Tensor Flow就不支持部分可视化工具Tensor Board,导致入门者难以直观观察模型训练过程;其次,Linux系统的命令行操作逻辑与大众习惯的图形化界面差异较大,有着较高的上手门槛,仅仅是如配置Python虚拟环境、安装相关驱动等基础步骤,就需要有一定的命令行语言基础。虽然NVIDIA提供了基于Ubuntu的NVIDIA DGX OS定制系统,规避了不同Linux版本操作指令的差异问题,但相应的学习成本也有所增加,没接触过的开发者自然需要重新学习相关内容,上手门槛较高。

硬件层面,基于x86架构打造的AMD锐龙AI Max+ 395平台,对于AI开发来说自然有着更加灵活且低成本的优势。整个平台的兼容性、泛用性、可扩展性优势是与生俱来的,而且相关产品的价格基本都在15000元以内,与DGX Spark新上市产品最低32999元的价格相比较来说成本更低、部署门槛更低,同时也具备出色的性能,单位投入获得的性能要高的多。

基于ARM架构设计的NVIDIAGB10 Grace Blackwell,虽然有专属的DGX OS系统加持,但其兼容性、泛用性方面就会大打折扣,基本上只能用来做程序开发、AI开发,除此之外的其它类型应用就极为有限了。而AMD锐龙AI Max+ 395平台除了可以作为AI开发平台,日常还能够满足用户的办公、3D渲染甚至游戏需求,假设二者终端产品价格一致的情况下,兼容性、泛用性更优的AMD锐龙AI Max+ 395平台显然更对大众胃口。
其实说到泛用性,锐龙AI Max+ 395在当前的移动级平台中首屈一指。得益于AMD创新Zen5架构的能效优势,16核32线程的多任务执行能力,以及最高可将96GB统一内存分配给显存的能力,锐龙AI Max+ 395在运行大规模参数量MoE混合专家模型优势显著。例如Qwen3-235B-A22BMoE模型的生成速度可以达到14.72tokens/s,完全达到了实用级性能。

而在运行30B以下小参数量的稠密大模型方面,更是能够提供超过10tokens/s以上的生成速度。放在两年前AI PC刚刚起步之时,集成显卡平台能达到如此性能表现可谓是天方夜谭。

在执行高负载AI任务之外,锐龙AI Max+ 395借助多核心、高主频优势,可谓是真正实现了“一机多用”,轻松应对多模态任务。在运行Office办公套件、浏览器多标签页时流畅无卡顿,甚至可同时开启多个AI模型进行调试优化、在线课程学习、文档编辑等多种复合任务也不会卡顿。而集成的Radeon 8060S iGPU还能满足视频剪辑、3D建模渲染、甚至部分3A游戏需求,一机解决从AI开发到办公应用再到重负载生产力以及游戏的全场景应用需求。
相对于锐龙AI Max+ 395的泛用特征,NVIDIAGB10 Grace Blackwell就显得更加专一,算得上是编程和AI开发的“偏科生”。受限于ARM架构和Linux生态的局限,NVIDIAGB10 Grace Blackwell注定无法成为普适型设备,因此其应用场景极为单一,并不适合作为AI入门开发的首选平台。
·单位价格性能转化比锐龙AI Max+ 395优势显著更适合“大众体质”
对于初创团队和个人开发者来说,产品价格也是敏感因素,对于企业用户来说,主要体现在TCO,即总拥有成本方面的表现。
在这一点上,无论是锐龙AI Max+ 395还是GB10 Grace Blackwell,都将终端产品设计成迷你AI工作站或笔记本形态的移动工作站,因此相对于需要占用专业机房、配备专业供电设备以及专业IT维护支持的AI一体机来说,总体成本更低。
不过,价格和管理维护所带来的成本只是一个方面,更多目标用户其实关注的是单位价格与性能之间的转化比,这一比值的高低往往反映硬件性能的价值,价值越高,自然就越适合“大众体质”。
以目前上市的锐龙AI Max+ 395和GB10 Grace Blackwell机型来看,前者在这方面有着非常显著的优势。
目前上市的产品中,惠普Z2 Mini G1a工作站21999元,在AMD Strix Halo产品中,这已经算是最贵的产品了。而多数Mini AI工作站产品,价格都在15000元左右,像13799元的零刻GTR9 Pro、14999元的极摩客EVO-X2等等,价格都非常亲民。

而GB10 Grace Blackwell相比之下就没有太大的价格优势了,比如近期上市的Dell Pro Max With GB10,其价格高达45844.1元。价格最低的华硕NVIDIA Ascent GX10也要32999元起,购机成本和采购成本瞬间拔高,并非普通个人开发者或小企业用户所能承担。同时,受限于系统生态,GB10 Grace Blackwell所能够兼容的应用场景也很有限,比如除了专业开发,很难兼顾日常的Windows系统下的办公、创作等应用。

那么更加昂贵的GB10 Grace Blackwell是否有着大幅领先锐龙AI Max+ 395的性能呢?笔者从Youtube上找到了Youtuber@BijanBowen的测试数据,具体如下:

@BijanBowen测试了Llama3.3 70B、Qwen3 Coder、GPT-OSS 20B以及Qwen3 0.6B四款大语言模型,其中Qwen3 Coder以及Qwen3 0.6B的生成速度上,GB10 Grace Blackwell确实更快,但领先优势并不明显;而Llama3.3 70B、GPT-OSS 20B则比锐龙AI Max+ 395平台还要慢一些,在TTFT首Token生成速度上,锐龙AI Max+ 395也有优势。DGX Spark的价格还要比Strix Halo贵1~2倍,AI大模型生成速度却没有相应的优势体现,可见锐龙AI Max+ 395平台整体的“单位价格性能比”更高,对于用户而言显然是更超值的选择。
·结语
其实对于个人AI开发者以及中小企业用户来说,选择AI终端设备的核心需求无外乎就是低门槛和高性价比,锐龙AI Max+ 395与其同样理念设计的GB10 Grace Blackwell相比,从硬件兼容性、系统生态再到单位价格的性能转化比,再到终端产品的泛用性、扩展性方面,无疑都有着相当显著的优势。正是锐龙AI Max+ 395的出现,才让x86 Windows这一原本就门槛非常低的AI开发、应用环境变得门槛更低,一台MiniAI工作站就能完成AI大模型的训练、调试和优化,而且相关的框架、库、应用都极为完善,再加上锐龙AI Max+ 395自身CPU+GPU+NPU的三大AI计算引擎加持,充分满足了用户既能跑通基础模型,又能支撑后续进阶AI学习和开发的需求。而且其15000元左右的价格,相对于价格32999元起的GB10 Grace Blackwell新品来说,价格优势、TCO优势更加明显,更值得个人AI开发者以及中小企业用户选购。
同时,锐龙AI Max+ 395借助创新的Zen5架构以及x86 Windows生态,有着极为出色的泛用性,覆盖AI开发、文档办公、视频剪辑、3D渲染、游戏等多元应用生态,相比ARM Linux生态的单一性,前者显然更符合大众用户的“一机多用途”购机理念。
版权声明
本文仅代表作者观点,不代表本站立场。
 枣庄零距离
枣庄零距离




