Bergey进一步强调,跟着AI模型应用的词元(token)数量赓续增长,降低单义务成本的关键在于采取大年夜型端侧模型,从而更高效地应用词元。这不仅带来了更低、可猜测的成本,也为用户和企业供给了更好的数据隐私保障。

Bergey指出,智能体AI催生了两类广泛的算力需求:一是卓越能效,以支撑全天续航与高效临盆力;二是极致机能,知足先辈AI负载、内容创作、软件开辟及本地推理的须要。

Bergey认为,全新基于Arm架构的NVIDIA RTX Spark恰是回应这些需求的关键产品。

据懂得,在COMPUTEX 2026上宣布的RTX Spark,集成了基于Arm架构的NVIDIA Grace CPU与NVIDIA Blackwell RTX GPU,并采取完全同一的内存架构。

NVIDIA产品治理副总裁Kaustubh Sanghani表示,要实现响应敏捷的端侧AI体验,智能体须要对GPU、CPU与内存架构进行深度集成与优化,而RTX Spark恰是这一理念的实践。


点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部