计算所严肃玉团队新作: Attention 并非永远是瓶颈,多 GPU 并不必定更快 系统实验表明,模型推理分为计算受限的 Prefill 与内存受限的 Decode。 互联网 2025年12月22日 0 点赞 0 评论 91 浏览
清华大年夜学王智:工业大年夜模型「数据、算力、成本」三重门,我们若何体系破局?丨GAIR 2025 工业大模型的关键不在于“做得多大”,而在于是否能在真实产线的算力、成本与机理约束下稳定运行。 互联网 2025年12月19日 0 点赞 0 评论 140 浏览
AI算力新十年:技巧改革、生态协同与贸易闭环,共探“下一个寒武纪”之路 | GAIR 2025 在算力成为基础设施的时代,究竟什么样的技术路径、生态战略和商业逻辑,能够穿越周期,占据未来价值链的顶端? 互联网 2025年12月19日 0 点赞 0 评论 112 浏览
之江实验室薛贵荣:当AI开端做科研,我看到了大年夜说话模型的天花板丨GAIR 2025 “大语言模型受限于「语言的边界」,无法理解高维度、跨模态的科学数据。 ” 互联网 2026年01月01日 0 点赞 0 评论 126 浏览