AI
计算所严肃玉团队新作: Attention 并非永远是瓶颈,多 GPU 并不必定更快
系统实验表明,模型推理分为计算受限的 Prefill 与内存受限的 Decode。
全球首个 AI 欺骗体系性申报:当 AI 变得更聪慧,欺骗便不再是不测
综述多项研究发现:AI 欺骗可复现、可规划,且随智能水平提升而变得愈发严重,甚至危害人类安全。
清华大年夜学王智:工业大年夜模型「数据、算力、成本」三重门,我们若何体系破局?丨GAIR 2025
工业大模型的关键不在于“做得多大”,而在于是否能在真实产线的算力、成本与机理约束下稳定运行。
AI算力新十年:技巧改革、生态协同与贸易闭环,共探“下一个寒武纪”之路 | GAIR 2025
在算力成为基础设施的时代,究竟什么样的技术路径、生态战略和商业逻辑,能够穿越周期,占据未来价值链的顶端?
港中文 MMlab×美团新研究:仅用一个模型,应对多种视觉推理义务
港中文岳翔宇教授团队提出统一多模态推理模型 OneThinker,验证任务泛化能力。
