nVIDIA

NVIDIA创造新技巧KVTC 内存应用量缩减20倍

NVIDIA研究人员推出一项全新技术KVTC(KV快取转换编码),能把大型语言模型(LLM)追踪对话历史的内存用量,最高缩减20倍,而且不用修改模型本身。这一突破有望解决大型语言模型长对话推理时的内存不够用问题,大大降低企业使用AI的硬件成本,同时还能把模型首次生成回应的时间,最高提速8倍。

NVIDIA中国特供版专业显卡RTX 6000D初次拆解

除了AI加速卡对华禁售,NVIDIA、AMD的高端工作站显卡也同样如此,于是也出现了不少特供版,比如最新的RTX6000D,就是在RTXPRO6000Blackwell的基础上阉割而来。不过根据坊间传闻,这块卡在中国根本没有市场,并没有客户要它,着实尴尬。

马斯克再评论英伟达主动驾驶AI:为汽车行业供给有效的对象

一位网友询问自动驾驶技术大神JamesDouma:“对于英伟达Alpamayo自动驾驶AI的发布,特斯拉应该感到担忧吗?”Douma回应称:“不,这不会对FSD构成竞争,就像乐高发布一套太空穿梭机模型并不意味着会对‘猎鹰9号’火箭构成竞争一样。英伟达发布了多代ADAS(高级驾驶辅助系统)开发套件及开发工具,用于ADAS系统。这些并非真正的ADAS系统,而是用于帮助启动ADAS开发流程的工具。

AI云公司Nebius获英伟达20亿美元投资 股价单日飙涨两位数

周三(3月11日)美股盘中,人工智能云公司NebiusGroup涨近14%,先前英伟达宣布将向该公司投资20亿美元。英伟达在官网宣布,两家公司建立战略合作伙伴关系,共同开发和部署面向人工智能(AI)市场的下一代超大规模云,服务对象涵盖AI原生开发者和企业用户。

NVIDIA辟谣RTX 50系列停产:全系正常供给 缺货是显存供给拖后腿

近日,关于NVIDIAGeForceRTX5070Ti等型号已停产的消息在网上传得沸沸扬扬,甚至有媒体援引华硕内部人士称相关产品已被列入EOL(生命周期结束)。对此,权威媒体Wccftech联合多方信源调查后确认:RTX50系列全线产品均未停产,也无任何型号被取消或降级计划。

英伟达寻求推动打造面向汽车与机械人范畴的“安然版”Linux内核

英伟达正试图为汽车、机器人等安全关键场景打造可满足功能安全认证要求的“安全版”Linux内核,并将当前重点放在满足汽车功能安全标准中的ASIL-B等级上。英伟达工程师IgorStoppa本月早些时候在LinuxPlumbersConference(LPC)上发表演讲,直指上游Linux内核在安全关键应用中的不足,以及围绕ASIL认证所面临的技术与流程挑战。

NVIDIA DGX Spark支撑4台集群组网 机能线性飙升

NVIDIA宣布,DGXSpark迎来全新功能,现已支持最多4台设备集群组网,从而搭建紧凑型的“桌面数据中心”。被大家昵称“小金盒”的DGXSpark单台具备1千万亿次每秒的AI算力,搭配128GBLPDDR5X统一内存,四台并行就具备4千万亿次的算力和512GB统一内存。

NVIDIA黄仁勋回应超等PC处理器N1:低耗高能、AI强大年夜

NVIDIA去年底正式上市了DGXSpark迷你AI超算,使用的是一款超级SoC处理器GB10,之后还会有针对桌面电脑打造的N1系列处理器,黄仁勋日前也谈到了这款芯片的进展。黄仁勋表示他们跟联发科合作打造了一款高能效SoC处理器,功耗很低,但能效会很强。

英伟达已按此前协定购买了50亿美元英特尔股票

美国半导体公司英特尔周一在一份文件中表示,英伟达已按照9月份宣布的交易,购买了价值50亿美元的英特尔股票。这家领先的人工智能芯片设计商在9月份曾表示,将以每股23.28美元的价格收购英特尔普通股。在经历了多年的失误以及资本密集型产能扩张耗尽其财务资源后,这笔交易被视为对英特尔的重要财务支持。

NVIDIA表态:没放弃64位计算

这两年AI爆发,它不仅影响了AI产业,实际上还在改变了芯片发展的方向,但是这个方向对HPC、科学计算来说可不一定是好事。这是因为NVIDIA近年来已经把AI性能作为一切的核心,计算精度实际上是不断降低的,以前大家比较GPU性能可能还会计算有FP64、FP32这两个核心指标,如今AI时代,FP16、FP8及FP4才是重点。