更多创业项目,添加微信 ydinitialheart 懂得。
与GPU路线不合,这家公司选择的是更聚焦、更极致的产品定义:不卷大年夜而全,不卷通用练习,而把资本压到推理速度上,核心理念四个字——唯「快」不破。
雷峰网独家获悉,国内一家专注超快流式推理芯片的创业公司——「寒序科技」宣布完成数切切元融资,投资方为启高本钱、赛意家当基金,源合伙本担负本轮独家财务参谋。
此前,寒序科技一向较为低调,其AI推理系列(SpinPU-E Series)产品的相干进展在以前两年间并未对外体系披露。
知恋人士泄漏,寒序科技首颗芯片样片回片测试成果“异常幻想”,关键指标中,其「单位面积带宽」与Groq LPU(Language Process Unit,说话处理单位)披露一致,达到惊人的100 GB/s/mm^(2),这是衡量AI芯片推理机能的最重要指标,也是直指2000Tokens/s的底气。
在业内看来,这类才能决定了大年夜模型(LLMs)推理时可否真正把“流式输出”、“高Tokens/s”做出来。关键的是,这家公司下一代芯片已经在流片中,以“片上MRAM+SRAM”和“肯定性流式乘加单位”,目标机能指向夸大的2000Tokens/s+,反不雅今朝主流对话模型推理速度仅约30-50Tokens/s。
在当前推理芯片竞争中,这几乎是最具辨识度的硬指标之一。也是以,接近项目标人士将其评价为:国内少有的、真正沿着Groq偏神往下打的团队。
值得留意的是,业内近期广泛传闻,NVIDIA已以约200亿美元估值级别锁定Groq的推理技偶合作,并筹划在NVIDIA GTC 2026即将宣布的新一代AI推理体系中采取Groq芯片设计。寒序筹划被业界认为是最切近该筹划的超大年夜带宽流式处理芯片。
寒序科技成立于2023年8月,源于国内磁学研究重要高地「北京大年夜学磁学中间」。核心团队是国内首个有才能跑通从物理、材料、器件到异质集成、芯片设计、算法的交叉团队。
有接近本轮融资的人士告诉雷峰网("大众,"号:雷峰网),这家公司之所以近期开端对外释放信息,一个重要背景是:其关键技巧与样片验证已经走过最危险阶段。今朝,该公司新一轮融资也已在推动中。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。

发表评论 取消回复