据懂得,这并非美团初次收紧外部大年夜模型应用门槛。本年4月,美团对内部大年夜模型应用做出调剂,不再推荐营业应用阿里云供给的Qwen模型。若营业仍需应用,需提交具体应用原因,上报至X3级别(老板级)进行审批。

公开信息显示,LongCat是美团自立研发的大年夜说话模型,2023年启动研发,已开源并深度应用于美团内部多项营业场景,包含APP内置AI助手“小团”、商家经营助手等。

近日,美团宣布新一代万亿参数大年夜模型LongCat-2.0,并将对外开源。作为在五万卡国产算力集群上完成全流程练习与推理的万亿参数模型(总参数1.6T,平均激活约48B,动态范围33B~56B),LongCat-2.0预练习数据范围跨越30T tokens,覆盖中文、英文、多说话和代码等多类数据,原生支撑1M超长高低文。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部