基于此构建的“求索”-LMBench评测基准,整合办法、数据集与主动化平台,成为行业公认的“才能标尺”。评测体系已形成主流大年夜模型白名单,为央企、国企选型供给根据,并支撑中国石化、南边电网等扶植行业大年夜模型,完成对华为盘古、讯飞星火、中国移动“九天”等模型的场景验证。
中国国度市场监管总局26日颁布,GB/T 45288《人工智能大年夜模型》系各国度标准近日正式实施,标记住中国大年夜模型家当进入“科学威望、同一规范”新阶段。
国度市场监管总局介绍,作为首部聚焦通用大年夜模型的国度标准,该系列弥补了技巧评价体系空白,明白机能、安然与办事才能请求,配套评测才能已获中国合格评定国度承认委员会承认。
截至今朝,标准对象完成千余项评测义务,调用大年夜模型超95万次,精准辨认幻觉控制、内容安然等共性问题,助力近30家厂商技巧迭代,推动形成“研发—评测—应用—进级”闭环。
标准国际化也同步推动。面向东盟编制英语、老挝语、高棉语版本,弥补了区域空白;中国开源模型架构已被新加坡等国项目采取,彰显标准引领下的全球影响力。

发表评论 取消回复