
Rothenberg 还表示,应用大年夜说话模型把文字论述转化为构造化定量数据的思路,并不局限于山洪。 将来类似技巧有望被用来构建关于热浪、泥石流等同样短暂却极其重要的天然现象的数据集,为更多极端气象和地质灾害的猜测供给基本。
为弥补这一数据缺口,Google研究团队动用了其大年夜说话模型 Gemini,从全球范围内筛选约500万篇消息报道,主动辨认并提掏出约260万次不合的洪灾事宜,再将这些文字报道转化为带有时光与地舆标记的序列数据集“Groundsource”。 Google研究产品经理 Gila Loike 表示,这是公司初次应用大年夜型说话模型来完成这类定量数据构建工作,相干研究成果和数据集已于周四早间公开宣布。
传统气候监测积聚了大年夜量温度、降雨量、河道流量等数据,但对于突发性极强的山洪事宜,人类并没有像其他气候要素那样完全、持续的不雅测记录。 这导致即便深度进修在气象预告范畴越来越强大年夜,也迟迟无法在山洪猜测上发挥一致程度,因为缺乏足够的“真值”数据来练习模型。
在获得这一“实际世界基线”之后,研究人员基于长短期记忆(LSTM)神经收集练习了新的山洪猜测模型,让其输入全球气象预告数据,输出特定区域产生山洪的概率。 今朝,Google的山洪猜测模型已在其 Flood Hub 平台上为150个国度的城市区域供给风险提示,并向全球多家应急治理机构开放数据。 南部非洲成长合营体(SADC)的一位应急响应官员 António José Beleza 在与Google合作试用中表示,该模型赞助他的团队能更快对洪灾作出响应。
不过,这套体系仍有明显局限。 一方面,它的空间分辨率相对较低,今朝只能在约20平方公里的标准上给出风险评估;另一方面,因为没有纳入本地雷达等及时降水监测数据,其精度尚不及美国国度气候局现有的洪水预警体系。

Google方面强调,这一项目标初志之一,就是要在那些缺乏昂贵气候不雅测基本举措措施、又没有经久气候记录的成长中地区发挥感化。 经由过程聚合来自全球的数百万条消息报道,Groundsource 数据集在必定程度上“从新均衡了地图”,使模型可以或许对本来数据稀缺的地区进行外推猜测。 Google韧性团队项目经理 Juliet Rothenberg 称,这种做法让团队得以覆盖此前信息严重不足的区域。
在业内人士看来,Google这一测验测验是经由过程创造性数据汇集来推动深度进修惯象预告成长的重要一步。 Upstream Tech 公司 CEO Marshall Moutenot(该公司同样应用深度进修为水电企业等客户猜测河道流量)指出,当前地球科学范畴面对“数据稀缺”这一恶疾:一方面地球不雅测数据极其复杂,另一方面真正能用来校准和验证模型的高质量“真值”却十分有限。 Moutenot 也是 dynamical.org 的结合开创人,该组织致力于为研究人员和始创企业整顿可直接用于机械进修的气象数据集,他认为Google此次工作是经由过程“异常有创意的办法”来获取宝贵数据的典范案例。

发表评论 取消回复