AI预测极端天气提速5000倍!微软发布Aurora,借AI之眼预测全球风暴
个人类有历史以来,就一直执着于预测天气,以各种方式破解“天空之语”,我们慢慢发现,草木、云层似乎与天气有关,这不仅仅是因为人类从事生产的需要,也是人类想要对着大风歌唱、在月光下吟诗的需要。
《冰与火之歌》中的风雨歌师,就是通过歌声和吟唱来预测天气和风暴,人们还会幻想拥有“改变天气”的超能力。
最近,天气专家和气象预报已经让我们开始终于还是不能脱离具身体验和物理世界,但现在,AI让情况起了变化。
微调内容: 微软发布首个大规模大气基础模型Aurora,能够从数据中学习并做出预测,展现出了惊人的准确率和效率。
变化不仅仅是一家公司带来的,而是全球性的。
世界顶尖的数值天气预报组织——欧洲中期天气预报中心维护着一个极其丰富的数据集,给AI天气预报提供了强有力的数据支撑。这个数据集包含了欧洲及周边国家和地区的大气、海洋、陆地等多个维度的数据信息。这些数据经过精密的观测、分析和模型计算,形成了
在未来,或许无需物理学,一台计算机就可以捕捉全球的「风云变幻」。
影响不止于此,如果我们已经可以用AI预测全球天气,「建模」地球还会远吗?
微软发布首个大规模大气基础模型
全球极端天气事件频发,在突如其来的风暴面前,人类显得尤为渺小。
人们总是担心极端天气,暴露了当前天气预报模型的局限性,并凸显了在气候变化面前进行更准确预报的必要性。
一个紧迫的问题出现了:我们如何才能更好地预测此类极端天气事件并做好准备?
Charlton Perez等人最近的一项研究强调,即使是最先进的人工智能天气预测模型,在捕捉风暴的快速增强和峰值风速方面也面临挑战。
为了帮助应对这些挑战,微软的一个研究团队开发了Aurora,Aurora意为「极光」,这是一个尖端的人工智能基础模型,可以从大量的大气数据中提取有价值的见解。
图片
论文地址:https://www.microsoft.com/en-us/research/publication/aurora-a-foundation-model-of-the-atmosphere/
Aurora提供了一种新的天气预报方法,可以改变我们预测和减轻极端事件影响的能力。
灵活的3D大气基础模型
图片
在预训练时,Aurora会进行优化,以便在具有不同分辨率、变量和压力水平的多个异构数据集上最大限度地减少损失。分两个阶段对模型进行微调:(1) 短时间内对预训练的权重进行微调;(2) 使用低秩自适应性(LoRA)进行长前置时间(rollout)微调。微调后的模型将用于处理不同分辨率的各种业务预报情况
虽然参数量只有1.3B,但Aurora在超过一百万小时的各种天气和气候模拟中进行了训练,这使它能够全面了解大气动力学。
因此,即使在数据稀缺地区或极端天气情况下,该模型也能出色地完成各种预测任务。
通过在0.1°(赤道约 11 公里)的高空间分辨率下运行,Aurora能够捕捉大气过程的复杂细节,提供比以往任何时候都更加准确的业务预报,而计算成本仅为传统数值天气预报系统的一小部分。
据研究人员估计,与数值预报系统界的SOTA——综合预报系统(Integrated Forecasting System,IFS)相比,Aurora的计算速度提高了约5000倍。
除了令人惊叹的准确性和效率之外,Aurora还以其多功能性而脱颖而出。
该模型可以预测广泛的大气变量,从温度、风速到空气污染水平和温室气体浓度。
Aurora的架构设计可处理异构黄金标准输入,并生成不同分辨率和保真度级别的预测。
该模型由一个灵活的3D Swin Transformer和基于Perceiver的编码器和解码器组成,能够处理和预测一系列跨空间和压力级别的大气变量。
通过对大量不同数据的预训练和对特定任务的微调,Aurora学会了捕捉大气中错综复杂的模式和结构,使其在针对特定任务进行微调时,即使训练数据有限也能表现出色。
快速预测大气化学和空气污染
图片
Aurora在许多目标上都优于运行中的CAMS:(a) 与CAMS分析相比,Aurora预测的二氧化氮柱总量样本;(b) Aurora相对于CAMS 的纬度加权均方根误差(RMSE),负值(蓝色)表示 Aurora 更好
由于大气化学、天气模式和人类活动之间复杂的相互作用,以及哥白尼大气监测服务(CAMS)数据的高度异构性,这是一项众所周知的艰巨任务。
Aurora利用其灵活的编码器-解码器架构和关注机制,有效地处理和学习这些具有挑战性的数据,捕捉空气污染物的独特特征及其与气象变量的关系。
这使得Aurora能够以0.4°的空间分辨率生成精确的五天全球空气污染预报,在74%的所有目标上都优于最先进的大气化学模拟,证明了它在解决各种环境预报问题方面的卓越适应性和潜力,即使在数据稀少或高度复杂的情况下也是如此。
数据多样性和模型缩放改善了大气预报
研究还发现,与在单一数据集上进行的训练相比,在不同数据集上进行的预训练能显著提高Aurora的性能。
通过整合气候模拟、再分析产品和业务预测的数据,Aurora可以学习到更强大、更通用的大气动力学表征。
正是由于其规模和多样化的预训练数据集,Aurora能够在各种任务和分辨率下超越最先进的数值天气预报模型和专门的深度学习方法。
图片
图片
图片
在不同数据上进行预训练并扩大模型规模可提高性能,模型大小每增加一倍,训练损失就会减少5%
Aurora规模化直接带来的是,无论是在架构设计和训练数据语料库,还是预训练和微调协议方面,其性能都优于最好的专业深度学习模型。
为了进一步验证在多个数据集上预训练大型模型进行微调的收益,微软团队将Aurora与GraphCast进行了比较,后者仅在ERA5上进行了预训练,目前被认为是分辨率为0.25度、预测时间长达五天的最熟练的人工智能模型。
此外,研究人员还将IFS HRES(数值天气预报的黄金标准)也纳入了比较范围。
结果表明,在与分析、气象站观测和极端值进行比较时,Aurora 的表现都要优于GraphCast和IFS HRES。
图片
图片
图片
在绝大多数目标上,Aurora的性能都优于GraphCast
地球系统建模的范式转变
Aurora的影响远远超出了大气预报。
通过展示基础模型在地球科学中的力量,这项研究为开发涵盖整个地球系统的综合模型铺平了道路。
基础模型能够在数据稀缺的情况下出色地完成下游任务,这将使数据稀缺地区(如发展中国家和极地地区)获取准确天气和气候信息的途径更加民主化。
这将对农业、交通、能源采集和备灾等部门产生深远影响,使社区能够更好地适应气候变化带来的挑战。
无需物理学?AI天气预报进展巨大
变化来得太快,就像龙卷风,天气预报界正在经历重大变革。
最终的目标是革命性的:运用基于AI的新方法,在桌面计算机上就可以运行天气预报!
在过去的18个月里,天气预报成为了一个最有前途的AI应用,最近的进展在气象学界引起了巨大反响。
这要归功于一个秘密武器:一个极其丰富的数据集。
欧洲中期天气预报中心(ECMWF),世界顶尖的数值天气预报组织,维护着一套关于大气、陆地和海洋天气的数据集,每天在全球各地每隔几个小时记录一次,数据可以追溯到1940年。
图片
特别是过去50年的数据,在全球卫星覆盖之后,尤其丰富。这个数据集被称为ERA5,并且是公开可用的。
ERA5并非专门为人工智能应用而创建,但ERA5却为人工智能天气应用的发展发挥了巨大作用。
计算机科学家直到2022年才真正开始认真使用这些数据来训练人工智能模型,以预测天气。
从那时起,这项技术取得了突飞猛进的发展。在某些情况下,这些模型的输出结果已经优于科学家们花费数十年时间设计和建立的全球天气模型,而且运行那些模型还需要一些世界上最强大的超级计算机。
欧洲气象中心ECMWF人工智能预报工作负责人Matthew Chantry在接受采访时表示,「很明显,机器学习是未来天气预报的重要组成部分。」
ECMWF正在招聘人才来开发基于机器学习的地球系统模拟
AI天气预报的起源
大约6年前,一些使用基于神经网络的深度学习技术进行天气预报的早期学术研究就开始了。
起初,计算机科学家们对这一方法是否奏效并不十分乐观,因为它与几十年来发展起来的天气预报科学大相径庭。
时间来到2022年,人们才稍微放下了对AI模型的怀疑。
先是物理学家和数据科学家Ryan Keisler,利用「图神经网络」展示了一些初步的成果。
图片
论文地址:https://arxiv.org/abs/2202.07575
随后,中国科学家提出的「Pangu-Weather」模型,直接登上了Nature。
结果显示,它在某些情况下甚至超过了当今最强的基于物理的模型——ECMWF。
图片
论文地址:https://www.nature.com/articles/s41586-023-06185-3
这在使用深度学习技术和天气建模的科学家社区中引起了震动。
很快,欧洲科学家开始基于其他深度学习模型的研究成果制作一个操作模型,这并没有花费太长时间。
到去年年底,新的人工智能综合预报系统(AIFS)已经产生了「非常有希望」的结果。今年春天,欧洲预报员开始发布实时预报。
目前,基于物理的天气模型依然不可或缺。它们是非常强大的工具,显着提高了我们对重大事件进行五天、七天甚至偶尔十天天气预报的能力,受到全球预报员的信赖。
但未来会是什么样子呢?可能在十年之后,AI将会掌管天气领域的一切。
参考资料:
以上是AI预测极端天气提速5000倍!微软发布Aurora,借AI之眼预测全球风暴的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

想象一下,一个人工智能模型,不仅拥有超越传统计算的能力,还能以更低的成本实现更高效的性能。这不是科幻,DeepSeek-V2[1],全球最强开源MoE模型来了。DeepSeek-V2是一个强大的专家混合(MoE)语言模型,具有训练经济、推理高效的特点。它由236B个参数组成,其中21B个参数用于激活每个标记。与DeepSeek67B相比,DeepSeek-V2性能更强,同时节省了42.5%的训练成本,减少了93.3%的KV缓存,最大生成吞吐量提高到5.76倍。DeepSeek是一家探索通用人工智

本月初,来自MIT等机构的研究者提出了一种非常有潜力的MLP替代方法——KAN。KAN在准确性和可解释性方面表现优于MLP。而且它能以非常少的参数量胜过以更大参数量运行的MLP。比如,作者表示,他们用KAN以更小的网络和更高的自动化程度重现了DeepMind的结果。具体来说,DeepMind的MLP有大约300,000个参数,而KAN只有约200个参数。KAN与MLP一样具有强大的数学基础,MLP基于通用逼近定理,而KAN基于Kolmogorov-Arnold表示定理。如下图所示,KAN在边上具

特斯拉机器人Optimus最新视频出炉,已经可以在厂子里打工了。正常速度下,它分拣电池(特斯拉的4680电池)是这样的:官方还放出了20倍速下的样子——在小小的“工位”上,拣啊拣啊拣:这次放出的视频亮点之一在于Optimus在厂子里完成这项工作,是完全自主的,全程没有人为的干预。并且在Optimus的视角之下,它还可以把放歪了的电池重新捡起来放置,主打一个自动纠错:对于Optimus的手,英伟达科学家JimFan给出了高度的评价:Optimus的手是全球五指机器人里最灵巧的之一。它的手不仅有触觉

本站8月14日消息,在今天的8月补丁星期二活动日中,微软发布了适用于Windows11系统的累积更新,包括面向22H2和23H2的KB5041585更新,面向21H2的KB5041592更新。上述设备安装8月累积更新之后,本站附上版本号变化如下:21H2设备安装后版本号升至Build22000.314722H2设备安装后版本号升至Build22621.403723H2设备安装后版本号升至Build22631.4037面向Windows1121H2的KB5041585更新主要内容如下:改进:提高了

6月3日消息,微软正在积极向所有Windows10用户发送全屏通知,鼓励他们升级到Windows11操作系统。这一举措涉及了那些硬件配置并不支持新系统的设备。自2015年起,Windows10已经占据了近70%的市场份额,稳坐Windows操作系统的霸主地位。然而,市场占有率远超过82%的市场份额,占有率远超过2021年面世的Windows11。尽管Windows11已经推出已近三年,但其市场渗透率仍显缓慢。微软已宣布,将于2025年10月14日后终止对Windows10的技术支持,以便更专注于

为了将大型语言模型(LLM)与人类的价值和意图对齐,学习人类反馈至关重要,这能确保它们是有用的、诚实的和无害的。在对齐LLM方面,一种有效的方法是根据人类反馈的强化学习(RLHF)。尽管RLHF方法的结果很出色,但其中涉及到了一些优化难题。其中涉及到训练一个奖励模型,然后优化一个策略模型来最大化该奖励。近段时间已有一些研究者探索了更简单的离线算法,其中之一便是直接偏好优化(DPO)。DPO是通过参数化RLHF中的奖励函数来直接根据偏好数据学习策略模型,这样就无需显示式的奖励模型了。该方法简单稳定

在软件技术的前沿,UIUC张令明组携手BigCode组织的研究者,近日公布了StarCoder2-15B-Instruct代码大模型。这一创新成果在代码生成任务取得了显着突破,成功超越CodeLlama-70B-Instruct,登上代码生成性能榜单之巅。 StarCoder2-15B-Instruct的独特之处在于其纯自对齐策略,整个训练流程公开透明,且完全自主可控。该模型通过StarCoder2-15B生成了数千个指令,响应对StarCoder-15B基座模型进行微调,无需依赖昂贵的人工标注数

写在前面&笔者的个人理解这篇论文致力于解决当前多模态大语言模型(MLLMs)在自动驾驶应用中存在的关键挑战,即将MLLMs从2D理解扩展到3D空间的问题。由于自动驾驶车辆(AVs)需要针对3D环境做出准确的决策,这一扩展显得尤为重要。3D空间理解对于AV来说至关重要,因为它直接影响车辆做出明智决策、预测未来状态以及与环境安全互动的能力。当前的多模态大语言模型(如LLaVA-1.5)通常仅能处理较低分辨率的图像输入(例如),这是由于视觉编码器的分辨率限制,LLM序列长度的限制。然而,自动驾驶应用需
