天気予報の裏側をお伝えするシリーズ第2弾。実は、天気予報では約半世紀にわたって機械学習の技術が使われてきました。天気予報を作成する流れの中「ガイダンス」と呼ばれる過程で利用され、予報官や気象予報士が効率的に天気予報を行う上で、なくてはならない技術の一つです。ガイダンスは、コンピュータがシミュレーションした数値予報データをより使いやすい形に変換したり、補正をして予報精度を高めたりするために行います。今回は、この「ガイダンス」をテーマに天気予報が作られる過程の一部をご紹介してきたいと思います。
天気予報には”翻訳”が必要?天気予報のガイダンスとは
前回の記事でもお話しましたが、天気予報は、大きくは以下のような流れで作られています。
①観測データを収集する
②コンピュータを使って計算する(数値予報)
③出力された結果を補正・加工する(ガイダンス)
④それらのデータをもとに、予報官や気象予報士が予報する
今回は③の「ガイダンス」という過程について詳しく解説していきます。
天気予報のガイダンスとは、数値予報の結果を予報要素への翻訳や統計的な補正を行う処理、およびその結果作成される予測資料のことです。天気予報をガイド=支援することから「ガイダンス」と呼ばれるようになりました。
ガイダンスでは、大きく分けると「数値予報モデルでは直接計算していない要素や形に変換・加工すること」と「数値予報モデルの誤差を補正すること」の2つを行っており、前者のことを「天気の翻訳」といいます。「翻訳」というと、ある国の言語を他の国の言語に変換するというイメージが強いかもしれませんが、表現する形を変えるという意味もあります。
ガイダンスによる「翻訳」と「補正」、この2つが必要になる理由を、もう少し詳しくみていきましょう。
「翻訳」を行う理由は、数値予報モデルで計算するのはある時間の気圧、風、気温、湿度、降水量といった一部の要素だけになるため、数値予報で計算していない要素を計算する必要があるからです。例えば、天気、降水確率、降雪量、発雷確率などがそうです。
また、数値予報の結果はあくまで数値データの羅列でしかないため、天気予報をする上で使いやすい・見やすい形になるよう、最高・最低気温、最大瞬間風速といった極値や、気温や湿度の時系列データなどに加工してあげる必要があります。
一方で「補正」が必要になる理由は、数値予報の結果には誤差が含まれているからです。数値予報に誤差が生じる原因にはいくつかありますが、一貫性のある誤差(系統誤差)と、そうではない誤差(ランダム誤差)に分けることができます。
前者はいわゆるその数値予報モデルのクセのようなもので、統計的に「こういう時にはこうなりやすい」というだいたい決まった傾向があります。数値予報モデルと実際の地形の違いに起因するものがその一つで、例えば、数値予報では実際の地形よりもなめらかに地形が表現されがちな分、地形性の降水が弱く表現されたり、実際は陸である場所が海として扱われることで気温の日変化は緩く、風は強く表現されたりします。おおよその傾向が決まっているため、その傾向を考慮して補正してあげることができるというわけです。
図はその例で、A付近の風向が数値予報モデル(左上)では周辺と同じような風向・風速になってしまっていますが、ガイダンス(左下)によって実際の風(中下)に近い状態に補正できており、地形の複雑さによる風の変化を適切に表現できていることがわかります。
このように「ガイダンス」は、数値予報で作成したデータを、天気予報を行う上でより適切かつ使いやすくするための役割を担っています。
約50年前から機械学習を活用!天気予報ガイダンスの手法
天気予報のガイダンスには、AIの一分野である機械学習が使われています。気象庁でガイダンスの運用が始まったのが1977年なので、天気予報の世界では、実は約半世紀も前から機械学習が使われていたことになります。
「数値予報の翻訳や補正」を具体的にどうやっているかというと、過去の数値予報の予報結果と実際の観測データとの間で統計的な関係式を作成し、それを予測式として最新の数値予報の結果に適用することで翻訳や補正を行います。つまり、機械学習によって過去のデータからある一定のルールを見出すことで、その数式化したルールを最新の数値予報にあてはめて算出できるというわけです。
予測式の作成方法には、過去数年分のデータから予測式を算出する「一括学習型」と、数値予報を行うたびに毎回データを取り込んで予測式を更新する「逐次学習型」があります。
一括学習型の場合、常に同じ予測式を使い続けますが、数値予報モデルを更新した場合などは傾向が変化するため、数年分データを蓄積した上で予測式を更新しなければなりません。よってデータが蓄積されるまでの間、古い予測式を使い続けなければならず、精度が低下するという問題がありました。
その問題を解決する方法として1996年頃から逐次学習型が用いられるようになりました。日々学習するという面も含めて、逐次学習型の方が優位なように思えるでしょう。ただ、逐次学習型はモデルの変更や季節変化に柔軟に対応できる一方で、稀な現象は苦手だったり、予測式が常に変化するので予報官にとっては扱いにくいといった課題もあります。
そのほか、一括学習型と逐次学習型のメリット・デメリットを、簡単に表にまとめました。同じ機械学習といっても、こうしたメリット・デメリットに合わせて、要素ごとに一括学習型と逐次学習型を使い分けて運用しています。
さらに、一括学習型はロジスティック回帰、線形重回帰、診断手法、逐次学習型はニューラルネットワーク、カルマンフィルタと、手法ごとにさらに細かく分類することができます(表)。
線形重回帰は、逐次学習型が生まれるまでは最も多く使われていた手法です。現在の主流はカルマンフィルタやニューラルネットワークですが、確率予報ではロジスティック回帰が使われています。
一口に天気予報を翻訳や補正をするといっても、料理と同じように、ひとつひとつ素材(要素)の特性に合わせてやり方を変えているのです。
天気予報ガイダンスの課題
先ほど、天気予報のガイダンスでは、翻訳・補正するための手法を得意・不得意によって使い分けていることをお話しました。ただ、それでもやはりガイダンスではうまくできないこともあります。
ガイダンスでは系統的な誤差を補正していますが、逆に言えばランダムな誤差の補正はできません。例えば、前線や台風の位置のずれなどはガイダンスが苦手とする代表的なものです。これには風や水蒸気など複数の要因が絡み合って起こり、その都度影響する要因も異なります。系統誤差に代表される地形の違いのように明確な傾向が見いだせるもののみ、ガイダンスの補正は有効です。
また、逐次学習型の場合、変化に柔軟に対応できる分、もとのデータにエラーが含まれていると、それを反映して悪い方向に予測式が変わってしまい、予報精度が落ちてしまうという不安定さを抱えています。そのため、エラーが取り込まれないように常時監視を行う必要があります。
ガイダンスによる翻訳・補正は必ずしも万能ではありません。最終的には、これらの点を踏まえた上で、予報官や気象予報士が判断して天気予報を作成する必要があります。
AIが活躍する時代へ…天気予報ガイダンスの今後
天気予報のガイダンスは、約半世紀の間、機械学習の技術を用いて運用されてきました。第3次AIブームの今、天気予報でもAIの活用が始まっており、ガイダンスについても機械学習からより高度なAIにシフトしていくことが予想されます。
現に気象庁では、AIが予報時間や気象パターンに応じて最適な数値予報結果の組み合わせを算出する仕組みの開発を2030年に向けて行っています。これにより、現在予報官や気象予報士が行っている複数の数値予報モデルやガイダンスの結果をもとに、最適な天気予報を検討・発表するという過程(天気予報作成の流れ④)が置き換わる可能性があります。最初にもお伝えしたとおり、ガイダンスとはもともと天気予報の作成を支援するための資料を作成するためのものです。AI時代においては、ガイダンスが気象予報士たちを「支援」する範囲がさらに広がっていくことでしょう。
一方で、AIには根拠が不明な「ブラックボックス問題」があります。天気予報においては、予報精度が高いことはもちろんですが、防災や産業活動のリスクヘッジをする上では「なぜ、そう予想したのか」をきちんと説明できる根拠が重要です。
近年開発が進められている「説明可能なAI」といった技術を取り込んでいくか、根拠なども必要ないくらい確実で圧倒的な精度の高さをもつか…。「便利だから」だけではなく、こうした課題を踏まえた上で、AIを使って天気予報のガイダンスの範囲をどこまで拡張するのかが、今後大きな争点となりそうです。