①研究の背景
日本AIアスリート選手権での経験を活かし、
「コロナウイルスの予測モデル」
を自分で作ってみたいと思いました。
②仮説とねらい
感染者のデータセットは、インターネット上に多く存在しています。
そのため、予測する材料にしやすく、
予測の仕方なども調べやすいと思いました。
③研究内容
コロナウイルスの推移を予測して、
視覚的にわかりやすい予測モデルを作成します。
④技術的知識
政府統計から、予測するのに必要なデータセットをGoogle Driveに持ってきます。
その後、Google Colaboratory と
呼ばれる実行環境でサンプルデータから機械学習を行います。
機械学習では、Light GBMと呼ばれるものを使用しています。精度が高く、予測するのが少し遅いです。
⑤これからの取組
予測精度を上げたり、実際の推移とを比較したグラフを作りたいです。
実際に作成したグラフです。とある日の感染者数を都道府県別に日本地図に現したものになります。
赤色が濃いものほど、※感染者数の割合が多く、東京や沖縄は特に※感染者数の割合が多いとわかります。
※「感染者数の割合」というのは、感染者数÷各都道府県の人数です。
東京の感染者数が多いことで赤色がうまく出ないのを防ぐために、割合となっています。
⑥まとめ
たくさんの要素(例えば、昼間人口や夜間人口のような)をいれることで、より精度の良い予測をしたいです。