はじめに
前回、結構いい結果が出ました。
今回はディズニーランドとシーを合わせた待ち時間の予測と関係性について調べたいと思います。
舞浜のディズニーの全てがどのように関係しているかを求めることに今回のゴールを置きました。
扱うデータについて
ディズニーランドの待機時間の情報を取得する際、13時、14時、15時の値を収集しています。
しかし、今回から14時のみに絞ることにしました。
理由はOpenWeatherAPIの天気の値を取得するときに1日に3回分のデータをとると、APIの上限にすぐに達してしまうからです。
あと、今回はデータの値を少しだけ増やしました。
2024年の1月~2025年の4月まで。(今までよりも1ヶ月分多いです)
nanを除くと学習の際のデータは323しかありませんでした。
試しに1つのアトラクションで見てみる
まず試しに1つのアトラクションについて見てみます。
ディズニーランドにある「美女と野獣」です。
学習にはランダムフォレストを用います。
学習結果としては以下になります。
学習データに対する回帰への評価(RMSEの値): 5.3749181984040355 学習データに対する決定係数: 0.9757791319641463 テストデータに対する回帰への評価(RMSEの値): 11.869864071543661 テストデータに対する決定係数: 0.8991404189663718
少ない結果にも関わらず結構いい結果が出ますね。
重要度については以下のような結果になりました。
happy_ride : 0.3945007793769587
monsters_inc : 0.30513225709330033
star_tuors : 0.05917954395115428
splash_mountain : 0.03149555810868645
soaring : 0.029392819812828153
feels_like : 0.02332145440503908
dew_point : 0.022152645526708307
minnie_style_studio : 0.020722051881870013
temp : 0.017187367620843278
mickey_house : 0.010077325478640051
それぞれ以下に該当します。
- happy_ride:ベイマックス ハッピーライド(ディズニーランド)
- monsters_inc:モンスターズインク(ディズニーランド)
- star_tuors:スター ツアーズ(ディズニーランド)
- splash_mountain:スプラッシュマウンテン(ディズニーランド)
- soaring:ソアリン(ディズニーシー)
- feels_like:人間の感じる温度(天気の値)
- dew_point:結露し始める点(天気の値)
- minnie_style_studio:ミニーのスタイルスタジオ(ディズニーランド)
- temp:気温(K)(天気の値)
- mickey_house:ミッキーの家 ミートミッキー(ディズニーランド)
ランドとシーの重要度のネットワーク図
ランドとシーを合わせた重要度のネットワーク図は以下のようになっています。

ノード間のエッジの太さ太い方がノードの待ち時間に影響していることになります。
ディズニーランドとディズニーシーのスポットで見ると、
- レイジングスピリッツ(シー)とスプラッシュマウンテン(ランド)がかろうじて関係ありそう
- ソアリン(シー)とモンスターズ インク(ランド)がちょっと関係してそう
ぐらいですかね。
シーとランドで目立って関係がありそうなスポットは特になそうですね。。。
最後に
ディズニーランドとディズニーシーのスポットで影響度のハブの役割をしているスポットほんの少しだけありました。
ディズニーシーかディズニーランドいずれかに天気のデータに大きく影響するスポットがあれば、それを起点にして他のスポットの待ち時間も予測できる糸口になる予定でしたが、あまりいいとは言えない結果になりました。
データを増やしていけば変わるのかな。