東京ディズシーの待ち時間の関連性とランダムフォレストによる予測

スポンサーリンク
tech系(python)
スポンサーリンク

はじめに

前回まではディズニーランドのデータに対して分析してきました。

今回はディズニーシーです。

今まで、

を見てきました。

これらをディズニーシーで求めます。

天気とディズニーシーの待ち時間の関係

降水量と待ち時間の関係

各スポットの待ち時間と降水量の間の相関係数です。

降水量(mm) vs soaring: -0.14
降水量(mm) vs tower_of_terror: -0.09
降水量(mm) vs toy_story_mania: -0.11
降水量(mm) vs indiana_jones: -0.10
降水量(mm) vs raging_spirits: -0.23
降水量(mm) vs center_of_the_earth: -0.11
降水量(mm) vs disney_sea_plaza: -0.02
降水量(mm) vs village_greeting_place: -0.11
降水量(mm) vs trail_mickey: -0.15
降水量(mm) vs trail_minnie: -0.15
降水量(mm) vs trail_donald: -0.11
降水量(mm) vs saludos_amigos: -0.11
降水量(mm) vs magellan: -0.01
降水量(mm) vs ristorante_di_canaletto: 0.07
降水量(mm) vs ss_columbia_dining_room: -0.03
降水量(mm) vs teddy_roosevelt_lounge: -0.11
降水量(mm) vs restraunt_sakura: 0.02
降水量(mm) vs horizon_bay: -0.06

気温と待ち時間の関係

各スポットの待ち時間と気温の相関係数です。

気温(℃) vs soaring: -0.53
気温(℃) vs tower_of_terror: -0.53
気温(℃) vs toy_story_mania: -0.51
気温(℃) vs indiana_jones: -0.52
気温(℃) vs raging_spirits: -0.43
気温(℃) vs center_of_the_earth: -0.43
気温(℃) vs disney_sea_plaza: -0.10
気温(℃) vs village_greeting_place: -0.49
気温(℃) vs trail_mickey: -0.42
気温(℃) vs trail_minnie: -0.42
気温(℃) vs trail_donald: -0.37
気温(℃) vs saludos_amigos: -0.50
気温(℃) vs magellan: -0.05
気温(℃) vs ristorante_di_canaletto: -0.39
気温(℃) vs ss_columbia_dining_room: -0.27
気温(℃) vs teddy_roosevelt_lounge: -0.27
気温(℃) vs restraunt_sakura: -0.45
気温(℃) vs horizon_bay: -0.29

風速と待ち時間の関係

各スポットの待ち時間と風速の相関係数です。

風速(m/s) vs soaring: -0.13
風速(m/s) vs tower_of_terror: -0.12
風速(m/s) vs toy_story_mania: -0.16
風速(m/s) vs indiana_jones: -0.13
風速(m/s) vs raging_spirits: -0.10
風速(m/s) vs center_of_the_earth: -0.08
風速(m/s) vs disney_sea_plaza: -0.05
風速(m/s) vs village_greeting_place: -0.15
風速(m/s) vs trail_mickey: -0.10
風速(m/s) vs trail_minnie: -0.10
風速(m/s) vs trail_donald: -0.08
風速(m/s) vs saludos_amigos: -0.13
風速(m/s) vs magellan: -0.03
風速(m/s) vs ristorante_di_canaletto: -0.03
風速(m/s) vs ss_columbia_dining_room: -0.11
風速(m/s) vs teddy_roosevelt_lounge: -0.02
風速(m/s) vs restraunt_sakura: -0.06
風速(m/s) vs horizon_bay: -0.02

その日のイベントの数と待ち時間の関係

各スポットの待ち時間とイベント数の相関係数です。

event_num vs soaring: 0.05
event_num vs tower_of_terror: 0.01
event_num vs toy_story_mania: 0.00
event_num vs indiana_jones: 0.03
event_num vs raging_spirits: 0.05
event_num vs center_of_the_earth: 0.06
event_num vs disney_sea_plaza: 0.01
event_num vs village_greeting_place: 0.14
event_num vs trail_mickey: 0.17
event_num vs trail_minnie: 0.16
event_num vs trail_donald: 0.17
event_num vs saludos_amigos: 0.12
event_num vs magellan: -0.00
event_num vs ristorante_di_canaletto: 0.09
event_num vs ss_columbia_dining_room: 0.01
event_num vs teddy_roosevelt_lounge: -0.04
event_num vs restraunt_sakura: 0.07
event_num vs horizon_bay: 0.02

イベントのある時とない時の待ち時間で最も差が大きいのは「センターオブジアース」で、7.39 分です。

また、イベントのある日とない日との待ち時間の差は全体平均で2.52分です。

休日とそうじゃない日で待ち時間の差が最も大きいのはテディ・ルーズヴェルト・ラウンジです。

また全体の平均は4.11分です。

ランダムフォレストによる予測

今回対象にするアトラクションは「ソアリン:ファンタスティック・フライト」です。

コードはディズニーランド編を参照してください。

結果は以下になりました。

学習データに対する回帰への評価(RMSEの値): 6.120086086804094
学習データに対する決定係数: 0.9772310703511454
テストデータに対する回帰への評価(RMSEの値): 17.786518098375236
テストデータに対する決定係数: 0.789124207808569

結構、決定係数が大きいです。

グラフにすると以下のようになります。予測値と実測値の関係を表しています。

重要度をランキングで出力すると以下のようになりました。

indiana_jones :  0.6202000941982648
raging_spirits : 0.19481904987881374
気温(℃) : 0.031472344330733655
tower_of_terror : 0.024527830730512415
saludos_amigos : 0.0166287050114706
trail_mickey : 0.016587676965926886
ss_columbia_dining_room : 0.013733567146528038
village_greeting_place : 0.012767823753032499
trail_minnie : 0.012497658215946688
風速(m/s) : 0.011132754361942117
-----------
降雪(cm) : 0.0
風向_西 : 0.0
風向_静穏 : 4.089228814890743e-06
風向_西南西 : 8.252078747055199e-05
風向_東南東 : 0.00010164886997413514
風向_東 : 0.00013311917138748855
風向_西北西 : 0.0001500892131159851
holiday_flag_True : 0.0001799802940522463
holiday_flag_False : 0.00019028899394439951
風向_南西 : 0.00048387989162920454

indiana_jonesは「インディ・ジョーンズ・アドベンチャー:クリスタルスカルの魔宮」です。

raging_spiritsは「レイジングスピリッツ」です。

この2つのアトラクションの待ち時間が「ソアリン:ファンタスティック・フライト」の待ち時間に大きく影響しています。

ちなみに、全体の関係性をネットワーク図にすると以下のようになりました。(参考までに)

気温と風速が天気のパラメータの中では影響していますね。

タイトルとURLをコピーしました