2024年の花火大会を分析してコスパの良い花火大会を探してみる

スポンサーリンク
tech系(python)
スポンサーリンク

この記事について

今回の記事は2024年の花火大会を分析して、行った方が良い花火大会(コスパの良い花火大会)を見つけようとしました。

コスパのよい花火大会は、この記事では打ち上げ花火数が多いにも関わらず、来場者が少ない花火大会を指します。(以下、この記事ではこの定義の基、コスパの良い花火大会と称して記載します)

使用したデータ

使用させていただいたデータは「ウォーカープラスの花火大会2024」です。

花火大会2024 - ウォーカープラス
2024年の花火大会の情報を網羅した“全国花火大会検索サイト”です。

分析

各パラメータの相関を求める

  • hanabi_num:打ち上げ花火数
  • people_num:来場者数
  • bookmark_num:「行ってみたい」の数
  • good_num:「行ってよかった」の数

それぞれの相関係数を求めてみます。

              hanabi_num  people_num  bookmark_num  good_num
hanabi_num      1.000000    0.512212      0.366432  0.288415
people_num      0.512212    1.000000      0.291833  0.161970
bookmark_num    0.366432    0.291833      1.000000  0.955607
good_num        0.288415    0.161970      0.955607  1.000000

一番、注目できたのは「打ち上げ花火数」と「来場者数」との相関です。

0.512ほどあって、少しは相関があるようです。

つまり、打ち上げ数が多い花火大会ほど来場者が多くなる傾向が少しはあるということです。

「行ってみたい」の数と「行ってよかった」の数がかなり相関があるのですが、今回はコスパの良い花火大会を探すことが目的であり、この2つの関係からではコスパの良い花火大会が見つからないと判断し、無視します。

打ち上げ数が多い花火大会ほど来場者が多くなる傾向が少しはあるというだけでは、コスパの良い花火大会は見つかりません。

そこでとったアプローチとしてまずはANOVA検定を使用しみました。

ANOVA検定(分散分析)とは?

ANOVA(Analysis of Variance、分散分析)は、複数のグループ間で平均値に差があるかどうかを検定する統計手法です。

複数のグループを比較する際に、各グループの平均値が統計的に有意に異なるかを判断します。

例えば、

  • 地域ごとの売上の平均が異なるかを確認したい
  • 異なる薬の効果(治療群間の平均の違い)を評価したい
  • 場所ごとの来場者数の差を確認したい

などを統計的に判断したい場合に使います。

で、今回の場合にどのように使用しようとしたかというと、

都道府県別で来場者数と打ち上げ数が変わるのかと言うことです。

考え方

ANOVAは、「グループ内のデータのばらつき」と「グループ間の平均の差」に基づいて評価します。

ANOVA検定は、グループ間の分散(F統計量)をもとめて、この値が大きいほど、グループ間の差が有意である可能性が高まります。

そして、F統計量からp値を計算し、グループ間の違いが偶然かどうかを判断します。

一般的にp値 < 0.05だと有意差があると言われることが多いです。

結果は以下のようになりました。

都道府県別の来場者で見たF統計量、p値

F統計量: 2.6307457564627392, p値: 0.0000000941

都道府県別の打ち上げ花火の数で見たF統計量、p値

F統計量: 2.7763869507038073, p値: 0.0000000151

p値を見る限り有意差があると言っていいのではないでしょうか。

つまり、都道府県別でみると、来場者数も打ち上げ数も変わってくると言えます。

これは、都道府県ごとに来場者数と打ち上げ数も異なってくるので、比較が難しいということを示していると思います。

一旦、全体で見てみる

しかし、都道府県ごとに計算すると複雑になりそうだったので、ここでは、一旦、全体で来場者数の平均を求め、来場者数が少ない大会を見つける方法をとろうと思います。(すいません)

来場者数が全体平均より少ない大会の内、打ち上げ花火数が多いベスト10の大会を求めてみます。

その打ち上げ花火数が多い大会ベスト10が以下になりました。

花火大会名期間来場者数打ち上げ花火数開催された都道府県
TxT GARAGE 第12回真駒内花火大会2024年7月6日(土)1800022000北海道
みなとみらいスマートフェスティバル 20242024年8月5日(月)2000020000神奈川県
にし阿波の花火2024年11月9日(土)2000020000徳島県
HBA Special Night 道新・秋華火2024年9月15日(日)1622018000北海道
第3回万博夜空がアートになる日20242024年11月23日(祝)2400015000大阪府
京都芸術花火20242024年6月26日(水)2700013500京都府
肉と焼酎のふるさと・みやこんじょ花火大会2024年10月26日(土)5000012900宮崎県
第39回 日本平まつり2024年7月24日(水)2500012000静岡県
第31回 赤川記念花火大会2024年8月17日(土)4000012000山形県
第12回沼田花火大会2024年9月14日(土)5300011000群馬県

また、来場者数が全体平均より少ない大会で打ち上げ花火数が全体平均の3倍以上の大会は以下のようになりました。

花火大会名期間来場者数打ち上げ花火数開催された都道府県
第3回万博夜空がアートになる日20242024年11月23日(祝)2400015000大阪府
京都芸術花火20242024年6月26日(水)2700013500京都府
TxT GARAGE 第12回真駒内花火大会2024年7月6日(土)1800022000北海道
みなとみらいスマートフェスティバル 20242024年8月5日(月)2000020000神奈川県
HBA Special Night 道新・秋華火2024年9月15日(日)1622018000北海道
にし阿波の花火2024年11月9日(土)2000020000徳島県

まとめ

今回はコスパの良い花火大会を見つけようとして、

  • 都道府県ごとに花火の数と人の数が変わってくること
  • 全国の平均から来場者数が少なくて打ち上げ花火数が多い花火大会

が分かりました。

しかし、全体でしか見つけられていないことが不本意です。

都道府県ごとに求められれば理想なのかとも思いますが、東京に近ければ、と言う意味で関東で絞ってもよかったりとも考えたりします。

次回があれば、リベンジと言う形で、他のアプローチもとっていきたいと思います。

タイトルとURLをコピーしました