この記事について
今回の記事は2024年の花火大会を分析して、行った方が良い花火大会(コスパの良い花火大会)を見つけようとしました。
コスパのよい花火大会は、この記事では打ち上げ花火数が多いにも関わらず、来場者が少ない花火大会を指します。(以下、この記事ではこの定義の基、コスパの良い花火大会と称して記載します)
使用したデータ
使用させていただいたデータは「ウォーカープラスの花火大会2024」です。

分析
各パラメータの相関を求める
- hanabi_num:打ち上げ花火数
- people_num:来場者数
- bookmark_num:「行ってみたい」の数
- good_num:「行ってよかった」の数
それぞれの相関係数を求めてみます。
hanabi_num people_num bookmark_num good_num
hanabi_num 1.000000 0.512212 0.366432 0.288415
people_num 0.512212 1.000000 0.291833 0.161970
bookmark_num 0.366432 0.291833 1.000000 0.955607
good_num 0.288415 0.161970 0.955607 1.000000
一番、注目できたのは「打ち上げ花火数」と「来場者数」との相関です。
0.512ほどあって、少しは相関があるようです。
つまり、打ち上げ数が多い花火大会ほど来場者が多くなる傾向が少しはあるということです。
「行ってみたい」の数と「行ってよかった」の数がかなり相関があるのですが、今回はコスパの良い花火大会を探すことが目的であり、この2つの関係からではコスパの良い花火大会が見つからないと判断し、無視します。
打ち上げ数が多い花火大会ほど来場者が多くなる傾向が少しはあるというだけでは、コスパの良い花火大会は見つかりません。
そこでとったアプローチとしてまずはANOVA検定を使用しみました。
ANOVA検定(分散分析)とは?
ANOVA(Analysis of Variance、分散分析)は、複数のグループ間で平均値に差があるかどうかを検定する統計手法です。
複数のグループを比較する際に、各グループの平均値が統計的に有意に異なるかを判断します。
例えば、
- 地域ごとの売上の平均が異なるかを確認したい
- 異なる薬の効果(治療群間の平均の違い)を評価したい
- 場所ごとの来場者数の差を確認したい
などを統計的に判断したい場合に使います。
で、今回の場合にどのように使用しようとしたかというと、
都道府県別で来場者数と打ち上げ数が変わるのかと言うことです。
考え方
ANOVAは、「グループ内のデータのばらつき」と「グループ間の平均の差」に基づいて評価します。
ANOVA検定は、グループ間の分散(F統計量)をもとめて、この値が大きいほど、グループ間の差が有意である可能性が高まります。
そして、F統計量からp値を計算し、グループ間の違いが偶然かどうかを判断します。
一般的にp値 < 0.05だと有意差があると言われることが多いです。
結果は以下のようになりました。
都道府県別の来場者で見たF統計量、p値
F統計量: 2.6307457564627392, p値: 0.0000000941
都道府県別の打ち上げ花火の数で見たF統計量、p値
F統計量: 2.7763869507038073, p値: 0.0000000151
p値を見る限り有意差があると言っていいのではないでしょうか。
つまり、都道府県別でみると、来場者数も打ち上げ数も変わってくると言えます。
これは、都道府県ごとに来場者数と打ち上げ数も異なってくるので、比較が難しいということを示していると思います。
一旦、全体で見てみる
しかし、都道府県ごとに計算すると複雑になりそうだったので、ここでは、一旦、全体で来場者数の平均を求め、来場者数が少ない大会を見つける方法をとろうと思います。(すいません)
来場者数が全体平均より少ない大会の内、打ち上げ花火数が多いベスト10の大会を求めてみます。
その打ち上げ花火数が多い大会ベスト10が以下になりました。
花火大会名 | 期間 | 来場者数 | 打ち上げ花火数 | 開催された都道府県 |
---|---|---|---|---|
TxT GARAGE 第12回真駒内花火大会 | 2024年7月6日(土) | 18000 | 22000 | 北海道 |
みなとみらいスマートフェスティバル 2024 | 2024年8月5日(月) | 20000 | 20000 | 神奈川県 |
にし阿波の花火 | 2024年11月9日(土) | 20000 | 20000 | 徳島県 |
HBA Special Night 道新・秋華火 | 2024年9月15日(日) | 16220 | 18000 | 北海道 |
第3回万博夜空がアートになる日2024 | 2024年11月23日(祝) | 24000 | 15000 | 大阪府 |
京都芸術花火2024 | 2024年6月26日(水) | 27000 | 13500 | 京都府 |
肉と焼酎のふるさと・みやこんじょ花火大会 | 2024年10月26日(土) | 50000 | 12900 | 宮崎県 |
第39回 日本平まつり | 2024年7月24日(水) | 25000 | 12000 | 静岡県 |
第31回 赤川記念花火大会 | 2024年8月17日(土) | 40000 | 12000 | 山形県 |
第12回沼田花火大会 | 2024年9月14日(土) | 53000 | 11000 | 群馬県 |
また、来場者数が全体平均より少ない大会で打ち上げ花火数が全体平均の3倍以上の大会は以下のようになりました。
花火大会名 | 期間 | 来場者数 | 打ち上げ花火数 | 開催された都道府県 |
---|---|---|---|---|
第3回万博夜空がアートになる日2024 | 2024年11月23日(祝) | 24000 | 15000 | 大阪府 |
京都芸術花火2024 | 2024年6月26日(水) | 27000 | 13500 | 京都府 |
TxT GARAGE 第12回真駒内花火大会 | 2024年7月6日(土) | 18000 | 22000 | 北海道 |
みなとみらいスマートフェスティバル 2024 | 2024年8月5日(月) | 20000 | 20000 | 神奈川県 |
HBA Special Night 道新・秋華火 | 2024年9月15日(日) | 16220 | 18000 | 北海道 |
にし阿波の花火 | 2024年11月9日(土) | 20000 | 20000 | 徳島県 |
まとめ
今回はコスパの良い花火大会を見つけようとして、
- 都道府県ごとに花火の数と人の数が変わってくること
- 全国の平均から来場者数が少なくて打ち上げ花火数が多い花火大会
が分かりました。
しかし、全体でしか見つけられていないことが不本意です。
都道府県ごとに求められれば理想なのかとも思いますが、東京に近ければ、と言う意味で関東で絞ってもよかったりとも考えたりします。
次回があれば、リベンジと言う形で、他のアプローチもとっていきたいと思います。