はじめに
よく、ヒットした映画作品の続編は駄作になるという話を聞きます。
たしかに、エイリアン2とかターミネーター2とかそうではない作品もある事にはありますが、
エイリアンシリーズも3になってから様子がおかしくなり、ターミネーターも3になってから後戻りができないところまで来てしまいました。
ということで、今回は実際のところ本当に続編が駄作になりやすいのかというのを調べてみたいと思います。
そして、このような記事を見つけました。

「なぜハリウッド映画は悲惨な続編モノを作り続けるのか?」という2016年の記事です。
それをわかりやすく説明した「Why Hollywood keeps making terrible sequels」という動画のようで、以下の動画です。
こちらの記事では、「続編モノは内容がどうであれ、ある程度の興行収入を見込めるから」という結論で締めくくられています。
また、「あの作品の続編なら」という期待値が上がり、ハードルが上がった結果、評価が下がるという事も述べられていて、確かにそうだなと思いました。
さて、この記事では実際に映画作品の続編は駄作になりやすいのかを検証してみたので、その結果について書こうと思います。
今回の実装について
今回の実装に関しては以下のような実装になっています。
- IMDbにあるシリーズの作品データ(評価点や公開年など)をseleniumで取得
- 「More like this」 という類似作品の蘭があり、そこにシリーズが記載されていることがあるので、とタイトル類似度を使ってシリーズ単位にグループ化する(しきい値は0.6)
- そのシリーズ内を公開年順に並べ、隣り合う前作・次作ペアを作り、評価差を出す
- 最後に、続編の方が低い件数、高い件数、同点件数、割合、平均差、中央値、符号検定のp値などを求める
今回はシリーズの続編がIMDbのページに記載が無い事から、「More like this」でペアを作成し、シリーズとしました。
ですので、シリーズのペアという形で、綺麗にシリーズとして、1~3のようにまとめることができませんでした。
データを取得したサイトは以下です。
今回の結果について
結果は以下のようになりました。
rated_pair_count: 534
lower_count: 387
higher_count: 127
tie_count: 20
lower_share_non_tie: 0.7529
lower_share_ci_95: 0.7138 - 0.7882
mean_delta: -0.4678
median_delta: -0.4
min_delta: -4.4
max_delta: 3.5
sign_test_p_value_one_sided: 0.0- rated_pair_count:前作と続編のペア
- lower_count:続編の方が前作より低かったペア
- higher_count:前作と同点のペア
- lower_share_non_tie:前作より続編の方が低い割合(同点も含める)
- lower_share_ci_95:95%信頼区間
- mean_delta:平均差分(→続編の方が平均で0.4678点数が低い)
- median_delta:中央値(差分(delta)を全部並べたとき、ちょうど真ん中の値が -0.4)
- min_delta:最も悪かったケース
- max_delta:最もよかったケース
- sign_test_p_value_one_sided:片側検定のp値
✌️✌️✌️
今回のデータでは「続編は前作より低評価になりやすい」はかなり強く支持される結果となりました。
続編の低評価率は同点を除くと75.29%で、ランダムに上下するだけなら 50% 前後に寄るはずですが、95%信頼区間が 71.38% から 78.82% に収まっていて、50% から大きく離れています。
片側検定のp値(sign_test_p_value_one_sided)も、実際には丸めで 0 に見えていますが、これは、極端に小さい値です。「偶然こうなった」とみなすのはかなり難しいです。
下落幅に関しても、平均差分(mean_delta)で、IMDb の10点満点スケールでは-0.4678はそれなりに目立つ差かと思います。
平均より中央値の方がやや小さいので、全体としては「多くの作品が少しずつ下がる」構図に加えて、一部にかなり大きく落ちる続編が混じっているようです。
最後に
続編は期待してはダメのようです。
