食べログから情報を収集し、コスパのよいお店を探してきました。
この記事はそのまとめです。
コスパのよいお店を見つける方法を模索した
収集
まずはpythonで食べログからデータを収集していくところです。
- 食べログのpythonスクレイピングと分析 #1 「データの収集(1ページ分)」
- 食べログのpythonスクレイピングと分析 #2 「データの収集(エリア一つ分まで)」
- 食べログのpythonスクレイピングと分析 #3 「データの収集(全国分)そしてちょっと分析」
データの分析
色々、分析していて迷走していた時期
迷走しているので読まなくてもいいかも(笑)
- 食べログのpythonスクレイピングと分析 #4 「分析してコスパのいいレストランを探す」
- 食べログのpythonスクレイピングと分析 #5 「データの再収集/更なる分析(コスパ指数を定義)/コスパの良いお店を少し載せる」
- コスパ指数というモデル式を立ててみました
- 食べログのpythonスクレイピングと分析 #6 「回帰分析/ジャンル別コスパの高いお店(一部)載せる」
- 食べログのpythonスクレイピングと分析 #7 「ジャンル別コスパの高いお店 BEST5 全部で200件載せる」
- 食べログのpythonスクレイピングと分析 #8 「コスパのよいお店をマッピング/ジャンル別コスパの高いお店を(少し)載せる」
- コスパ指数で地図上にマッピングしました
- 食べログのpythonスクレイピングと分析 #9 「Streamlitを使ったマッピング(マッピングまで)/ジャンル別コスパの高いお店を(少し)載せる」
- 食べログのpythonスクレイピングと分析 #10 東京のデータの可視化
コスパの良いお店を求めるまで
- 食べログのpythonスクレイピングと分析 #11 ランダムフォレストによる回帰分析
- この時点ではあまりいい結果はでませんでした
- 食べログのpythonスクレイピングと分析 #12 精度改善のために残差分析をしてみる
- 残差分析により精度改善を試み、少し改善できました
- 食べログのpythonスクレイピングと分析 #13 執念の精度改善 ~パラメータを追加 北海道編~
- 新たなパラメータを追加したところ精度がかなり良くなりました!
- 食べログのpythonスクレイピングと分析 #14 ランダムフォレストで学習させてわかったこと (北海道編)
- 「予測された評価値(★の値)よりも実際の評価値(★の値)が高いレストランのパラメータはどうなっているのか」を確認しました
- 食べログのpythonスクレイピングと分析 #15 遺伝的アルゴリズムを試す①(番外編) ~遺伝的アルゴリズムでデモ~
- 評価値を最大にして、価格帯を最小にするという、2つの変数の最適化を試みるため、遺伝的アルゴリズムを試してみました(まずはその第一弾としてのデモの記事です)
- 食べログのpythonスクレイピングと分析 #16 遺伝的アルゴリズムを試す② ~全体で遺伝的アルゴリズムを試す~(北海道編)
- #15で試した遺伝的アルゴリズムを北海道のデータに適用してみました
- ナップザック問題で最適なグルメを求める(北海道編) 食べログのpythonスクレイピングと分析 #17
- ジャンルでナップザック問題を使った最適解を求める
- ナップザック問題でコスパの良いお店の最適解を求める(北海道編) 食べログのpythonスクレイピングと分析 #18
- ここで予算内で、「評価スコア – 予測したスコア」を最大化するという最適解の同出方法を確立!
全国のコスパのよいレストランをもとめた
上記の「評価スコア – 予測したスコア」を最大化する方法で全国の食べログスコア最適解を各都道府県について求めました👇(ついでにじゃらんのランキングも求めています)