■suumoの物件分析 #6 「賃貸の家賃をランダムフォレストで学習させてわかったこと ~東京編~」

スポンサーリンク
tech系(python)
スポンサーリンク

はじめに

前回は回帰分析を行い、重回帰分析とランダムフォレストを試しました。

そして重要度まで求めました。

今回は、前回、ランダムフォレストによって予測した値と実際の値を比較して、予測では高い家賃に設定されているのに、実際はもっと安い家賃の物件がどういうものなのかを調べていきたいと思います。

要は残差分析をしているだけなのですが、予測では●万のところだが、実際は●万という比較をして、予測よりも安い物件を探そうということをしています。

残差分析で深堀をするってのが今回やる事です。

安く予測された物件上位の値を見る

残差(万円)

予測よりも家賃が安いものを上位30位で求めました。

残差分析についてはコードを残しておきます。前回のランダムフォレストで書いたコードの続きになるので、変数は前回のコードの後に書く形になります。

X_train['predict'] = y_pred_train
X_train['residual_error'] = X_train['predict'] - y_train

X_test['predict'] = y_pred_test
X_test['residual_error'] = X_test['predict'] - y_test

tmp_concat = pd.concat([X_train, X_test])
room_shape_date_res = pd.concat([room_shape_date, tmp_concat['predict'], tmp_concat['residual_error']], axis=1)

yasume_best_30 = room_shape_date_res.sort_values(by = 'residual_error', ascending = False).head(30)

yasume_best_30

以下が結果になります。

9.1998
7.2294
7.074
5.43283333
5.2986
5.271
5.009
4.964
4.881
4.881
4.836
4.781
4.61467034
4.538
4.38771429
4.38771429
4.298
4.196
4.08466667
3.95333333
3.95333333
3.85266667
3.7152
3.6014
3.561
3.366
3.348
3.24512857
3.199
3.126

一番大きい値で9万円も予測より安い家賃となっています。

では上位20件の具体的な値を見てみます。(見やすい表示の都合上の問題で20件まで)

1件0階がありますね。謎です。あと、17位と18位の物件、同じ物件っぽいですね…。

見ると分かりますが、もともと家賃が高い物件か、安い物件でも築年数が凄い経っていたり、駅からの距離が遠い物件が出てきます。

ちなみに、一番低い「部屋の広さ」の値が36.15(m2)ですが、これでも約22畳あるので、相当広いです。

駅徒歩8分が痛いですが、新築(築年数 = 0)、2階以上の部屋ということでかなりコスパが良いのではないでしょうか。

カウントで見る

今度は上位30件ではなく、上位100件の物件で各値のカウント数を見ていきます。

コスパの良い(予測値より安い家賃の)物件がどの駅に多いかを調べました。一応上位10件です。

新秋津駅     4
江古田駅     4
芝浦ふ頭駅    3
武蔵関駅     3
白金高輪駅    3
三田駅      3
清瀬駅      3
新富町駅     2
河辺駅      2
田町駅      2

100物件あるうちの4件ずつ新秋津駅と江古田駅にありました。

特段、コスパの良い物件が多い駅があるわけではないようですね。

ただ、駅は数自体(母数)も多いので、少なくなりがちにはなると思います。

そう考えると4件もあるのは多いのでしょうね。

エリア

次は東京のエリアで見た時の結果です。これも上位10件。

港区      24
練馬区     17
中央区     11
東村山市    10
八王子市     5
青梅市      4
西多摩郡     4
葛飾区      3
江戸川区     3
福生市      3

港区、多いですね!

100物件のうち24件が港区。

約4分の1を占めます。

コスパの良い物件を探すなら港区がいいかもですね。

ただ基本高いです(笑)

続いて練馬区ですが、練馬区もそれなりに高い。

個人的にはこれが分かっただけでも結構な収穫です。

向き

続いて向き。

南     34
東     19
西     16
南東    14
南西    11
北西     3
北東     2
北      1

結構面白い結果になりましたね。

北が1件しかない。

南は34件もある。

これは南で探してみるべきですね~。

室内洗濯機置場の有無

次は室内洗濯機置場の有無。

やっぱ部屋の中に置いておきたいですよね、洗濯機。

室内洗濯置      96
室内洗濯置なし     4

はい、ほとんど室内洗濯機置場がありますね!

室内洗濯機置場は妥協しなくてよさげです。

ユニットバスかどうか

お次は風呂トイレ別かどうか。

バストイレ別    97
ユニットバス     3

これも、風呂とトイレは別の部屋でも基本コスパが良いってことですね。

よかった~。

部屋の階数

最後は部屋の階数。

注目したいのは1階が多いかどうか。

2.0    42
3.0    18
1.0     9
7.0     9
5.0     7
4.0     6
6.0     5
0.0     2
8.0     1
9.0     1

2階が多いのか!

2階で探すのが良いようです。

まとめ

今回は前回ランダムフォレストで回帰した結果からコスパの良い物件がどんなものなのかを見てみました。

まとめると、「港区にある、南向きの、2階の部屋」が狙いめですね!!!

全体として室内洗濯機あってよく、風呂トイレ別にしたところでもコスパの良い物件は全然あるということでした。

んん~♪、結構、収穫がありましたね。

今回はここまで。ではまた👋👋👋


タイトルとURLをコピーしました