賃貸物件の価格予測における気付き

  • 全物件を一つのモデルで回すのは上手くいかない。
  • 家賃がデータセットに対して中央値よりも高くなると予測値が下側にぶれる
  • 家賃が中央値よりも低いと上側にぶれる
  • 家賃を幾つかの価格帯で分けてモデルを作った方が精度が高くなる気がする
  • 重回帰分析をする際、Kerasを用いて行うと、9万件のデータセットを用いると5000epoch(4時間)回しても損失関数が収束しない。
  • 重回帰分析はsklearnを使うべき
  • keras とsklearnの違いは、バッチマイに最適化させるか、一遍に全部やるかの違い。
  • 画像を用いる場合は、50epoch(4時間)でうまいこと終わる。
  • 予測値と真値の誤差は1万5千円くらい
  • VGG16の5ブロック目はpopしても問題なし。
  • 恐らく、5block目で分類学習をしてるっぽい。