特徴量重要度による特徴量選定

データ分析

はじめに

plot_importanceを用い、分類予測時における特徴量重要度を求め特徴量の選定を行う。

今回も前回の記事で用いたSIGNATEに記載されている【練習問題】ガラスの分類(https://signate.jp/competitions/125)を使用しています。

前回記事のソースコード

特徴量重要度の表示

今回のモデルにおける上位4つの特徴量を使用し, 再度モデルの構築を行い予測を行っていきます。

モデル構築~評価

特徴量を減らしたことによって複雑なモデルではなくなってしまっため全体的に数値が低くなってしまっている。

提出用ファイルの作成

今回のモデルで予測を行い提出をしたところ正解率0.7102804と過学習が起きず前回のモデルに比べ, 汎用性の高いモデルが構築できた。

※今回提出ファイルを提出する際にデータを分割せず, 再度モデルの構築を行っていいるため上記のソースコードと異なる部分があります。

タイトルとURLをコピーしました