機械学習
今日は友達と勉強会
友達はフランス語の勉強、自分は機械学習についての勉強をした。
機械学習は大きく分けて3種類ある。
教師あり学習と教師なし学習と強化学習である。
教師あり学習はラベル付きのトレーニングデータ(答えがあるデータ)を用意して、それを機械学習アルゴリズムによって予測データのモデルを作り出す。
そして、未知のデータや将来のデータを予測する。
分類と回帰の2種類などがある。
教師なし学習はラベル付けされていないデータや構造が不明なデータを扱って、クラスタリングや次元削除によってモデルを構築する。
強化学習は環境とのやり取りを通じて報酬を最大化しようとすることでモデルを構築する。
機械学習では前処理がとても大切になってくる。
生のデータがアルゴリズムの性能を最適化するのに必要な形式で提供されることは滅多にない。
特徴量を抽出する、特徴量の尺度を揃える(特徴量のスケジューリング)、特徴量の重複を避けるために低次元の部分空間に圧縮する(次元削除)、データの無関係な特徴量を削除する(次元削除)
することが重要になってくる。
データセットを分割する
トレーニングデータセットとテストデータセット
トレーニングデータセットはモデルをトレーニングして最適化するために使用して、テストデータセットは最終モデルを評価する時まで取っておく