機械学習2
前回の続き
性能を評価する指標を決めておく必要がある
どのモデルが性能の良いものか判断ができなくなるから
数種類のアルゴリズムを比較することが不可欠
よく使用される指標は正解率
モデルの汎化性能をテストする必要性がある
(未知のデータにも対応できる力)
これについてはトレーニングデータセットをさらに、トレーニング用のサブセットと検証用のサブセットに分割して、様々な交差検証の手法を試すという方法がある
それで最終的に最適化に成功したと思われつモデルをテストデータセットでテストしてモデルの汎化性能を評価する
↑この評価によって、汎化誤差を評価できる。
この誤差が少なく性能に納得が行けば、このモデルを使って将来のデータを予測できる
などを学習して機械学習の大まかな流れと概念を理解し始めた。
友達はフランス語の文法を習得する間際で、間違いを繰り返してうわーと言いながら頑張っている。
趣味でフランス語を勉強するというおしゃれな彼を今後も応援していきたい。