機械学習２ - yuya競プロ精進

前回の続き

性能を評価する指標を決めておく必要がある
どのモデルが性能の良いものか判断ができなくなるから
数種類のアルゴリズムを比較することが不可欠
よく使用される指標は正解率

モデルの汎化性能をテストする必要性がある
（未知のデータにも対応できる力）
これについてはトレーニングデータセットをさらに、トレーニング用のサブセットと検証用のサブセットに分割して、様々な交差検証の手法を試すという方法がある
それで最終的に最適化に成功したと思われつモデルをテストデータセットでテストしてモデルの汎化性能を評価する

↑この評価によって、汎化誤差を評価できる。
この誤差が少なく性能に納得が行けば、このモデルを使って将来のデータを予測できる

などを学習して機械学習の大まかな流れと概念を理解し始めた。

友達はフランス語の文法を習得する間際で、間違いを繰り返してうわーと言いながら頑張っている。
趣味でフランス語を勉強するというおしゃれな彼を今後も応援していきたい。