핸즈온 머신러닝 1장 한눈에 보는 머신러닝 - 1.1 머신러닝이란?
'데이터분석 관련 책 `핸즈온 머신러닝 2판`의 1장 1.1절 머신러닝이란? 요약 및 정리
1. 한눈에 보는 머신러닝
1.1. 머신러닝이란?
-
사례 - 스팸 필터
-
스팸필터는 스팸 메일과 일반 메일의 샘플을 이용해 스팸 메일 구분법을 배울 수 있는 머신러닝 프로그램
-
시스템이 학습하는 데 사용하는 샘플을 훈련 세트 라고 하고 각 훈련 데이터를 훈련 사례(또는 샘플) 라고함
-
작업 T는 새로운 메일이 스팸인지 구분하는 것이고, 경험 E는 훈련 데이터 이며, 성능 측정 P는 직접 정의해야함
-
예를 들면 정확히 분류된 메일의 비율을 P로 사용할 수 있으며, 이 성능 측정을 정확도 라고 부르며 분류작업에 자주 사용됨
-
훈련 세트(training set) : 시스템이 학습하는 데 사용하는 샘플
-
훈련 사례 또는 샘플(training instance) : 각 훈련 데이터
-
훈련 데이터(training data) : 시스템 훈련 경험
-
정확도(accuracy) : 사용자가 목표로 하는 기능의 성공률
-
-
Twitter
Google+
Facebook
Reddit
LinkedIn
StumbleUpon
Email