핸즈온 머신러닝 1장 한눈에 보는 머신러닝 - 1.2 왜 머신러닝을 사용하는가?

'데이터분석 관련 책 `핸즈온 머신러닝 2판`의 1장 1.2절 왜 머신러닝을 사용하는가? 요약 및 정리

정민호정민호

1. 한눈에 보는 머신러닝


1.2. 왜 머신러닝을 사용하는가?

  • 기존의 솔루션이 많은 수동 조정과 규칙이 필요한 문제를 해결하고자 할 때

  • 전통적인 방식으로는 해결 방법이 없는 복잡한 문제를 해결하고자 할 때

  • 대용량의 데이터에서 통찰을 얻고자 할 때

  1. 사례 - 스팸 필터

    1. 전통적인 접근 방법

      • 스팸에 어떤 단어들이 주로 나타나는지 연구하여 규칙을 작성함

      • 규칙을 이용해 스팸메일의 패턴을 감지하는 알고리즘을 작성하여 메일 분류

      • 프로그램을 테스트하고 스팸 단어가 변경될 경우 위 방법을 반복

    2. 문제점

      • 문제가 어렵기 때문에 규칙이 점점길고 복잡해지므로 유지보수하기 매우 힘들어짐

    3. 머신러닝 접근 방법

      • 스팸에 어떤 단어들이 주로 나타나는지 연구하여 규칙을 작성함

      • 규칙을 이용해 프로그램이 자동으로 인식하고 별도의 작업하지 않아도 자동으로 스팸메일의 패턴을 감지하여 메일 분류

  2. 데이터 마이닝

    • 대용량의 데이터를 분석하면 겉으로 보이지 않던 패턴 발견

  3. 머신러닝 사용 분야

    • 기존솔루션으로 많은 수동 조정과 규칙이 필요한 문제

      • 하나의 머신러닝 모델이 코드를 간단한게 만들고 전통적인 방법보다 더 잘 수행되도록 할수 있음

    • 전통적인 방식으로는 해결 방법이 없는 복잡한 문제

      • 가장 뛰어난 머신러닝 기법으로 해결 방법을 찾을 수 있음

    • 유동적인 환경

      • 머신러닝 시스템은 새로운 데이터에 적응할 수 있음

    • 복잡한 문제와 대량의 데이터에서 통찰 얻기