(기초) AWS - IAM

AWS에 대해 알아봅니다.

정민호정민호

1. IAM 개요

IAM(Identity & Access Management)은 유저와 접근 레벨 및 권한에 대한 관리

  • 접근키(Access Key), 비밀키(Secret Access Key)

  • 매우 세밀한 접근 권한 부여 기능 (Granular Permission)

  • 비밀번호를 수시로 변경 가능

  • 다중인증(Multi-Factor Authentication) 기능

2. IAM(Identity & Access Management) 유형

정책은 하나의 그룹, 역할에 추가 시킬 수 있으며, 하나의 그룹 안에 다수의 유저가 존재 가능

IAM은 유니버셜(Universal)하여 지역 설정이 필요 없음

  • 그룹(Group)

  • 유저(User)

  • 역할(Role)

  • 정책(Policy)

3. IAM 정책 시뮬레이터

개발환경(Staging or Develop)에서 실제환경(Production)으로 빌드하기전 IAM 정책이 잘 작동되는지 테스트하기 위함

IAM과 관련된 문제들을 디버깅하기에 최적화된 툴 (이미 실제로 유저에 부여된 다양한 정책들도 테스트 가능)

핸즈온 머신러닝 1장 한눈에 보는 머신러닝 - 1.6 테스트와 검증

'데이터분석 관련 책 `핸즈온 머신러닝 2판`의 1장 1.6절 테스트와 검증 요약 및 정리

정민호정민호

1. 한눈에 보는 머신러닝


1.6. 테스트와 검증

  • 훈련데이터를 훈련 세트와 테스트 세트 두 개로 나누는 것

  • 새로운 샘플에 대한 오류 비율을 일반화 오차(generalization error) 또는 외부 샘플 오차(out-of-sample error)

  • 테스트 세트에서 모델을 평가함으로써 오차에 대한 추정값(estimation)을 얻음

  • 훈련 오차가 낮지만 일반화 오차가 높다면 이는 모델이 훈련 데이터에 과대적합되었다는 뜻

  1. 하이퍼파라미터 튜닝과 모델 선택

    • 하이퍼파라미터(hyperparameter)는 학습 알고리즘의 파라미터로써 학습 알고리즘으로부터 영향을 받지 않으며, 훈련 전에 미리 지정되고, 훈련하는 동안에는 상수로 남아 있음

      • 하이퍼 파라미터를 매우 큰 값으로 지정하면 거의 평편한 모델을 얻게 됨

    • 모델 평가 시 홀드아웃 검증(holdout validation)을 사용하며 이 세트를 검증세트(validation set) 또는 개발 세트(development set), 데브 세트(dev set)라고 함

      • 훈련 세트의 일부를 떼어내어 여러 후보 모델을 평가하고 가장 좋은 하나를 선택

      • 검증 세트가 너무 작으면 모델이 정확하게 평가 되지 않으며 이에 대한 해결책으로, 작은 검증 세트를 여러 개를 사용해 반복적인 교차 검증(cross-validation) 수행

        • 훈련 시간이 검증 세트의 개수에 비례해 늘어남

  2. 데이터 불일치

    • 검증 세트와 테스트 세트에 대표 데이터가 배타적으로 포함되어야 함

    • 훈련-개발 세트(train-dev set)으로 훈련 데이터의 일부를 떼어내어 또 다른 세트를 만들어 훈련한 다음 훈련-개발 세트에서 평가


핸즈온 머신러닝 1장 한눈에 보는 머신러닝 - 1.7 연습문제

'데이터분석 관련 책 `핸즈온 머신러닝 2판`의 1장 1.7절 연습문제 및 정리

정민호정민호

1. 한눈에 보는 머신러닝


1.7. 연습문제


  1. 머신러닝의 정의

  2. 머신러닝이 도움을 줄 수 있는 문제 유형 네 가지

  3. 레이블된 훈련 세트란?

  4. 가장 널리 사용되는 지도 학습 작업 두 가지

  5. 보편적인 비지도 학습 작업 네 가지

  6. 사전 정보가 없는 여러 지형에서 로봇을 걸어가게 하려면 어떤 종류의 머신러닝 알고리즘을 사용할 수 있나?

  7. 고객을 여러 그룹으로 분할하려면 어떤 알고리즘을 사용할 수 있나?

  8. 스팸 감지의 문제는 지도 학습과 비지도 학습 중 어떤 문제로 볼 수 있나?

  9. 온라인 학습 시스템이란?

  10. 외부 메모리 학습이란?

  11. 예측을 하기 위해 유사도 측정에 의존하는 학습 알고리즘은 무엇인가?

  12. 모델 파라미터와 학습 알고리즘의 하이퍼파라미터 사이에는 어떤 차이가 있나?

  13. 모델 기반 알고리즘이 찾는 것은 무엇인가? 성공을 위해 이 알고리즘이 사용하는 가장 일반적인 전력은 무엇인가? 예측은 어떻게 만드나?

  14. 머신러닝의 주요 도전 과제는 무엇인가?

  15. 모델이 훈련 데이터에서의 성능은 좋지만 새로운 샘플에서의 일반화 성능이 나쁘다면 어떤 문제가 있는 것인가? 간으한 해결책 세 가지는 무엇인가?

  16. 테스트 세트가 무엇이고 왜 사용해야 하나?

  17. 검증 세트의 목적은 무엇인가?

  18. 훈련-개발 세트가 무엇인가?

  19. 테스트 세트를 사용해 하이퍼파라미터를 튜닝하면 어떤 문제가 생기나?