파비의 매일매일 공부기록

파이썬으로 하는 데브옵스 - 14장 #3 본문

Study/Python

파이썬으로 하는 데브옵스 - 14장 #3

fabichoi 2022. 1. 21. 23:30

머신러닝 성숙도 모델
- 레벨 1 : 프레이밍, 범위 식별, 문제 정의 : 어떤 문제를 해결해야 하는지, 어떤 식으로 프레임을 짤 수 있을지 고민이 필요.
- 레벨 2 : 데이터의 지속적 전달 : 흐르는 물과 마찬가지로 흐르는 데이터는 매일 시간을 절약해줌. 데이터 레이크의 개념 이해 필요.
- 레벨 3 : 정제 데이터의 지속적 전달 : 엉망인 데이터가 아닌 정제된 데이터의 지속적 전달이 매우 중요.
- 레벨 4 : EDA의 지속적 전달 : 머신 러닝 모델이 실제로 무엇을 하는데 설명하는지 도움이 필요. 예측의 관점에서는 답을 어떻게 얻었나 보다 예측이 정확한지에 더 중점을 둠.
- 레벨 5 : 전통적 ML과 AutoML의 지속적 전달 : 무언가를 자동화하는 것에 대해 이야기하면 결국 자동화가 될 것이다. 라는 말과 같이 머신러닝의 상당 부분이 자동화될 예정. 그러므로 업무의 특성이 변화할 것으로 예측할 수 있음. 일부 업무는 좀 더 전문적인 기술을 요할 것이며, 어떤 업무들은 자동화될 것.
- 레벨 6 : ML 운영 피드백 루프 : 머신러닝의 핵심은 모델을 만들고 무언가를 예층하는 것. 모델이 프로덕션에 없다면 의미가 없음. 

머신러닝 핵심 용어
- 머신러닝 : 샘플 또는 학슴 데이터를 기반으로 수학 모델을 만드는 방법
- 모델 : 머신러닝 애플리케이션에 있는 결과물. 간단한 예는 일차방정식
- 피처 : 머신러닝 모델 생성의 시그널로 사용되는 스프레드시트의 칼럼
- 타깃 : 예측하고자 하는 스프레드시트의 칼럼
- 지도 머신러닝 : 이미 알고 있는 정확한 과거 값을 바탕으로 미래 값을 예측하는 머신러닝의 한 유형
- 비지도 머신러닝 : 미분류 데이터로 동작하는 머신러닝의 한 유형. 미래 값을 예측하는 대신 클러스터링 같은 도구를 이용해 숨겨진 패턴을 찾아 레이블로 사용할 수 있음.
- 딥러닝 : 인공 신경망을 사용하는 머신러닝의 한 유형으로 지도 또는 비지도 머신러닝에서 사용 가능. 가장 인기 있는 프레임워크는 텐서 플로우.
- 사이킷런 : 파이썬에서 가장 많이 쓰이는 머신러닝 프레임워크 중 하나
- 판다스 : 데이터 조작 및 분석에 가장 많이 사용되는 라이브러리 중 한나
- 넘파이 : 저수준의 과학적 컴퓨팅에 널리 쓰이는 파이썬 라이브러리. 대규모의 다차원 배열을 지원하며 고수준의 수학 함수를 대거 보유하고 있음.

 

반응형
Comments