0. Introduction
- 해당 강의의 목적성은 해당 강의를 통해서 머신러닝 전문가가 되었으면 좋겠다는 것이다.
- 전반적으로 CS229에선 머신러닝에 대한 내용을 담고있다.
- 기본적인 자료구조, 확률과 통계, 선형대수학에 대해서 베이스를 깔고 간다고 가정하고 진행한다.
1. Machine Learning?
- 해당 강의에서 머신러닝을 정의를 하는데 다음과 같이 정의한다.
- 머신러닝 : "컴퓨터가 명확하게 프로그래밍되지 않고도 학습할 수 있는 능력을 제공한다."
2. Supervised Learning(지도 학습)
- 오늘날 가장 널리 사용되는 머신러닝 도구는 Supervised Learning(지도 학습)이라고 한다.
- Supervised Learning이란 (입력x와 라벨링된 y)가 있는 데이터 셋이 주어졌을때 x -> y로 매핑을 학습하는 것을 의미한다.
2.1. Regression(회귀)
- 다음과 같이 X축이 평, Y축이 가격이라고 주어졌을때
- 파란 x점으로 데이터가 표기 되어 있다고 가정해보자.
- 이때 우리는 1700평일때 가격이 얼마인지를 알고 싶다면,
- 파란 x점을 잘 설명하는 그래프를 그려서 그 그래프의 값을 읽어내면 될 것이다.
- 즉, Regression은 Y가 연속성을 띄고 있다고 가정하에 X에따라 Y가 무엇인지 얻어내는 것을 의미한다.
2.2. Classification(분류)
- x가 부의 상대적 가치고, y가 생존이라고 생각해보자.
- 해당 데이터를 보면 부의 가치가 음이면 생존하지 못하고, 부의 가치가 양이면 생존한다는 것을 알 수 있다.
- 다음과 같이 연속적이지 않고 이산적인 형태로 뛴다는 것을 알 수 있다.
- 분류를 정의하면 다음과 같이 정의가 가능하다.
"Y가 이산적인 개수의 변수를 갖는다는 것"
- 다음과 같이 분류도 가능하기도 하다.
3. Unsupervised Learning(비지도 학습)
- 우리는 앞서서 Supervised Learning은 X에따라 Y라는 레이블이 주어져 있는 데이터를 가지고 학습한다는 것으로 정의했다.
- Unsupervised Learning은 X에 따라 Y라는 레이블이 주어져 있지 않는 데이터를 가지고 학습하는 것을 의미한다.
- 즉, 답지가 없는 데이터를 가지고 학습한다는 것이다. (Clustering이 비지도학습의 예시중 하나이다.)
'DS Study > CS 229(Machine Learning)' 카테고리의 다른 글
[CS 229] [6] Lecture 6 - Support Vector Machines (1) | 2025.01.20 |
---|---|
[CS229] [5] Lecture 5 - GDA & Naive Bayes (0) | 2025.01.17 |
[CS229] [4] Lecture 4 - Perceptron & Generalized Linear Model (0) | 2025.01.14 |
[CS229][3] Lecture 3 - Locally Weighted & Logistic Regression (0) | 2025.01.12 |
[CS229] [2] Lecture 2 - Linear Regression and Gradient Descent (1) | 2025.01.07 |