머신러닝2

(예전에... 기억이잘 ....)

최소 제곱법

Xtrain, Xtest, ytrain, ytest = train_test_split(data, target, random_state=10)

4개로 쪼개서 변수에 넣어줌

회귀모델은 MSE , R의제곱 (R스퀘어)
분류모델은 acc(0~1)

OverFitting

데이터가 많을 수록 좋다
Feature 개수 줄인다.
적절한 파라미터 조정
정규화 (Regularization)

High Variance , High Bias >> 많이 있는 문제

학습 많이하면 복잡도가 높아짐

적절히 조정해야한다.

Ridge

Ridge 모형에서는 가중치들의 제곱합(squared sum of weights)을 최소화하는 것을 추가적인 제약 조건으로 한다

from sklearn.preprocessing import StandardScaler, Normalizer

std_data = StandardScaler().fit_transform(data)
std_data

Fit 와 transfom 따로하기를 합쳐 놓은 것

-----------------------------

데이터를 준비할 때 2차원 형태가 되어야 한다.

예를들면

# 데이터 준비

x_data = [x for x in range(10)]

x_data

가 아닌

x_data = [[x] for x in range(10)]

x_data

로 해서 10행 1열로 나오게

[[0], [1], [2], [3], [4], [5], [6], [7], [8], [9]]

x_data 입력

y_data

저작자표시

'CS > 머신러닝' 카테고리의 다른 글

머신러닝1 (1)	2020.11.23

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

개발 잡학사전

머신러닝2

'CS > 머신러닝' 카테고리의 다른 글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

머신러닝2

'CS > 머신러닝' 카테고리의 다른 글

관련글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역