본문 바로가기
CS/머신러닝

머신러닝2

by zieunee 2020. 11. 24.
반응형

(예전에... 기억이잘 ....)

 

최소 제곱법

Xtrain, Xtest, ytrain, ytest = train_test_split(data, target, random_state=10)

 

4개로 쪼개서 변수에 넣어줌

 

  • 회귀모델은 MSE , R의제곱 (R스퀘어)
  • 분류모델은 acc(0~1)

 

 

OverFitting

 

  • 데이터가 많을 수록 좋다
  • Feature 개수 줄인다.
  • 적절한 파라미터 조정
  • 정규화 (Regularization)

 

 

 

 

High Variance , High Bias  >> 많이 있는 문제

 

 

학습 많이하면 복잡도가 높아짐

적절히 조정해야한다.

 

Ridge

Ridge 모형에서는 가중치들의 제곱합(squared sum of weights)을 최소화하는 것을 추가적인 제약 조건으로 한다

 

 

from sklearn.preprocessing import StandardScaler, Normalizer

std_data = StandardScaler().fit_transform(data)
std_data

 

Fit transfom 따로하기를 합쳐 놓은

 

-----------------------------

 

데이터를 준비할 2차원 형태가 되어야 한다.

예를들면

 

데이터 준비

x_data = [x for x in range(10)]

x_data

아닌

 

x_data = [[x] for x in range(10)]

 

 

x_data

 

해서 10 1열로 나오게

[[0], [1], [2], [3], [4], [5], [6], [7], [8], [9]]

 

 

x_data 입력

y_data

반응형

'CS > 머신러닝' 카테고리의 다른 글

머신러닝1  (1) 2020.11.23