반응형
(예전에... 기억이잘 ....)
최소 제곱법
Xtrain, Xtest, ytrain, ytest = train_test_split(data, target, random_state=10)
4개로 쪼개서 변수에 넣어줌
- 회귀모델은 MSE , R의제곱 (R스퀘어)
- 분류모델은 acc(0~1)
OverFitting
- 데이터가 많을 수록 좋다
- Feature 개수 줄인다.
- 적절한 파라미터 조정
- 정규화 (Regularization)
High Variance , High Bias >> 많이 있는 문제
학습 많이하면 복잡도가 높아짐
적절히 조정해야한다.
Ridge
Ridge 모형에서는 가중치들의 제곱합(squared sum of weights)을 최소화하는 것을 추가적인 제약 조건으로 한다
from sklearn.preprocessing import StandardScaler, Normalizer
std_data = StandardScaler().fit_transform(data)
std_data
Fit 와 transfom 따로하기를 합쳐 놓은 것
-----------------------------
데이터를 준비할 때 2차원 형태가 되어야 한다.
예를들면
# 데이터 준비
x_data = [x for x in range(10)]
x_data
가 아닌
x_data = [[x] for x in range(10)]
x_data
로 해서 10행 1열로 나오게
[[0], [1], [2], [3], [4], [5], [6], [7], [8], [9]]
x_data 입력
y_data
반응형