일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
- 칵테일러브좀비
- 선량한차별주의자
- 파이썬
- 로맹가리
- 시선으로부터
- 파레토그림
- 진짜 게으른 사람이 쓴 게으름 탈출법
- 여름의빌라
- 천선란
- 주피터노트북
- scikit-learn
- 보스턴숄더백
- 천개의파랑
- 코딩테스트
- Bostonshoulderbag
- 점프투파이썬
- 정세랑
- 머신러닝
- 에밀아자르
- K-NN
- 자기앞의생
- 도수다각형
- 붕대감기
- 백수린
- 점도표
- 사이킷런
- 알고리즘
- Python
- 레귤러
- 백준
- Today
- Total
목록Machine Learning (22)
Blog
패키지 불러오기¶ In [1]: %matplotlib inline from IPython.display import display import numpy as np import matplotlib.pyplot as plt import pandas as pd import mglearn 5.3 평가 지표와 측정¶ 분류에서의 평가 지표: 정확도 회귀에서의 평가 지표: R² 5.3.2 이진 분류의 평가 지표¶ 한 클래스가 다른 클래스보다 훨씬 많은 불균형 데이터셋에서는 정확도가 평가 지표로 적절하지 않음 digits 데이터셋을 사용하여 숫자 9를 다른 숫자와 구분해서 9:1의 불균형한 데이터셋 만들기¶ In [2]: from sklearn.datasets import load_digits from sklearn..
분류 성능 평가 지표-오차행렬 (Confusion Matrix) 행렬 요소의 Negative, Positive는 예측 입장 ! Precision(정밀도)모델이 True라고 분류한 것 중에서 실제 True인 것의 비율 $$(Precision) = \frac{TP}{TP + FP}$$ → 양성 예측의 정확도 Recall(재현율)실제 True인 것 중에서 모델이 True라고 예측한 것의 비율 = Sensitivity(민감도), True Positive Rate(TPR) $$(Recall) = \frac{TP}{TP + FN}$$ 즉, Precision이나 Recall은 모두 실제 True인 정답을 모델이 True라고 예측한 경우에 관심이 있으나, 바라보고자 하는 관점만 다릅니다. Precision은 모델의 입..
패키지 불러오기¶ In [1]: %matplotlib inline from IPython.display import display import numpy as np import matplotlib.pyplot as plt import pandas as pd import mglearn 5.2 그리드 서치(grid search)¶ 관심있는 매개변수들을 대상으로 가능한 모든 조합 시도 매개변수를 튜닝하여 모델의 일반화 성능 개선 목적 5.2.1 간단한 그리드 서치¶ In [2]: from sklearn.svm import SVC from sklearn.model_selection import train_test_split from sklearn.datasets import load_iris iris = loa..
패키지 불러오기¶ In [1]: %matplotlib inline from IPython.display import display import numpy as np import matplotlib.pyplot as plt import pandas as pd import mglearn CHAPTER 5 모델 평가와 성능 향상¶모델 평가 과정¶ In [2]: from sklearn.datasets import make_blobs from sklearn.linear_model import LogisticRegression from sklearn.model_selection import train_test_split # 인위적인 데이터셋 만들기 X, y = make_blobs(random_state=0) # 데..
In [1]: # 티스토리 관련 설정 from IPython.core.display import display, HTML display(HTML("")) 패키지 불러오기¶ In [2]: %matplotlib inline from IPython.display import display import numpy as np import matplotlib.pyplot as plt import pandas as pd import mglearn 4.8 전문가 지식 활용¶날짜(시간, 요일)를 이용하여 특정 장소의 자전거 대여 횟수 예측¶ In [3]: # 데이터 읽기: 2015년 8월의 3시간 간격 데이터 citibike = mglearn.datasets.load_citibike() print('시티 바이크 ..
In [1]: # 티스토리 관련 설정 from IPython.core.display import display, HTML display(HTML("")) 패키지 불러오기¶ In [2]: %matplotlib inline from IPython.display import display import numpy as np import matplotlib.pyplot as plt import pandas as pd import mglearn 4.7 특성 자동 선택¶ 데이터를 Training set와 Test set로 나눈 후 Training data만 특성 선택에 사용해야함 타겟도 필요 -> 지도 학습 1) 일변량 통계(Univariate statistics)¶ 개개의 특성과 타겟 사이에 중요한 통계적 관계가 ..
In [1]: # 티스토리 관련 설정 from IPython.core.display import display, HTML display(HTML("")) 패키지 불러오기¶ In [2]: %matplotlib inline from IPython.display import display import numpy as np import matplotlib.pyplot as plt import pandas as pd import mglearn 4.4 구간 분할, 이산화 그리고 선형 모델, 트리 모델¶ 연속형 특성을 구간 분할(Binning, =이산화)하면 선형 모델의 경우 예측 결과가 유연해져서 성능 향상 그러나 트리 모델의 경우 Bad wave 데이터셋(입출력 모두 연속형인 1차원 데이터셋)을 이용하여 선형 회..
In [1]: # 티스토리 관련 설정 from IPython.core.display import display, HTML display(HTML("")) 패키지 불러오기¶ In [2]: %matplotlib inline from IPython.display import display import numpy as np import matplotlib.pyplot as plt import pandas as pd import mglearn CHAPTER 4 데이터 표현과 특성 공학¶ 연속형 특성(Continuous feature) 범주형 특성(Categorical feature), 이산형 특성(Discrete feature) 4.1 범주형 변수¶4.1.1 원-핫-인코딩(one-hot-encoding)¶ = o..