| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
- 자기앞의생
- 여름의빌라
- K-NN
- 머신러닝
- 점도표
- 붕대감기
- scikit-learn
- 파이썬
- 도수다각형
- Bostonshoulderbag
- 백준
- 칵테일러브좀비
- 정세랑
- Python
- 선량한차별주의자
- 사이킷런
- 에밀아자르
- 백수린
- 파레토그림
- 시선으로부터
- 로맹가리
- 천선란
- 천개의파랑
- 레귤러
- 알고리즘
- 코딩테스트
- 점프투파이썬
- 진짜 게으른 사람이 쓴 게으름 탈출법
- 주피터노트북
- 보스턴숄더백
- Today
- Total
Blog
분류 성능 평가 지표 ─ Precision(정밀도), Recall(재현율), F1 Score, ROC Curve 본문
분류 성능 평가 지표 ─ Precision(정밀도), Recall(재현율), F1 Score, ROC Curve
지요낫 2021. 4. 13. 20:00
분류 성능 평가 지표
-오차행렬 (Confusion Matrix)

행렬 요소의 Negative, Positive는 예측 입장 !
Precision(정밀도)
모델이 True라고 분류한 것 중에서 실제 True인 것의 비율
$$(Precision) = \frac{TP}{TP + FP}$$
→ 양성 예측의 정확도
Recall(재현율)
실제 True인 것 중에서 모델이 True라고 예측한 것의 비율
= Sensitivity(민감도), True Positive Rate(TPR)
$$(Recall) = \frac{TP}{TP + FN}$$
즉, Precision이나 Recall은 모두 실제 True인 정답을 모델이 True라고 예측한 경우에 관심이 있으나, 바라보고자 하는 관점만 다릅니다. Precision은 모델의 입장에서, 그리고 Recall은 실제 정답(data)의 입장에서 정답을 정답이라고 맞춘 경우를 바라보고 있습니다.
…
Precision과 Recall은 상호보완적으로 사용할 수 있으며, 두 지표가 모두 높을 수록 좋은 모델입니다.
Precision과 Recall은 Trade-off 관계
→ True로 분류되는 Threshold(임계값)를 낮추면 Recall 증가, Precision 감소
F1 Score
Precision과 Recall의 조화평균
$$조화평균 = \frac{n}{\frac{1}{a_1} + \frac{1}{a_2} + ... + \frac{1}{a_n}}$$
$$F = 2 * \frac{Precision * Recall}{Precision + Recall}$$
→ 조화평균을 이용하면 산술평균을 이용하는 것보다 큰 비중이 끼치는 bias가 줄어든다고 볼 수 있음
ROC(Receiver Operating Characteristic) 곡선
각 임계값에서 민감도(재현율)에 대한 1-특이도 그래프
*특이도(Specificity) = True Negative Rate(TNR)
실제 False인 것 중에서 모델이 False라고 예측한 것의 비율
*1-특이도 = False Positive Rate(FPR)
$$(Specificity) = \frac{TN}{TN + FP}$$

→ 곡선이 왼쪽 위에 가까울수록 더 좋은 임계값
AUC(Area Under the Curve)
ROC 곡선 아래의 면적
참고
[1] sumniya.tistory.com/26
[2] 파이썬 라이브러리를 활용한 머신러닝
'Machine Learning' 카테고리의 다른 글
| [Python] 모형 평가 지표와 측정 실습 (0) | 2021.04.14 |
|---|---|
| [Python] 그리드서치(Grid search) 실습 (0) | 2021.04.12 |
| [Python] 교차검증(Cross Validation, CV) 실습 (0) | 2021.04.09 |
| [Python] 4-4. 자전거 대여 횟수 예측 실습 (0) | 2021.04.07 |
| [Python] 4-3. 변수선택 실습 (0) | 2021.04.07 |