류동균의 R 공부방입니다.
혼동행렬(Confusion Maxtrix) 본문
혼동행렬에 대해 알아보려고 한다. 혼동행렬은 클래스의 분류의 결과를 정리한 표이며 모델
의 성능을 파악하는 지표라고 할 수 있다. 혼동행렬은 2 x 2 의 행렬로 다음과 같이 구성된다.
혼동행렬을 통하여 다음과 같은 지표를 얻을 수 있다.
특이도(Specificity)
민감도(Sensitivity)
양성 예측도(Positive Prediction Value)
음석 예측도(Negative prediction Value)
긍정오류율(False Positive Rate)
부정오류율(False Negative Rate)
정확도(Accuracy)
다음의 그림과 설명을 통해 이러한 지표들을 개념과 구하는 공식을 알아보자.
이렇게 혼동행렬의 개념과 구하는 공식을 알아보았다.
그럼 의사결정나무에서 공부한 내용을 가지고 의사결정 나무 모델의 혼동행렬을 구해보자.
# 혼동행렬 패키지
library(caret)
# confusionMatrix of decision tree(iris)
confusionMatrix(rpart_p, test_set$Species)
이렇게 간단하게 혼동행렬을 구해보았다.
혼동행렬은 모델의 정확성을 파악 할 수 있고, 여러 value들의 값을 통해 더좋은 model을 만들 수 있는 지표가 된다.
'Data Analysis' 카테고리의 다른 글
서울시 먹거리분석 #1 (0) | 2019.10.16 |
---|---|
K-겹 교차검증(K- fold Cross Validation) (0) | 2019.10.02 |
캐글(Kaggle) (0) | 2019.09.28 |
R로 카카오톡 채팅 분석하기 #1 (텍스트마이닝, 비정형데이터의 정형화) (0) | 2019.08.31 |
프리미어리그 데이터분석(feat 크롤링) (0) | 2019.08.06 |