Notice
Recent Posts
Recent Comments
Link
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
Tags
more
Archives
Today
Total
관리 메뉴

류동균의 R 공부방입니다.

혼동행렬(Confusion Maxtrix) 본문

Data Analysis

혼동행렬(Confusion Maxtrix)

R쟁이 2019. 9. 22. 21:20

혼동행렬에 대해 알아보려고 한다. 혼동행렬은 클래스의 분류의 결과를 정리한 표이며 모델

의 성능을 파악하는 지표라고 할 수 있다. 혼동행렬은 2 x 2 의 행렬로 다음과 같이 구성된다.

 

혼동행렬을 통하여 다음과 같은 지표를 얻을 수 있다.

 

특이도(Specificity)

민감도(Sensitivity)

양성 예측도(Positive Prediction Value)

음석 예측도(Negative prediction Value)

긍정오류율(False Positive Rate)

부정오류율(False Negative Rate)

정확도(Accuracy)

 

다음의 그림과 설명을 통해 이러한 지표들을 개념과 구하는 공식을 알아보자.

 

이렇게 혼동행렬의 개념과 구하는 공식을 알아보았다.

 

그럼 의사결정나무에서 공부한 내용을 가지고 의사결정 나무 모델의 혼동행렬을 구해보자.

 

# 혼동행렬 패키지
library(caret)

# confusionMatrix of decision tree(iris)
confusionMatrix(rpart_p, test_set$Species)

이렇게 간단하게 혼동행렬을 구해보았다.

 

혼동행렬은 모델의 정확성을 파악 할 수 있고, 여러 value들의 값을 통해 더좋은 model을 만들 수 있는 지표가 된다.