cnn

불균형 데이터: 정상 범주의 관측시 수와 이상 범주의 관측치 수의 차이가 크게 나타날 때( + 클래스 별 관측치의 수가 현저하게 차이나는 데이터) 문제인 이유: 정상(다수)를 정확히 분류하는 것과 이상(소수)을 정확히 분류하는 것 중 이상(소수를 정확히 분류하는 것이 더 중요하다) 성능평가 위 문제에 대한 해결 방안 데이터를 조정: 샘플링 기법(Sampling Method) 언더 샘플링 오버 샘플링 모델을 조정: 비용 기반 학습(Cost sensitive learning) 단일 클래스 분류 기법(Novelty detection) 언더 샘플링(Undersampling) 다수 범주를 줄여 소수 범주의 개수와 비슷하게 만들자 Random Undersampling 다수 범주에 속한 관측치를 무작위로 줄인다: 매..
HBijou
'cnn' 태그의 글 목록