dbscan
-
[R 데이터 분석] 밀도기반 군집분석 (DBSCAN, Density-Based Spatial Clustering of Applications with Noise)머신러닝 with R 2019. 9. 6. 14:35
밀도기반 군집분석(DBSCAN) 이란? 데이터의 위치 정보를 사용하여 군집 생성 밀도기반의 의미? 점들이 밀집된 곳을 하나의 군집으로 보는 것 노이즈 (아무 군집에도 들어가지 않는 데이터, 필요없는 값)을 제외시킴 어떠한 Dataset에 적합한가? 1) 군집의 크기가 다른 원형 데이터 셋 2) 블록 형태가 아닌 (nonconvex) 데이터 셋 3) 모양도 각기 다르고 노이즈가 있는 데이터 셋 --> 데이터셋 1,2,3 모두에 적합함 즉, k-means에서 만들지 못한 군집을 만들 수 있다. 크기가 각각 다르거나, 작거나, 다양한 기하학적 형태의 군집도 잘 분류 할 수 있다. 주요 파라미터 ε- 거리(eps): 하나의 개체를 중심으로 eps 거리 내 몇개의 점이 있는지 파악. 이 숫자가 정해진 밀도보다 크..