[Dimensionality Reduction] 주성분 분석 (PCA, Principal Components Analysis) - 1
본 글에서는 차원 축소 (Dimensionality Reduction) 기법 중, 가장 널리 사용되었던 주성분 분석 (PCA)에 대해 살펴보고자 합니다. PCA의 개념 및 이론에 대해 자세히 살펴보지는 않고, 예제 데이터를 바탕으로 진행되는 분석 과정에 좀 더 집중할 것입니다. 활용한 예제 데이터는 Kaggle 사이트에서 제공되는 유방함 환자 데이터 (Breast Cancer Wisconsin)로, 유방암의 양성 여부, 종양의 반경, 둘레 면적 등의 정보와 각 변수들의 평균, 표준편차, 상위 3개 값의 평균을 포함하고 있어 총 32개의 변수를 가지고 있습니다. 데이터는 총 569개였으며, 분석 툴로는 R을 활용하였습니다. 전체적인 분석 과정을 요약하면, (1) 원본 데이터, (2) PCA를 적용한 데이터..
2022. 10. 27.