반응형 데이터 전처리1 [sklearn] 데이터 전처리 - 1) 데이터 인코딩 데이터 전처리는 ML 알고리즘 만큼 중요합니다. GIGO (Garbage In, Garbage Out) 이라고 하죠. 머신러닝을 위한 대표적인 인코딩 방식은 2가지가 있습니다. 1) 레이블 인코딩 (Label Encoding) : 카테고리 피처를 코드형 숫자값으로 변환 2) 원-핫 인코딩 (One-Hot Encoding) 먼저 레이블 인코딩에 대해 알아보겠습니다. 레이블 인코딩 사이킷런의 레이블 인코딩은 LabelEncoder 클래스로 구현합니다. LabelEncoder 객체 생성 후 fit()과 transform()을 호출해 레이블 인코딩을 수행합니다. from sklearn.preprocessing import LabelEncoder items = ['우유', '계란', '치즈', '요거트', '식빵.. 2023. 7. 24. 이전 1 다음 반응형