반응형 판다스2 [sklearn] 데이터 전처리 - 1) 데이터 인코딩 데이터 전처리는 ML 알고리즘 만큼 중요합니다. GIGO (Garbage In, Garbage Out) 이라고 하죠. 머신러닝을 위한 대표적인 인코딩 방식은 2가지가 있습니다. 1) 레이블 인코딩 (Label Encoding) : 카테고리 피처를 코드형 숫자값으로 변환 2) 원-핫 인코딩 (One-Hot Encoding) 먼저 레이블 인코딩에 대해 알아보겠습니다. 레이블 인코딩 사이킷런의 레이블 인코딩은 LabelEncoder 클래스로 구현합니다. LabelEncoder 객체 생성 후 fit()과 transform()을 호출해 레이블 인코딩을 수행합니다. from sklearn.preprocessing import LabelEncoder items = ['우유', '계란', '치즈', '요거트', '식빵.. 2023. 7. 24. [Pandas] Pandas Cheat Sheet (판다스 치트시트) 데이터 분석에서 정~~~~말 많이 쓰이는 파이썬 라이브러리 판다스. 판다스에서 자주 쓰이는 기능들을 정리해둔 2장짜리 이미지를 치트시트라고 한다. Pandas cheat sheet 원문은 다음과 같다. https://pandas.pydata.org/Pandas_Cheat_Sheet.pdf 2023. 4. 4. 이전 1 다음 반응형