본문 바로가기

AI43

[sklearn] 데이터 전처리 - 1) 데이터 인코딩 데이터 전처리는 ML 알고리즘 만큼 중요합니다. GIGO (Garbage In, Garbage Out) 이라고 하죠. 머신러닝을 위한 대표적인 인코딩 방식은 2가지가 있습니다. 1) 레이블 인코딩 (Label Encoding) : 카테고리 피처를 코드형 숫자값으로 변환 2) 원-핫 인코딩 (One-Hot Encoding) 먼저 레이블 인코딩에 대해 알아보겠습니다. 레이블 인코딩 사이킷런의 레이블 인코딩은 LabelEncoder 클래스로 구현합니다. LabelEncoder 객체 생성 후 fit()과 transform()을 호출해 레이블 인코딩을 수행합니다. from sklearn.preprocessing import LabelEncoder items = ['우유', '계란', '치즈', '요거트', '식빵.. 2023. 7. 24.

[ChatGPT] GPT 4.0 분석 얼마전 OpenAI에서 GPT 4.0을 발표하며, 공식 홈페이지에 관련 내용을 기술해놓았다. https://openai.com/research/gpt-4 GPT-4 We’ve created GPT-4, the latest milestone in OpenAI’s effort in scaling up deep learning. GPT-4 is a large multimodal model (accepting image and text inputs, emitting text outputs) that, while less capable than humans in many real-world scenarios, exhi openai.com 테크니컬 리포트도 함께 발표했는데, 무려 100장에 이르른다.. 물론 app.. 2023. 4. 14.

[ChatGPT] ChatGPT 리뷰 - 금융관련 질의로 테스트 얼마전 OpenAI에서 ChatGPT를 공개해서 화제가 되고 있다. ChatGPT는 대형 언어모델인 'GPT-3.5' 시리즈의 대화형 모델로, 해당 시리즈에는 자연어처리 모델인 '다빈치-003'도 함께 공개되었다. 자세한 정보는 아래 홈페이지에서 확인 할 수 있다. https://openai.com/blog/chatgpt/ ChatGPT: Optimizing Language Models for Dialogue We’ve trained a model called ChatGPT which interacts in a conversational way. The dialogue format makes it possible for ChatGPT to answer followup questions, admit its.. 2022. 12. 7.

[논문리뷰] Diffusion-LM Improves Controllable Text Generation https://deepai.org/publication/diffusion-lm-improves-controllable-text-generation Diffusion-LM Improves Controllable Text Generation 05/27/22 - Controlling the behavior of language models (LMs) without re-training is a major open problem in natural language generation. Whil... deepai.org Abstract re-training 없이 language models (LMs)의 행동을 컨트롤하는 것은 NLP에서 major open problem임. 최근 연구들에서 simple senten.. 2022. 9. 20.

이전 1 ··· 6 7 8 9 10 11 다음

티스토리툴바