• Feature Engineering 기본 정리

    Feature Engineering 기본 정리 데이터 사이언스를 공부하면서 Feature selection, extraction, engineering 등 다양한 용어를 접하게 되는데요. 처음 접하면 각각의 차이가 잘 와닿지 않기 때문에 큰 그림에서 정리가 필요하다는 생각에서 이번 포스팅을 준비했습니다. Feature Engineering이란? Feature Engineering in Data Science Process Feature Engineering 구성 Feature Engineering in Feature Generation / Construction...


  • 리그 오브 레전드 게임 승패 예측

    LoL(리그 오브 레전드) 프로게이머 대전 승패 예측하기 elice에서 진행한 데이터사이언티스트 에듀챌린지에서 참여했던 프로젝트입니다. 경진대회 이후 학습을 목적으로 다시 한번 정리해 보았습니다. 목적 LoL 프로게이머 대전 데이터를 이용하여 모델을 학습시킨 후, 주어진 팀 구성원을 보고 어떤 팀이 이길지 판별해야 함 팀은 5:5 로 이루어져 있으며, 각 팀의 플레이어 리스트, 각 플레이어의...


  • 데이터 사이언스(Data Science) 프로세스 정리

    데이터 사이언스(Data Science) 프로세스 정리 이번에는 데이터 사이언스의 전반적인 프로세스에 대해서 정리하도록 하겠습니다. 처음 데이터 사이언스를 공부하면서 다양한 용어와 한가지 주제에 대해서 여러 가지 의견들이 많아서 헷갈렸었는데요. 지금도 마찬가지이지만 지금까지 공부했던 것을 기반으로 나름대로 정리를 해보도록 하겠습니다. 데이터 사이언스 프로세스의 정의 CS109 Data Science in Harvard University KDD Process CRISP-DM...


  • 네이버 영화 리뷰 감정 분석

    네이버 영화 리뷰 감정 분석 elice에서 진행한 데이터사이언티스트 에듀챌린지에서 참여했던 프로젝트입니다. 경진대회 이후 학습을 목적으로 다시 한번 정리해 보았습니다. 목적 네이버 영화 리뷰를 아래 평점 기반으로 학습하여 주어진 영화 리뷰의 평점(감정)을 예측해 본다. NEG: 1 - 3 NEU: 4 - 7 POS: 8 - 10 데이터셋 영화 리뷰 데이터 :...


  • 자연어(NLP) 처리 기초 정리

    자연어(NLP) 처리 기초 정리 본 포스팅은 개인적인 학습을 목적으로 작성되었습니다. 수정해야할 부분이 있으시면 언제든지 댓글 남겨주세요 :) 자연어를 이해하는 방법 한 개의 단어가 어떤 의미를 가지고 있는지를 알기 위해서는 문장의 컨텍스트(Context)를 이해해야 한다. 사람은 ‘Apple’이 사과인지, 회사인지 문맥을 통해 바로 구분할 수 있지만 기계를 할 수 없다. 그리고 ‘메시’를 겁색할...