Notice
Recent Posts
Recent Comments
Link
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
Tags
more
Archives
Today
Total
관리 메뉴

류동균의 R 공부방입니다.

캐글(Kaggle) 본문

Data Analysis

캐글(Kaggle)

R쟁이 2019. 9. 28. 20:23

데이터 분석에 대해 공부하던 중 Kaggle이라는 사이트를 알게 되었다.

 

이번엔 캐글의 소개와 데이터 분석(주제 : Titanic)에 참가하는 글을 써볼 예정이다.

 

Kaggle을 한문장으로 표현하면 데이터분석 경연대회 같은 것이다. 여러가지 분석 주제가 있고

 

상금또한 걸려있다. 하지만 너무어려운 주제로 접근하기에는 무리가 있으니 이미 기한이 끝난 

 

Titanic이라는 주제의 Competition에 참가해 보자. 우선 Kaggle에 접속을 로그인을 해보자.

 

- 구글로 로그인을 하는 것을 추천

 

캐글 : Kaggle

 

Kaggle: Your Home for Data Science

 

www.kaggle.com

로그인을 했다면 다음과 같은 화면이 나올 것이다. 여기서 Competition을 눌러보자.

 

여러가지 Competiton이 나올텐대 우리는 Search Competiton에 Titanic이라고 입력을 하고

 

나오는 주제를 눌러보자.

 

카테고리가 몇개 나올텐대 간단하게 소개해 보겠다.

 

Overview : 주제에 대한 전반적인 내용, 자주하는 질문 등

 

Data : 데이터의 구분, 컬럼에 대한 간단한 설명

 

Notebook : 웹에서 콘솔을 만들어 사용 할 수 있다. 다른 사람의 작업을 참고 할 수 있다.

 

Discussion : Competition 유저들끼리 주제에 대해 토론을 할 수 있는 공간.

 

LeaderBorad : Competition 유저들 간의 Score(정확도)를 순위를 매겨놓은 곳

 

Rules : 참가하는대에 간단한 룰

 

이제 전반적인 내용, 데이터 등 여러 카테고리를 살펴보았으면 Join Competiton을 누르고

 

참가해보자.

 

 

 

간단하게 캐글을 소개하고 Titanic이라는 주제의 Competiton에 참가해 보았다.

 

Titanic 데이터를 분석하는 글은 다음의 URL에 들어가 글을 봐주길 바란다. 

 

- Rpubs 타이타닉 데이터 분석 : http://rpubs.com/ryoo/kaggle_titanic