Jacob's Coding Playground

Sentimental Analysis에 도전해 봅시다! Part I

April 5, 2015

이번엔 드디어 저도 답을 모르고 시작하는 실전 데이터 분석에 대해서 다뤄보겠습니다. 주제는 이미 Kaggle에서 마감된 과제이지만, 그래도 해보고 싶었던 Sentimental Analysis에 대해서 해보려고 합니다. (자료출처 : Kaggle) Kaggle은 open competition으로 굉장히 유명하고 잘 정립된 사이트이니 data mining에 관심있으신 분들은 꾸준히 도전해보고 연습하시면 굉장히 많은 도움이 될 것입니다.

R을 이용한 Text Processing - 2

April 4, 2015

저번 포스팅에 이어서 계속해서 R로 하는 text processing을 알아보겠습니다. 일단은 hist함수를 통해서 주 이름의 글자수를 histogram으로 나타내 보겠습니다.

states=rownames(USArrests)
hist(nchar(states), main = "Histogram", xlab = "# Chars")

center 그럼 이번엔 주 이름에서 모음의 분포는 어떻게 될까요? gregexpr을 이용해서 해당 패턴이 언제 등장하는지 알 수 있게 됩니다.

R을 이용한 Text Processing - 1

April 4, 2015

이번에 우리가 예제로 사용할 dataset은 USArrests라는 미국 각 주의 범죄율에 관련한 데이터입니다. 물론 우리는 text processing에 관심이 있기 때문에 주의 이름만을 참조할 예정입니다 :) 간단하게 dataset이 어떻게 생겼는지 확인해 봅시다.

head(USArrests)

##            Murder Assault UrbanPop Rape
## Alabama      13.2     236       58 21.2
## Alaska       10.0     263       48 44.5
## Arizona       8.1     294       80 31.0
## Arkansas      8.8     190       50 19.5
## California    9.0     276       91 40.6
## Colorado      7.9     204       78 38.7

각 행이 하나의 주라는 것을 알 수 있죠? 각 행의 이름이 주의 이름이기 때문에 rownames함수를 사용해 이들을 vector형태로 가지고 오겠습니다.

(문제) 스네이프 교수와 사다리

April 2, 2015

[문제출처 : Codechef] 스네이프 교수는 많은 마법약을 가지고 있습니다. 그래서 그 마법약들이 천장까지 찬장에 쌓여있습니다. 현재 사용하고 있는 사다리로는 약들을 꺼내기가 어려워 새로운 사다리를 만들려고 합니다. 하지만 아쉽게도 다이애건 앨리에 갈 시간은 없네요.. 그래서 스네이프 교수는 론에게 사다리를 아래와 같은 모양으로 만들라고 시켰습니다.

LS와 B가 주어졌을 때, 론이 만들 수 있는 사다리의 RS 길이는 어떤 범위를 가질까요?

(문제) 동전 뒤집기 게임

April 1, 2015

[문제출처 : Codechef] N개의 동전이 있습니다. 처음에 이 모든 동전들은 똑같이 앞면이거나 똑같이 뒷면으로 놓여있습니다. 이제 플레이어가 N라운드를 진행한다고 생각해봅시다. 각 k번째 라운드에서는 1~k번째 동전을 뒤집습니다. 예를 들면, 1라운드에서는 첫번째 동전을 뒤집고, 2라운드에서는 첫번째, 두번째 동전을 뒤집습니다. 이렇게 N라운드까지 진행하면 최종적으로 앞면 또는 뒷면으로 놓여있는 동전의 개수는 몇개일까요?