-
데이터 분석을 위한 연장 3 - 패키지(packages)머신러닝 with R 2019. 6. 30. 17:47
패키지는 간단히 말해서 함수들의 꾸러미이다. 하나의 패키지 안에는 다양한 함수가 들어있으며, 함수를 사용하기 위해서는 그 함수가 포함된 패키지를 설치해야 한다.
예시로 R의 시각화에서 빠지지 않는다는 "ggplot2"라는 패키지를 설치해보자.
install.packages("ggplot2") library("ggplot2")
install.packages("패키지 명칭") 명령을 통해 원하는 패키지를 설치한 후 library( )로 패키지를 로드해야 포함된 함수를 사용할 수 있다. 에러 없이 로드가 된다면 설치가 잘 된 것이다.
필자는 처음 설치할 때 다음과 같은 메시지가 뜨면서 오류가 났다.
처음에는 경로 때문에 설치가 안 되는 줄 알았는데, 구글링을 통해 관리자 권한으로 실행시켜 보면 된다고 해서 따라 해 보았더니 정말 설치가 잘 되었다. 그러면 이제 ggplot2 패키지에 내장되어 있는 함수를 사용해 보자!
x <- c("a", "a", "b", "c") # 여러 문자로 구성된 변수 생성 x qplot(x) #빈도 그래프 출력 qplot(data = mpg, x = hwy) # data에 mpg, x축에 hwy 변수를 지정하여 그래프 생성 qplot(data = mpg, x = cty) # data에 mpg, x축에 cty qplot(data = mpg, x = drv, y = hwy) # x축에 drv, y 축에 hwy qplot(data = mpg, x = drv, y = hwy, geom = "line") # x축에 drv, y축에 hwy, 선 그래프 형태 qplot(data = mpg, x = drv, y = hwy, geom = "boxplot") # x축에 drv, y축에 hwy, 상자 그래프 형태 qplot(data = mpg, x = drv, y = hwy, geom = "boxplot", colour = drv) # drv별 색 표현
3번째 줄 코드를 실행시켜 보면,
plot 창에서 다음과 같은 그래프를 얻을 수 있다.
각각의 줄을 ctrl+Enter로 실행시켜 그래프 결과를 확인해 보자.
마지막 코드를 실행시켰을 때 다음과 같은 그래프를 얻을 수 있다.
★TIP★
여기서 mpg 데이터가 무엇인지, qplot 함수의 의미나 사용법 등 기능에 대해 궁금할 수 있다.
그럴 때는 콘솔창에 ?qplot와 ?mpg 를 입력하여 그 기능을 확인 가능하다.
?는 help함수이며, help창에 해당 함수에 대한 설명을 볼 수 있다. 즉, help 함수는 도움말이라고 보면 된다. 필요한 함수들은 구글을 통해 검색할 수도 있지만 help를 이용한다면 더 빠르고 정확하게 해당 함수의 기능을 알 수 있다.
위 사진은 ?mpg 를 실행시켰을 때 나온 도움말이다. mpg는 ggplot2에 포함되어 있는 데이터이며, 간단히 말해서 Fuel economy에 대한 데이터이고 스크롤을 아래로 내리면 hwy, drv 등 mpg에 포함된 변수에 대한 설명도 확인할 수 있다.
반응형'머신러닝 with R' 카테고리의 다른 글
R 데이터 분석의 기초 1. 데이터 파악하기 - head/tail/dim/View/str/summary (0) 2019.07.16 R 데이터 프레임 (Data Frame) / 엑셀, csv 데이터 불러오기 / 데이터 저장하기 / RData (.rda) 파일 (0) 2019.07.01 데이터 분석을 위한 연장 2 - 함수 (function) (0) 2019.06.30 데이터 분석을 위한 연장 1 - 변수(Variable) (0) 2019.06.29 데이터 분석 방법론, CRISP-DM (1) 2019.06.29