ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 데이터 분석을 위한 연장 3 - 패키지(packages)
    머신러닝 with R 2019. 6. 30. 17:47

    패키지는 간단히 말해서 함수들의 꾸러미이다. 하나의 패키지 안에는 다양한 함수가 들어있으며, 함수를 사용하기 위해서는 그 함수가 포함된 패키지를 설치해야 한다.

     

    예시로 R의 시각화에서 빠지지 않는다는 "ggplot2"라는 패키지를 설치해보자.

     

    install.packages("ggplot2")
    library("ggplot2")

     

    install.packages("패키지 명칭") 명령을 통해 원하는 패키지를 설치한 후  library( )로 패키지를 로드해야 포함된 함수를 사용할 수 있다. 에러 없이 로드가 된다면 설치가 잘 된 것이다.

    필자는 처음 설치할 때 다음과 같은 메시지가 뜨면서 오류가 났다.

     

    처음에는 경로 때문에 설치가 안 되는 줄 알았는데, 구글링을 통해 관리자 권한으로 실행시켜 보면 된다고 해서 따라 해 보았더니 정말 설치가 잘 되었다. 그러면 이제 ggplot2 패키지에 내장되어 있는 함수를 사용해 보자!

     

    x <- c("a", "a", "b", "c")		# 여러 문자로 구성된 변수 생성
    x
    
    qplot(x) 	#빈도 그래프 출력
    
    qplot(data = mpg, x = hwy)		# data에 mpg, x축에 hwy 변수를 지정하여 그래프 생성
    
    qplot(data = mpg, x = cty)		# data에 mpg, x축에 cty
    
    qplot(data = mpg, x = drv, y = hwy)		# x축에 drv, y 축에 hwy
    
    qplot(data = mpg, x = drv, y = hwy, geom = "line")		# x축에 drv, y축에 hwy, 선 그래프 형태
    
    qplot(data = mpg, x = drv, y = hwy, geom = "boxplot")	# x축에 drv, y축에 hwy, 상자 그래프 형태
    
    qplot(data = mpg, x = drv, y = hwy, geom = "boxplot", colour = drv)	# drv별 색 표현

     

    3번째 줄 코드를 실행시켜 보면,

    plot 창에서 다음과 같은 그래프를 얻을 수 있다.

    각각의 줄을 ctrl+Enter로 실행시켜 그래프 결과를 확인해 보자.

    마지막 코드를 실행시켰을 때 다음과 같은 그래프를 얻을 수 있다.

     

     

     

     

    ★TIP★

    여기서 mpg 데이터가 무엇인지, qplot 함수의 의미나 사용법 등 기능에 대해 궁금할 수 있다.

    그럴 때는 콘솔창에 ?qplot?mpg 를 입력하여 그 기능을 확인 가능하다.

    ?는 help함수이며, help창에 해당 함수에 대한 설명을 볼 수 있다. 즉, help 함수는 도움말이라고 보면 된다. 필요한 함수들은 구글을 통해 검색할 수도 있지만 help를 이용한다면 더 빠르고 정확하게 해당 함수의 기능을 알 수 있다.

     

     

    위 사진은 ?mpg 를 실행시켰을 때 나온 도움말이다. mpg는 ggplot2에 포함되어 있는 데이터이며, 간단히 말해서 Fuel economy에 대한 데이터이고 스크롤을 아래로 내리면 hwy, drv 등 mpg에 포함된 변수에 대한 설명도 확인할 수 있다.

     

     

     

     

     

     

    반응형

    댓글

Designed by Tistory.