-
머신러닝(machine learning)과 R머신러닝 with R 2019. 6. 28. 19:13
정보의 바다라고 불리는 현대에 이제는 정확하고 퀄리티가 좋은 정보를 얻어내는 것이 능력이라고 하는 시대가 되었다.
데이터는 다양한 분야에서 수백, 수천, 수만, 수억,, 그리고 셀 수 없을 정도로 존재하고 있다.
이것을 가공하는 방법, 활용하는 방법을 통해 우리는 훨씬 더 우리의 삶과 밀접한 즉, 정말 필요한 데이터들만 쏙쏙 뽑아낼 수 있게 될 것이다.
머신러닝 (machine learning)은 우리말로 '기계 학습'이라고도 불린다.
말 그대로 기계가 스스로 학습 할 수 있도록 알고리즘을 개발하는 인공지능의 한 분야이다.
컴퓨터에게 데이터를 주면 컴퓨터가 스스로 그 데이터를 통해 패턴을 분석 및 학습하게 되고,
이후 새로운 데이터들이 들어와도 새로운 지식을 얻어 낼 수 있게 된다.
머신러닝은 결국 데이터 분석이 핵심이라고 할 수 있다.
(데이터 분석은 또한 통계와도 연관이 깊다고 하는데, 통계도 함께 공부해야겠다..)
데이터 분석을 하기 위해 사용하는 툴들이 있는데 대표적으로 '파이썬', 'R', 'MATLAB' 등이 있다.
과거에는 엑셀이나 SAS, SPSS 등이 흔하게 사용되었다.
특히 엑셀은 누구나 쉽게 그래프나 표를 통해 데이터를 쉽게 분석하고 활용할 수 있다.
하지만 이번에 배우게 될 R언어는 엑셀보다 더 전문적이고 유용하게 데이터를 시각화할 수 있다.
그렇다면 R은 어떤 것인지, 왜 R을 공부하는지에 대해 정리해보려고 한다.
R은 데이터 분석에 특화된 소프트웨어이다.
즉, R이 만들어진 목적이 데이터 분석과 통계 그리고 시각화인 것이다.
방대하고 다양한 패키지와 즉시 사용 가능한 테스트 SET을 무료로! 제공한다는 것이 R의 최대 강점이며 데이터를 시각화함으로써 효과적으로 의미와 의도를 전달할 수 있다.
반면에 R의 단점도 있는데, R은 읽기 어려운 코드이기 때문에 속도가 느린 편이며, 배우기도 어려운 편이다.
R에 비해 파이썬은 특정분야를 위한 언어가 아니라 다양한 분야에 많이 사용하기 때문에
비교적 쉽고, 직관적이며, 빠르고 활용도 높게 사용될 수 있다.
나를 포함한 대부분의 사람들이 처음에 데이터 분석을 위해 어떤 툴을 공부해야 할지 고민이 될 것이다.
파이썬과 R 각각 장단점이 있지만, 순수 데이터 분석을 위해서는 R이 조금 더 효과적이지 않을까 생각된다.
[참고] R vs. 파이썬 비교
http://media.fastcampus.co.kr/knowledge/dataanalysis-python-r/
반응형'머신러닝 with R' 카테고리의 다른 글
데이터 분석을 위한 연장 3 - 패키지(packages) (0) 2019.06.30 데이터 분석을 위한 연장 2 - 함수 (function) (0) 2019.06.30 데이터 분석을 위한 연장 1 - 변수(Variable) (0) 2019.06.29 데이터 분석 방법론, CRISP-DM (1) 2019.06.29 R과 RStudio 설치하기 (Windows OS 기반) (0) 2019.06.28