R (윈도우즈 Windows 10) | 프로그래밍 언어 R 설치하기
Sep 17, 2021
R을 활용해야 하는 이유
R은 강력하다.
R은 매력적이다.
R은 R흠답다.
R은 유명하다. 단, 우리나라에서는 그렇지 않을 수도 있다.
R은 세계적으로 유명하고 널리 사용된다. 따라서 수많은 커뮤티니가 생태계를 형성한다.
R은 IDE에 대한 고민을 할 필요가 없다. Rstudio라는 환상적인 IDE가 있다.
R은 Rstudio가 있다. Rstudio를 사용할 수 있다는 자체가 장점이다.
수 많은 이유들 중 아주 결정적인 최고의 이유는 …
R은 무료이다.
다만,
R은 예민하다.
그래서
R은 어렵다.
그러나 다른 언어로 하는 Coding은 더 어렵다. 쉽다고 하여 유명한 Python도 더 어렵다. 회계를 하는 많은 사람은 개발자(프로그래머)가 아니다. 개발자를 위한 일반적인 프로그램 개발 언어는 개발자가 쉽게 받아들일 수 있다. 그러나 개발 경험이 없는 일반 사용자는 검은 화면에 프롬프트가 껌벅이는 것을 보기만 해도 블랙홀에 빠져버린 듯 공황 상태에 놓일 수가 있다.
TIOBE 에서는 매달 프로그래밍 언어의 순위를 정하고 있는데 여기에서 1등은 거의 C가 차지한다. 개발자 위주의 순위이기 때문이다. 여기에 쟁쟁한 개발 목적 언어가 많은데 그 안에서 R이 10위 안에 보통 진입한다. 개발자가 사용하지도 않는데 그렇다는 것은 개발자가 아닌 사람이 사용하는 언어라고 한정하여 Sort한다면 당당하게 1위를 차지할 것임을 짐작해 볼 수도 있겠다.
Excel을 신이 내린 Software라고 한다. 실제로 Excel은 Spreadsheet 중 단연 최고이다. Excel이 온 세상을 Spreadsheet를 사용해서 문서를 쓰거나 계산을 하거나 일정 부분은 자동화까지 할 수 있게 만들었다.
Excel은 이제 대중적이고 누구나 사용하는 기본이며 필수품이 되었다. 그러나 엑셀은 Speadsheet라는 기본기에 충실하므로 엑셀로 하지 못하는 자동화나 엑셀이 다루기 힘들거나 불가능한 크기의 Data 분석이 필요할 수가 있다. 각기 다른 일에는 다른 칼을 들이대야 하기 때문이다. 엑셀로 할 수 없는 일이 있을 때 Coding으로 ‘할 수 없음’이 ‘할 수 있음’이 되도록 구현이 가능하다.
엑셀의 단축키를 손가락에 장착하면 업무 처리 속도가 매우 빨라진다. 하지만 사람의 손가락의 한계를 뛰어넘는 방법은 컴퓨터에게 그 일을 하라고 시키는 것이다. 컴퓨터를 부려먹기 위해서는 컴퓨터에게 말을 해야 하고 그 말을 하는 방법이 프로그래밍 언어로 말하는 것이다.
R을 처음 설치할 때 주의하여 조심히 설치하면 R을 사용하면서 당하게 될 불필요한 수 많은 어려움을 당하지 않을 수 있다. R은 Linux를 기준으로 만들어진 것 같다. 설치할 때 선택하는 운영체제 중 가장 위에 Linux가 있고 그 다음 Mac, 가장 아래에 Windows가 있다. Windows가 친숙한 우리나라 풍토에서 이상하게 보일 수 있으나 이상하게 보인다고 하여 Linux와 R이 좋지 않은 것은 아니다.
Windows10의 R 설치를 정리하고자 한다.
(Unix 계열의 Linux와 Mac은 설치 방법이 다소 다르다.)
설치 파일 다운로드
세 개의 설치 파일을 다운로드 받아서 C:\R> 에 위치하도록 한다.
C:\R>
- 설치파일 1 : R CRAN Mirrors Seoul
Download R for Linux (Debian, Fedora/Redhat, Ubuntu)
Download R for macOS
Download R for Windows
셋 중에 가장 아래 Windows를 선택한다.
base를 선택한다. R의 기본 base R을 설치하는 것이다.
Download R 4.1.0 for Windows (86 megabytes, 32/64 bit) - 링크를 찾아서 다운로드
- 설치파일 2 : Rtools Using Rtools40 on Windows
On Windows 64-bit: rtools40v2-x86_64.exe (recommended: includes i386, x64, and x64-ucrt compilers)
- 설치파일 3 : Rstudio Rsrudio Download
파일 실행으로 설치
설치 파일을 실행할 때 마우스 오른쪽 버튼을 눌러서 “관리자 권한으로 실행”(“Run as administrator”)한다.
설치 파일을 base R(R-4.1.0) 부터 순차적으로 실행하여 설치한다.
설치가 완료되면 C:\R>에 세 개의 폴더(R-4.1.0, RStudio, rtools40)가 생성된다.
설치 완료 후 할 일
- R-4.1.0 폴더를 우클릭하여 “속성”(Properties)에서 “읽기 전용”(Read-only)의 체크박스를 해제한다. 적용을 누르면 하위폴더 포함이 선택 되어 있는데 확인을 눌러서 모두 해제한다.
환경 변수 설정 (Edit the system environment)
‘Win + s’ 를 눌러서 검색하거나 돋보기 버튼을 눌러서 검색창에 ‘시스템 환경 변수 편집’ 또는 ‘env’를 검색하면 시스템 환경 변수 편집(Edit the system environment)을 찾을 수 있다. 실행하면 나타나는 창에서 가장 하단에 취소(Cancel) 위에 환경변수를 클릭한다.
위 아래로 나누어진 레이아웃에 “새로 만들기”(New)를 눌러서 다음의 사항을 추가한다.
사용자 변수 (User variables)
“새로 만들기”(New) 눌러서 추가
Variable name : RTOOLS40_HOME
Variable value : C:\R\rtools40\
환경변수 중 Path를 찾아서 “편집”(Edit)을 눌러서 다음을 추가한다.
%RTOOLS40_HOME%\usr\bin\
시스템 변수 (System variables)
“새로 만들기”(New) 눌러서 추가
Variable name : RTOOLS40_HOME
Variable value : C:\R\rtools40\
환경변수 중 Path를 찾아서 “편집”(Edit)을 눌러서 다음을 “새로만들기”(New)로 추가한다.
C:\R\rtools40\usr\bin\
Rstudio 실행
‘Win + s’ 를 눌러서 검색하거나 돋보기 버튼을 눌러서 검색창에 Rstudio를 검색해서 실행한다.
Rstudio는 R을 사용하는데 최적화 된 IDE이다. 심지어 Python을 구동하기에도 좋다. script 실행 방식으로도 구동할 수 있으며 REPL에 R처럼 script에 기록한 Command를 하나씩 던져 주면서 사용할 수도 있다. Python의 변수도 Rstudio의 View() 기능으로 들여다 볼 수 있다.
R을 사용하는데 원시적인 검은 Shell 화면이나 GUI R의 모습을 알아야 할 필요는 없다.(물론 모르는 것보다 아는 것이 좋기는 하지만 ‘검은 화면에서 프롬프트에 명령어를 입력해서 사용하는 프로그래밍 언어 R의 사용을 Rstudio가 편하게 도와주므로 그냥 Rstudio로 R이라는 언어를 사용하면 된다.’ 정도로 이해하면 충분한 것 같다.)
Rstudio의 기본 구성은 4개의 창으로 되어 있으며 각 창에는 여러개의 탭을 포함하고 있다. 처음 Rstudio를 실행했을 때 스크립트 창은 없을 것이지만 ‘Ctrl + Shift + n’ 을 누르면 스크립트가 열린다. 여기에 글자 등을 적어서 저장하면 Rstudio가 알아서 .R 확장자의 파일을 저장한다.
스크립트 창 | 환경 창 |
---|---|
콘솔 창 | 파일 창 |
Rstudio는 수 많은 기능과 단축키가 있으니 차차 알게 되면 R면 R수록 좋다. 가장 단순하게는 Text File을 쓸 때도 메모장 등의 프로그램 대신 사용할 수도 있다.
tidyverse 설치
R은 Packages라는 다른 사람이 제작 해 둔 기능을 붙여서 사용한다.
R의 인기는 원시적인 모습의 base R이 인기를 끌어냈다고 보여지지 않는다. R의 원형은 다른 프로그래밍 언어처럼 생겼지만 R은 쉬운 방법으로 Packages를 설치해서 사용할 수 있다. 훌륭한 Packages가 수도 없이 많지만 핵심적으로 환상적인 데이터 분석 전용 패키지를 묶어서 tidyverse라고 해 두었다. base R은 속도가 빠르지도 않고 무언가 장점이 없어 보이지만 tidyverse는 C++로 만들어서 R에다가 붙였다. C++로 만들었다는 의미는 구동 속도가 아주 빠르다는 것을 의미한다. Rstudio의 Hadley Wickham 등의 인물이 이러한 패키지를 만들어서 R의 인기와 부흥을 이끌었다고 한다.
콘솔(Console) 창에 install.packages(‘tidyverse’)라고 입력하고 Enter를 누르면 tidyverse 패키지가 설치된다. 파일창의 Packages 탭에서 Install 버튼을 눌러서 나타나는 창에 tidyverse를 입력해서 설치해도 된다.
묵직한 패키지들을 여러개 묶어 두었으며 의존성 패키지들을 모두 R이 알아서 설치해 주므로 설치 시간이 오래 걸린다. 중간에 중단하면 낭패에 빠질 수 있으므로 설치가 완료될 때까지 기다려야 한다. (생각보다 오래 걸린다. 처음 설치하는 경우 설치해주어야 하는 의존성 패키지가 많아서 패키지 몇개 설치하는 수준을 넘는다. 30분 이상 걸릴 수도 있으나 인내심을 가지고 기다리거나 다른 일을 하다가 오는 것이 좋다. 오래 걸리면 제대로 설치되는 중인 것이고 금방 끝나면 에러가 나서 중단된 것으로 받아들여야 한다. > | 이런 모습의 프롬프트가 껌벅이고 있으면 끝난 것이다.)
install.packages('tidyverse')
...install~......
library(tidyverse)
-- Attaching packages ----------------------------- tidyverse 1.3.1 --
√ ggplot2 3.3.5 √ purrr 0.3.4
√ tibble 3.1.2 √ dplyr 1.0.7
√ tidyr 1.1.3 √ stringr 1.4.0
√ readr 1.4.0 √ forcats 0.5.1
-- Conflicts -------------------------------------- tidyverse_conflicts() --
x dplyr::filter() masks stats::filter()
x dplyr::lag() masks stats::lag()
- tidyverse라는 패키지를 설치하는 명령어 (따옴표로 묶는 것이 필요)
- tidyverse라는 패키지를 불러오는 명령어 (따옴표 불필요)
설치가 완료되고 나서 Console에 library(tidyverse)를 입력하고 Enter를 누르면 Attaching packages라는 문구와 함께 8개의 패키지가 한번에 붙는다.
성공!