반응형

간단 지식/R 6

06. 비정형데이터 읽어오기 - scan(), readLines(), read.csv(), 엑셀파일 불러오기

R에서 작업 파일을 불러와야 한다면 사용할 수 있는 함수가 여럿 있다. 일단 작업 환경부터 설정을 하자. 추가적으로 텍스트 파일을 불러올 때 파일의 인코딩이 UTF-8 인지 ANSI인지 확인을 하자. UTF-8인 경우에는 함수의 옵션에 인코딩 옵션을 추가해줘야 한다. > getwd() [1] "C:/Users/sohyeon/Documents" > setwd("C:/Users/sohyeon/Desktop") > getwd() [1] "C:/Users/sohyeon/Desktop" scan() 함수 옵션 없이는 파일은 한 어절 단위로 읽어들이는 함수이다. 문장 단위로 읽어들이고 싶다면 sep 옵션을 사용하도록 하자. 문서가 문자열로만 이루어졌다면 what 옵션을 추가해줘야 한다. > a a [1] "안녕하세..

간단 지식/R 2021.06.24

05. plot(), par(), points(), lines() 함수

아무래도 R언어는 structure 구축이나 software 개발보다는 데이터를 시각화하는 것에 주력인 언어이기 때문에 그와 관련된 함수에 대해 알 필요가 있다. plot() 함수 그래프를 그려주는 함수이다. 형태: plot(x, y, option) option: main = 그래프제목, sub = 그래프부제목, xlab = x축 제목, ylab = y축 제목, type = plot의 형태, axes = 테두리선, col = plot의 색상 type: 'p' = 점 그래프, 'l' = 선 그래프, 'o' = 점이 선과 중첩되며 통과하는 그래프, 'h' = 히스토그램처럼 수직선 형태, 's'/'S' = 계단형 그래프 > age level plot(age, level, main="나이와 레벨", xlab="..

간단 지식/R 2021.06.24

04. vector, matrix, list, data frame

Vector Java나 C에 배열이 있다면 R에는 벡터(vector)가 존재한다. 벡터는 여러건의 데이터를 1차원의 한 열로 관리한다. > var1 var1 [1] 1 2 3 > is.vector(var1)#var1이 벡터인가 [1] TRUE > 2 %in% var1#벡터 var1에 element 2가 있는가 [1] TRUE 벡터 역시 특정 index의 값을 가져올 수 있으며, python처럼 slicing 기능이 있다. > var2 var2[2] [1] "껌" > var2[-2] #특정 행 빼고 조회 [1] "과자" "주스" > var2[2:3] #범위 조회 [1] "껌" "주스" > var2[-1:-3] #범위 빼고 조회 character(0) 차이점이 있다면 배열과 달리 벡터끼리는 연산자를 활용해서..

간단 지식/R 2021.06.24

03. R 패키지 정리

파이썬에서 다양한 라이브러리가 강점이듯, R도 다양한 패키지가 강점이라고 볼 수 있다. 패키지 업데이트는 update.packages("패키지명") 명령어로 할 수 있다. 1. lubridate 패키지 날짜와 관련된 명령어들을 정리한 패키지이다. 설치: install.packages("lubridate") 사용: library(lubridate) > now() [1] "2021-05-11 23:22:29 KST" > date4 year(date4) [1] 2021 > month(date4) [1] 5 > day(date4) [1] 11 이 패키지를 사용하지 않는다면 now()대신 Sys.time()을 사용하면 된다. > Sys.time() [1] "2021-05-11 23:20:11 KST" > date..

간단 지식/R 2021.05.11

02. 데이터 타입과 변수

> var1 = 1 > var2 = "안녕" > var3 = as.Date("2021-05-11") > var4 = "hello world" > var5 = "2021-05-11" > var6 = TRUE R은 변수를 저장할 때 = 외에도 class(var1) [1] "numeric" > class(var3) [1] "Date" > class(var5) [1] "character" > class(var6) [1] "logical > var4 [1] "hello world" 다른 언어와는 달리 팩터 타입이 생소하다. factor 타입이란, 범주형 데이터를 저장하기 위한 데이터 타입이다. 범주형 데이터는 명목형 데이터와 순서형 데이터가 있는데, 명목형은 크고 작음을 비교할 수 없는 데이터, 순서형은 크고 작..

간단 지식/R 2021.05.11

01. R프로그램 설치

아래 url에서 korea를 찾는다. https://cran.r-project.org/mirrors.html 각자 맞는 환경에 따른 exe파일을 다운로드 받은 후 관리자 권한으로 실행시킨다. 설치된 R 프로그램 역시 관리자 권한으로 실행하여 콘솔창을 확인해본다. 그리고 아래와 같이 library를 설치, 실행, 제거까지 해봄으로써 올바르게 설치되었는지를 확인한다. (이 글이 도움이 됐다면 광고 한번씩만 클릭 해주시면 감사드립니다, 더 좋은 정보글 작성하도록 노력하겠습니다 :) )

간단 지식/R 2021.05.11
반응형