R 소개

728x90

Ch01. R 소개

1절. 서론

  • R언어 : 방대한 자료 실시간 분석하여 결과를 시각화하는 프로그래밍 언어.

2절. R 설치

3절. R언어 기초

[주석 처리] : # 이용

[변수와 자료형]

  • 변수 : 데이터 저장 기능
  • 자료형

실수형 숫자만 사용 문자열 “character형” 논리형 T or F 범주형 Factor형. 산술연산 불가

[산술연산]

  • 기본 연산

: + , - ,* , /(나누기), 지수승(^), 나머지(%%), 몫(%/%)

  • 대입 연산 =
  • 관계 연산

: < , <= , > , >-, ==, !=

  • 논리 연산 : &, |, !

[제어문]

  • If문/for문/while문

[함수 만들기]

함수명 <- function(매개변수) {

        본문
}

4절. 데이터 구조

1) 벡터 | C(...)

  • 같은 종류의 자료형 여러 개 대입하는 자료형
  • C의 배열과 같다

2) 리스트 | list( ...)

  • 다른 종류의 자료형 여러 개 대입하는 자료형
  • C의 구조체와 같다
  • 각 원소 자체를 객체 취급
  • 원소 지정 시, x[ [i] ] 식으로 지정

3) 배열

  • 다 차원 벡터 (2차원 배열은 행렬)
  • 데이터 구조 차원 정의 : dim(1,2,3) (즉, 1행 2열 3면 3차원 구조)

4) 데이터 프레임

  • 데이터 각 열에 변수 이름 적용 (스키마)
  • 프레임 생성 data.frame()

            ⓐ 백터로부터 프레임 작성

            각각의 열 단위 백터 여러 개가 한 개의 데이터 프레임으로 묶여서 테이블 구조 형성

            ⓑ 행렬로부터 프레임 작성

  •           행렬 생성 : matrix ( c(데이터리스트), 행의 수, by=(T/F) )
  •            by = 행 기준 읽기 T / 열 기준 읽기 F

5절. 데이터 입출력

🟩데이터 읽기

1) ‘파일’로부터 읽기

① 텍스트 파일(.txt)로부터 읽기

  read.table (file, header=T/F, sep=구분자, nrows =읽을 행 수, skip = 읽기 시작할 줄)

② CSV (.csv) 파일로부터 읽기

  • CSV 파일 : 파일 내 데이터가 (,) 콤마 단위로 구분된 데이터 파일
    • read.csv() 이용

③ 엑셀 파일 읽기

  • readxl 패키지 설치 : install.packages(“readxl”)
  • readxl 패키지 구동 : library(readxl)
  • 엑셀파일 읽기 | read_exel(‘파일주소“)

④ tap으로 구분된 데이터파일 읽기

      read.delim() 이용 | read.table(file, sep=“\\t” 와 같다 )

 ▶데이터 ‘한 꺼번에’ 읽기

     scan (file, what = “”/0, sep =구분자, skip =숫자 )
     
 ▶데이터 ‘일부’ 읽기
    head() 함수 : 위 3개의 행 자료 읽어서 보여줌
    tail() 함수 : 아래 3개 행 자료 읽어서 보여줌

2) ‘키보드’로 읽기

  • 데이터 프레임 만들고 데이터 편집기 함수(edit() )호출하여 키보드로 데이터 읽기

3) ‘웹사이트’로 읽기

 **① R 제공 데이터셋 읽기**

https://stat.ethz.ch/R-manual/R-devel/library/datasets/html/00index.html

② 패키지 이용 데이터셋

  • library(패키지) 구동
  • str(자료) : 해당 자료의 데이터 구조 확인
  • subset=(조건) : 조건에 맞는 데이터셋만 추출

③ URL 로 자료 읽기

    read.csv(url)

④ Hadoop에서 데이터 읽기 | hdfs.cat(file)

🟩데이터 쓰기

write() 함수

① write(데이터, file=“주소”, append=F/T, sep = 구분자)

② write.table() : 데이터를 표형태로 쓰기

③ write.csv() : 데이터를 (콤마) 구분 csv 파일로 저장

④ wirte.xlsx() : 데이터를 엑셀파일로 저장

🟩데이터 추가/삭제

1) 행 데이터 추가 : rbind(a, b)

  • 행 단위 데이터 묶음이 추가됨
  • a 에 b 데이터 더해짐

2) 열 데이터 추가 : cbind(a, b)

  • 열 단위로 데이터 묶음 추가됨

3) 행 데이터 삭제

  • 삭제할 행 번호 지정 시, – 붙임
  • 이름[ -c(2, 5) ] : 2, 5행 삭제

6절. 공공데이터 사이트 데이터 받기

https://www.data.go.kr

728x90