Ch01. R 소개
1절. 서론
- R언어 : 방대한 자료 실시간 분석하여 결과를 시각화하는 프로그래밍 언어.
2절. R 설치
3절. R언어 기초
[주석 처리] : # 이용
[변수와 자료형]
- 변수 : 데이터 저장 기능
- 자료형
실수형 숫자만 사용 문자열 “character형” 논리형 T or F 범주형 Factor형. 산술연산 불가
[산술연산]
- 기본 연산
: + , - ,* , /(나누기), 지수승(^), 나머지(%%), 몫(%/%)
- 대입 연산 =
- 관계 연산
: < , <= , > , >-, ==, !=
- 논리 연산 : &, |, !
[제어문]
- If문/for문/while문
[함수 만들기]
함수명 <- function(매개변수) {
본문
}
4절. 데이터 구조
1) 벡터 | C(...)
- 같은 종류의 자료형 여러 개 대입하는 자료형
- C의 배열과 같다
2) 리스트 | list( ...)
- 다른 종류의 자료형 여러 개 대입하는 자료형
- C의 구조체와 같다
- 각 원소 자체를 객체 취급
- 원소 지정 시, x[ [i] ] 식으로 지정
3) 배열
- 다 차원 벡터 (2차원 배열은 행렬)
- 데이터 구조 차원 정의 : dim(1,2,3) (즉, 1행 2열 3면 3차원 구조)
4) 데이터 프레임
- 데이터 각 열에 변수 이름 적용 (스키마)
- 프레임 생성 data.frame()
ⓐ 백터로부터 프레임 작성
각각의 열 단위 백터 여러 개가 한 개의 데이터 프레임으로 묶여서 테이블 구조 형성
ⓑ 행렬로부터 프레임 작성
- 행렬 생성 : matrix ( c(데이터리스트), 행의 수, by=(T/F) )
- by = 행 기준 읽기 T / 열 기준 읽기 F
5절. 데이터 입출력
🟩데이터 읽기
1) ‘파일’로부터 읽기
① 텍스트 파일(.txt)로부터 읽기
read.table (file, header=T/F, sep=구분자, nrows =읽을 행 수, skip = 읽기 시작할 줄)
② CSV (.csv) 파일로부터 읽기
- CSV 파일 : 파일 내 데이터가 (,) 콤마 단위로 구분된 데이터 파일
- read.csv() 이용
③ 엑셀 파일 읽기
- readxl 패키지 설치 : install.packages(“readxl”)
- readxl 패키지 구동 : library(readxl)
- 엑셀파일 읽기 | read_exel(‘파일주소“)
④ tap으로 구분된 데이터파일 읽기
read.delim() 이용 | read.table(file, sep=“\\t” 와 같다 )
▶데이터 ‘한 꺼번에’ 읽기
scan (file, what = “”/0, sep =구분자, skip =숫자 )
▶데이터 ‘일부’ 읽기
head() 함수 : 위 3개의 행 자료 읽어서 보여줌
tail() 함수 : 아래 3개 행 자료 읽어서 보여줌
2) ‘키보드’로 읽기
- 데이터 프레임 만들고 데이터 편집기 함수(edit() )호출하여 키보드로 데이터 읽기
3) ‘웹사이트’로 읽기
**① R 제공 데이터셋 읽기**
https://stat.ethz.ch/R-manual/R-devel/library/datasets/html/00index.html
② 패키지 이용 데이터셋
- library(패키지) 구동
- str(자료) : 해당 자료의 데이터 구조 확인
- subset=(조건) : 조건에 맞는 데이터셋만 추출
③ URL 로 자료 읽기
read.csv(url)
④ Hadoop에서 데이터 읽기 | hdfs.cat(file)
🟩데이터 쓰기
write() 함수
① write(데이터, file=“주소”, append=F/T, sep = 구분자)
② write.table() : 데이터를 표형태로 쓰기
③ write.csv() : 데이터를 (콤마) 구분 csv 파일로 저장
④ wirte.xlsx() : 데이터를 엑셀파일로 저장
🟩데이터 추가/삭제
1) 행 데이터 추가 : rbind(a, b)
- 행 단위 데이터 묶음이 추가됨
- a 에 b 데이터 더해짐
2) 열 데이터 추가 : cbind(a, b)
- 열 단위로 데이터 묶음 추가됨
3) 행 데이터 삭제
- 삭제할 행 번호 지정 시, – 붙임
- 이름[ -c(2, 5) ] : 2, 5행 삭제
6절. 공공데이터 사이트 데이터 받기
'[전공] 학교 전공 공부 > [학교]_빅데이터 소프트웨어' 카테고리의 다른 글
ggplot 패키지 그래프 그리기 (0) | 2022.04.16 |
---|---|
ggplot2 패키지 설치 (0) | 2022.04.15 |
데이터분석 기초 (0) | 2022.04.15 |
빅데이터_R언어 기본 (0) | 2022.04.13 |
[빅데이터]_R Studio IDE 설치 (0) | 2022.04.08 |