빅데이터_R언어 기본

728x90
실행 Run : Ctrl + Enter

변수와 데이터

# 변수 : 데이터를 담고 다니는 공간 
y <- c(1,2,3,4,5)
#데이터의 타입 확인 / 연속형, 문자형(범주형)
class(y)
#해당 데이터 타입이 연속형인지 여부 출력
is.numeric(y)
#해당 데이터 구조가 벡터 형태인지 여부 출력 
is.vector(y)
#helf() 함수 사용 시 -> 우측에 설명 나옴 
help('vector')

데이터 연산 

#연속형 데이터 연산 
#사칙연산
2 + 100
500 - 30
30 * 2
45 / 2

# 제곱 연산
40^2
# 몫 연산
15 %/% 3
# 나머지 연산

통계 연산 

#통계 연산
#최소/최대
min(y)
max(y)
#평균 또는 합
mean(y)
sum(y)

#제곱근 
sqrt(100)
#로그
log10(100)
#자연 로그
exp(100)
#삼각 함수
sin(50)
cos(60)
tan(70)

Random 데이터 생성하기 | rnorm() 함수

-평균이 0, 표준편차가 5인 100개의 random normal 데이터 생성

# 평균이 0이고, 표준편차가 5인 100개의 random data 생성
# rnorm() 함수 = random normal 의 약자
x <- rnorm(100, 0, 5) 
x


생성한 데이터의 그래프화

#생성한 데이터의 그래프화 plot 에 출력됨
hist(x)


그래프화 과정에서 에러 발생

문제 : margin 기본 설정이 너무 좁게 설정 되어 있음

해결 : 아래 코드로 마진을 다시 설정 후 결과 확인

par("mar")
par(mar=c(1,1,1,1))

혹은
윈도우창을 최대로 늘린 뒤 결과 다시 확인

출처: https://gigle.tistory.com/88 [모조리 기획해주마]

 

728x90

'[전공] 학교 전공 공부 > [학교]_빅데이터 소프트웨어' 카테고리의 다른 글

ggplot 패키지 그래프 그리기  (0) 2022.04.16
ggplot2 패키지 설치  (0) 2022.04.15
데이터분석 기초  (0) 2022.04.15
R 소개  (0) 2022.04.15
[빅데이터]_R Studio IDE 설치  (0) 2022.04.08