데이터 시각화

728x90

1절. ggplot2 패키지 이용하여 그래프 그리기

[theme]

: ggplot이 제공하는 백그라운드 테마 주제별로 지정 객체

  • theme_set() : 테마 세팅
  • theme_get() : 테마객체 얻기

[theme 종류] : 8가지

1) theme_bw()
: 바탕색 흰색/ 격자색 회색/ 테투리 검정색

2) theme_gray()
: 바탕색 회색/ 격자색 흰색/ 테투리 X

3) theme_linedraw()
: 바탕색 히색/ 격자색 검정/ 테두리 검정

4) theme_light()
: 바탕색 흰색/ 격자색 옅은회색/ 테두리 옅은 회색

5) theme_minimal()
: 바탕색 X/ 격자색 연한 회색/ 테투리 X

6) theme_classic()
: 바탕 X/ 격자 X/ 테두리 X/ 축 검정색

7) theme_void()
:빈 주제로 비표준 요소에 대한 그림

8) theme_dark()
: 바탕색 옅은 검정/격자색 검정/ 테두리X

2절. ggplot2 환경설정

  1. 글자 관련 설정
  • base_size() : 글자 크기 설정, 숫자
  • base_family() : 글자체 설정 [sans, mono, courier, serif, symbol 등]
  1. 데이터 점 표시 방법
  • geom_point( colour=“색”, size=“크기” )
  1. 축 구간 설정

x축 | xlim( c( 0, 200) ) : x축 0~200 표시

y축 | ylim( c( 0, 100) ) : y축 0~100 표시

  1. 설명문
  2. labs( 제목/데이터/소제목/x축설명/y축설명)

3절. ggplot2 이용한 산점도 응용

  • 직선 추가 : geom_abline(intercept=, slope= )
  1. 원형 추가 : geom_encircle()

4절. ggplot2 이용한 그래프 그리기

  • 비누방울 차트(Bubble Chart)

: x축과 y축 변수가 명목변수인 데이터 산포도

(1) geom_jitter(aes(x=, y=), size =, colour= )

: 데이터를 격자선 위에 나타내는 그래프

(2) geom_count()

: 산포도를 데이터 개수로 크기 나타내는 그래프

 

  1. 산포도 주변에 히스토그램/박스플롯/확률밀도 그래프 추가

gg <- ggplot(mtcars, aes(cyl, mpg)) +geom_count()

ggMarginal(gg, type="histogram", fill="transparent")

 

  1. 상관관계 그림

ggcorrplot()

  1. 그룹별 평균 구하여 순위 따른 막대그래프 그리기
  2. 박스플롯으로 여러 그룹 간 분포 직관적 비교
  3. 확률밀도 함수 비교
  4. ggplot2 패키지 이용 시계열 자료 그래프 그리기
  5. lubridate 패키지 이용. 날짜를 문자열로 생성 X축 표시 그래프 그리기
  6. 한 화면에 여러 시계열 그래프 그리기

 

  1. 계절성 그래프 그리기
#계절성 그래프 그리기

install.packages("forecast")
.libPaths()
.libPaths("C:/Program Files/R/R-4.1.3/library")
library(forecast)
theme_set(theme_classic())

ggseasonplot(AirPassengers) +
  labs(title="AirPassenger에 대한 계절성 그래프")

728x90

'[전공] 학교 전공 공부 > [학교]_빅데이터 소프트웨어' 카테고리의 다른 글

추정 및 검정  (0) 2022.04.24
확률  (0) 2022.04.24
ggplot 패키지 그래프 그리기  (0) 2022.04.16
ggplot2 패키지 설치  (0) 2022.04.15
데이터분석 기초  (0) 2022.04.15