-
R 데이터 시각화의 기본 ggplot2 기초 배우기R 프로그래밍 2023. 2. 28. 20:19반응형
ggplot2의 기본적인 활용법
ggplot2는 R에서 가장 널리 사용되는 그래픽 패키지 중 하나입니다. ggplot2를 이용하면 데이터 시각화 작업을 더욱 쉽고 효율적으로 수행할 수 있습니다. 이번 포스트에서는 ggplot2의 기본적인 활용법에 대해 알아보겠습니다.
1. ggplot2 패키지 설치
ggplot2 패키지를 사용하기 위해서는 우선 ggplot2 패키지를 설치해야 합니다. 아래의 명령어를 실행하여 ggplot2 패키지를 설치할 수 있습니다.
install.packages("ggplot2")
2. ggplot() 함수
ggplot2에서는 ggplot() 함수를 이용하여 그래프를 생성합니다. ggplot() 함수는 aes() 함수와 함께 사용되어야 하며, aes() 함수는 데이터와 변수 간의 aesthetic mappings을 지정합니다. 예를 들어, 다음과 같이 mpg 데이터셋에서 class와 hwy 변수를 이용하여 산점도를 그릴 수 있습니다.
library(ggplot2) data(mpg) ggplot(mpg, aes(class, hwy)) + geom_point()
위의 코드에서 ggplot() 함수는 mpg 데이터셋을 입력으로 받아 class와 hwy 변수를 aes() 함수를 이용하여 aesthetic mappings을 지정합니다. geom_point() 함수는 산점도를 그리는 함수입니다.
3. aes() 함수
aes() 함수는 ggplot2에서 가장 중요한 함수 중 하나입니다. aes() 함수를 이용하여 데이터와 변수 간의 aesthetic mappings을 지정합니다. 예를 들어, mpg 데이터셋에서 class와 hwy 변수를 aes() 함수를 이용하여 aesthetic mappings을 지정하는 코드는 다음과 같습니다.
ggplot(mpg, aes(class, hwy))
위의 코드에서 aes() 함수는 mpg 데이터셋에서 class 변수를 x축에, hwy 변수를 y축에 지정하여 aesthetic mappings을 생성합니다. aes() 함수는 다양한 옵션을 지정할 수 있습니다. 예를 들어, 다음과 같이 shape, color, size 등의 aesthetic mappings을 추가할 수 있습니다.
ggplot(mpg, aes(class, hwy, shape = drv, color = cyl, size = displ)) + geom_point()
위의 코드에서 shape, color, size aesthetic mappings을 추가하여 산점도를 그리는 코드입니다. drv 변수를 shape에, cyl 변수를 color에, displ 변수를 size에 aesthetic mappings으로 추가하였습니다. geom_point() 함수는 산점도를 그리는 함수입니다.
4. geom_ 함수
ggplot2에서는 geom_ 함수를 이용하여 다양한 유형의 그래프를 그릴 수 있습니다. geom_point() 함수는 산점도를 그리는 함수이며, geom_line() 함수는 선 그래프를 그리는 함수입니다. 예를 들어, mpg 데이터셋에서 class와 hwy 변수를 이용하여 선 그래프를 그리는 코드는 다음과 같습니다.
ggplot(mpg, aes(class, hwy, group = drv)) + geom_line()
위의 코드에서 group 옵션을 이용하여 drv 변수를 그룹으로 묶어서 선 그래프를 그립니다.
5. 테마 설정
ggplot2에서는 다양한 테마를 제공하며, 테마를 적용하여 그래프를 더욱 깔끔하게 만들 수 있습니다. 예를 들어, theme_bw() 함수를 이용하여 흰색 배경에 검은색 축선과 눈금선을 가진 그래프를 그릴 수 있습니다.
ggplot(mpg, aes(class, hwy)) + geom_point() + theme_bw()
위의 코드에서 theme_bw() 함수를 이용하여 테마를 설정하였습니다. 실행 결과는 다음과 같습니다.
6. 그래프 저장
ggplot2로 그린 그래프를 저장하기 위해서는 ggsave() 함수를 이용합니다. 예를 들어, 다음과 같이 그래프를 그린 후 png 파일로 저장할 수 있습니다.
p <- ggplot(mpg, aes(class, hwy)) + geom_point() ggsave("scatterplot.png", plot = p, width = 6, height = 4, dpi = 300)
위의 코드에서 ggsave() 함수를 이용하여 그래프를 png 파일로 저장하였습니다. width, height, dpi 옵션을 이용하여 그래프 크기와 해상도를 설정할 수 있습니다.
이번 포스트에서는 ggplot2의 기본적인 활용법에 대해 알아보았습니다. ggplot2 패키지는 다양한 그래프를 그리는데 유용한 함수들을 제공합니다. aes() 함수를 이용하여 aesthetic mappings을 설정하고, geom_ 함수를 이용하여 다양한 유형의 그래프를 그릴 수 있습니다. 또한, 테마를 설정하여 그래프를 더욱 깔끔하게 만들 수 있습니다. 마지막으로, ggsave() 함수를 이용하여 그래프를 저장할 수 있습니다.
ggplot2 패키지에는 위에서 다룬 함수들 외에도 다양한 함수들이 있으며, 이를 조합하여 더욱 복잡하고 다양한 그래프를 그릴 수 있습니다. ggplot2 패키지를 활용하여 데이터를 시각화하면, 데이터의 특성을 더욱 쉽게 파악할 수 있습니다.
반응형'R 프로그래밍' 카테고리의 다른 글
R에서 머신 러닝 모델링이 쉬워지는 Tidymodels (0) 2023.03.01 R로 웹 애플리케이션 만들기, R Shiny의 기본 (0) 2023.02.28 R 프로그래밍을 위해 무조건 알아야되는 기본 함수 모음 (0) 2023.02.28 R 프로그래밍 데이터 처리와 조작 (0) 2023.02.27