R에서 줄기-잎 그림 그리는 방법
줄기 잎 그림은 개별적인 값과 빈도라는 두가지 정보를 동시에 보여주는 그래프입니다. 히스토그램과 유사하지만 개별 값들도 알 수 있다는 특징이 있습니다.
R에서는 stem이라는 함수를 통해 줄기-잎 그림을 그릴 수 있습니다. 아래와 같은 형식으로 입력합니다.
stem(x, scale = 1, width = 80, atom = 1e-08)
scale은 구간을 어떻게 나눌지를 결정합니다.
간단한 줄기-잎그림을 그려보면서 이해해봅시다.
x=c(1,2,2,2,3,3,3,4,4,4,4,5,5,5,5,5,6,6,6,6,6)
stem(x)
결과는 아래와 같습니다. 그래프 창이 새로 드지는 않고, 명령줄에 텍스트로 실행됩니다.
> x=c(1,2,2,2,3,3,3,4,4,4,4,5,5,5,5,5,6,6,6,6,6)
> stem(x)
The decimal point is at the |
0 | 0
2 | 000000
4 | 000000000
6 | 00000
구분기호 | 앞은 일의자리, 뒤는 소수점 첫 자리를 의미합니다. 구간이 0 다음 2인 것을 보면 첫번째 줄은 일의 자리가 0과 1로 시작하는 수를 나타낸다는 것을 알 수 있습니다. 두번쨰줄은 일의자리가 2와 3으로 시작하는 수입니다. 2와 3은 6개 이므로 일치합니다. scale을 2로 바꿔봅시다.
> x=c(1,2,2,2,3,3,3,4,4,4,4,5,5,5,5,5,6,6,6,6,6)
> stem(x,scale=2)
The decimal point is at the |
1 | 0
2 | 000
3 | 000
4 | 0000
5 | 00000
6 | 00000
간격이 바뀌었습니다. 각 숫자의 개수를 알 수 있습니다. scale에는 정수만 입력가능한데, 값이 클수록 구간의 수가 많아집니다.
이번에는 다른 예제를 봅시다.
> x=c(1,2,3,4,4,5,12,14,16,16)
> stem(x)
The decimal point is 1 digit(s) to the right of the |
0 | 12344
0 | 5
1 | 24
1 | 66
구분기호 왼쪽은 십의자리를 나타냅니다. 1 | 66 은 16이 2개라는 의미입니다.
R에서 기본제공하는 stem 함수는 기능이 제한적이라 병렬형태의 줄기-잎 그림을 그릴 수 없습니다. 보통 aplpack 이라는 패키지를 설치해서 사용합니다. 다음 글에서 다루겠습니다.
댓글