본문 바로가기
반응형

분류 전체보기131

R 히스토그램에 라인 추가하기 freq 옵션을 FALSE 로 설정합니다. lines 함수를 이용하여 아래 코드처럼 입력해줍니다. set.seed(1) data=rnorm(100,170,5) hist(data,freq=F) lines(density(data)) 2021. 10. 21.
[R 그래프] 여러 집단의 전후변화 비교 막대그래프 library(lsr) #데이터 dt1=c(1,2,3,4,5,6,7,8,9,10) dt2=c(1,2,3,4,5,6,7,8,9,100) #통계량계산(중앙값절대편차, 평균절대편차, 표준편차) dt_dev=c(mad(dt1),mad(dt2),aad(dt1),aad(dt2),sd(dt1),sd(dt2)) names(dt_dev)=rep(c("dt1","dt2"),3) #벡터 원소이름지정 barplot(dt_dev,beside=TRUE,col=c("red","red","blue","blue","green","green")) legend("topleft",legend=c("MAD","AAD","SD"),fill=c("red","blue","green"),border="white",cex=1.2) 2021. 10. 19.
[R 시각화] 여러 그래프의 제목과 축이름 글자 크기를 한변에 변경 par함수를 이용하면 됩니다. par 함수 안에 cex 옵션을 설정하면 그래프를 그릴 때 사용되는 디폴트 글자 크기가 변경됩니다. 아래는 예시입니다. #그래프 제목, 축이름 크기 변경 par(cex.main=3,cex.lab=1.5) #화면 나누기 par(mfrow=c(1,3)) #그래프프 plot(c(1,2,3),c(4,5,6),main="산점도") barplot(c(1,2,3),main="막대그래프") hist(rnorm(100),main="히스토그램") par 설정을 초기화하는 방법은 아래와 같습니다. dev.off() 2021. 6. 11.
[R시각화] boxplot 원하는 순서로 그리기 내장데이터인 InsectSprays 를 사용하겠습니다. 살충제와 곤충 수 데이터입니다. 살충제는 A,B,C,D,E,F 네가지입니다. > head(InsectSprays) count spray 1 10 A 2 7 A 3 20 A 4 14 A 5 14 A 6 12 A boxplot을 그려봅시다. dt=InsectSprays boxplot(count ~ spray, data = dt) 위와 같이 알파벳 순서대로 그려집니다. 원하는 순서로 바꿔봅시다. B,D,C,E,A 순으로 바꾸겠습니다. factor 를 이용합니다. dt$spray 2021. 5. 28.
[R시각화] 그래프 눈금 모서리부터 시작되게 하기 yaxs 와 xaxs 옵션을 "i"로 설정하면 눈금이 모서리 부터 시작됩니다. par(mfrow=c(1,2)) plot(1:5,main="설정안함") plot(1:5,yaxs='i',xaxs="i",main="옵션 설정") 2021. 5. 28.
R에서 신뢰구간을 정규분포에 색칠하기 아래는 코드입니다. 95% 신뢰구간입니다. #표준정규분포 그래프 x=seq(-4,4,by=0.01) y=dnorm(x) plot(x,y,type="l",ann=FALSE,axes=FALSE) #임계값 설정(기각역) #99%로 할 경우 0.995 입력 margin=qnorm(0.975) #축 및 값 추가, pos=c(0,0) 으로 설정해야 축과 그래프 사이 간격 없어짐 #mgp 는 tick 과 tick label 사이의 간격임 mgp=c(3, 2, 0) #padj=1 이 나은듯. 윗선이 맞춰짐 #99%로 할 경우 2.58로 수정 axis(1,at=c(-4,-margin,0,margin,4), pos=c(0,0), label=c("",expression(-1.96* frac(sigma, sqrt(n))),e.. 2021. 5. 21.
R에서 파레토 차트 그리기 파레토 법칙이란? 파레토법칙은 20:80의 법칙이라고도 부릅니다. 상위 20%가 전체 원인의 80%를 차지한다는 법칙인데요. 예시는 아래와 같습니다. 모든 고객의 상위 20% 고객이 전체 매출의 80%를 차지함. 데이터 올 한해 고객이 5명이었고, 고객 5명의 구매액이 아래와 같다고 합시다. 단위는 만원입니다. 고객A : 100 고객B : 80 고객C : 10 고객D : 50 고객E : 300 파레토 차트 그리기 설명은 주석으로 대신합니다. #패키지 설치 install.packages("qcc") #패키지 불러오기 library(qcc) #데이터 입력 data 2021. 3. 17.
R그래프 축 눈금 원하는 간격으로 설정하기 코드는 아래와 같습니다. 설명은 주석으로 대신합니다. #데이터 x=c(1,2,3,4,5) y=c(1,2,3,4,5) # axes FALSE로 설정하여 축 눈금과 값 안나오게함 plot(x,y,xaxt="n",yaxt="n",xlim=c(0,10),ylim=c(0,10)) #간격 설정 xat=seq(0,10,by=0.5) yat=seq(0,10,by=2) #위에서 설정한 간격 이용하여 눈금 그리기 axis(side=1,at=xat) axis(side=2,at=yat) 2021. 3. 15.
R 그래프 화면 분할 (화면의 일부분에 그래프 그리기) par 함수의 fig 값 입력하면 됩니다. 형식은 아래와 같습니다. par(fig=c(x1, x2, y1, y2)) 몇가지 입력 예시를 통해 이해해봅시다. (0,1,0,1) 화면 전체 사용 par(fig=c(0,1,0,1)) plot(1:10) box(col="red") box("figure", col="green") box("outer", col="blue") (0,0.5,0,1) 가로 50%, 세로 100% 사용 par(fig=c(0,0.5,0,1)) plot(1:10) box(col="red") box("figure", col="green") box("outer", col="blue") (0.2,0.5,0,1) 가로 20%지점부터 30%만큼 사용, 세로 100% 사용 par(fig=c(0.2,0.5.. 2021. 1. 30.
[R시각화] 조건부 막대그래프 (barchart) lattice 패키지의 barchart 함수를 이용하면 조건부 막대그래프를 그릴 수 있습니다. 먼저 예시에 사용할 데이터를 하나 만들겠습니다. 세 카페의 음료별 판매량 데이터입니다. R에서 데이터를 열어봅시다. (경로는 여러분이 파일을 저장한 경로로 넣으셔야 됩니다.) library(readxl) dt dt coffee volume name 1 americano 494 starbucks 2 latte 455 starbucks 3 Espresso 476 starbucks 4 americano 461 hollys 5 latte 436 hollys 6 Espresso 144 hollys 7 americano 497 ediya 8 latte 483 ediya 9 Espresso 205 ediya 그래프를 그려봅.. 2021. 1. 16.
[R시각화] 평행좌표그림 (여러 데이터의 시간의 따른 변화) 아래와 같은 데이터가 있다고 합시다. A,B,C 세 반이 있각 습니다. 각 반에서 세명의 학생의 수학점수데이터를 입력했습니다. (데이터는 글 뒷부분에 첨부하였습니다.) 데이터를 R에서 불러와봅시다. 경로는 여러분이 파일을 저장한 경로를 입력하셔야 됩니다. 데이터를 불러온 뒤에, as.data.frame 함수를 이용하여 데이터의 형식을 데이터프레임으로 변환합니다. 처음에 불러온 데이터의 형식은 'tibble'입니다. tibble 형식을 data.frame 으로 바꾼 것입니다. library(readxl) data data ...1 class 2017 2018 2019 2020 1 김재준 A 90 94 44 46 2 강지환 A 53 50 63 46 3 오형지 A 69 59 87 91 4 우희선 B 73 60.. 2021. 1. 9.
[R시각화] 조건부 산점도 행렬 그래프 (splom) lattice 패키지의 splom 함수를 이용하면 조건부 산점도 행렬 그래프을 그릴 수 있습니다. 조건부 산점도 행렬 그래프는 한 변수의 범주(또는 수준level)에 따른 나머지 변수들 사이의 산점도 그래프입니다. 예를 들어봅시다. iris 데이터를 이용할 것입니다. 꽃의 종류(Species)에 따른 나머지 네 변수의 산점도 행렬 그래프를 그려봅시다. 나머지 네 변수는 아래와 같습니다. - 꽃받침 길이(Sepal.Length) - 꽃받침 너비(Sepal.Width) - 꽃잎 길이(Petal.Length) - 꽃잎 너비(Petal.Width) library("lattice") splom( ~iris[1:4] |Species, data=iris, varname.cex=0.6,cex=0.5) 2021. 1. 2.
[R시각화] 조건부 산점도 그래프 (xyplot) lattice 패키지의 xyplot 함수를 이용하면 조건부 산점도 그래프를 그릴 수 있습니다. 조건부 산점도 그래프란 변수 X,Y,Z가 있을 때 한 변수의 범주(또는 수준 level)에 따른 나머지 두 변수의 산점도 그래프입니다. 예시를 통해 이해해봅시다. iris 데이터를 이용할 것입니다. 꽃의 종(Species) 별로 꽃받침 길이(Sepal.Length)와 꽃받침 너비(Sepal.Width)의 산점도 그래프를 그려봅시다. library("lattice") xyplot( Sepal.Length~Sepal.Width |Species, data=iris) 2021. 1. 2.
[R시각화] 조건부 분위수그림(qqmath) lattice패키지의 qqmath 함수를 이용하면 조건부 분위수 그림을 그릴 수 있습니다. 조건부 분위수 그림이란 어떤 변수 X와 Y가 있다면, Y의 범주(혹은 level) 별로 그려진 X의 분위수 그림입니다. 예를 들어봅시다. iris 데이터를 이용하겠습니다. 꽃의 종(species)별로 꽃받침(sepal) 길이의 분위수 그림을 그려봅시다. library("lattice") qqmath( ~ Sepal.Width |Species, data=iris) panel 옵션을 이용하면 정규분포를 따를 때의 직선을 함께 그릴 수 있습니다. library("lattice") qqmath( ~ Sepal.Width |Species, data=iris, panel = function(x) { panel.qqmathli.. 2021. 1. 2.
[R시각화] 조건부 커널밀도추정함수(KDE) 그래프 그리는 방법 (densityplot) lattice 패키지의 densityplot 함수를 이용하면 조건부 커널밀도추정함수를 그릴 수 있습니다. 커널밀도추정은 커널함수를 이용하여 밀도추정을 하는 것인데요. 커널함수와 밀도추정이 무엇인지 간단히 알아봅시다. 커널함수 : 원점을 중심, 대칭, 적분값이 1, non-negative인 함수 밀도추정 : 데이터들의 분포를 이용하여 변수의 분포를 추정하는 것. 변수의 확률밀도함수를 구하는 것. iris 데이터에 densityplot을 적용해봅시다. 꽃의 '종(species)' 별로 꽃받침 길이(Sepal.Length)의 커널밀도함수를 그려주는 것입니다. library("lattice") densityplot( ~ Sepal.Width |Species, data=iris) 설정할 수 있는 옵션들이 많이 있.. 2021. 1. 1.
[R시각화] 조건부 히스토그램 (histogram) 조건부 히스토그램은 어떤 변수 Y의 범주 별로 변수 X 히스토그램을 그려주는 함수입니다. iris 예제를 예로 들면 꽃의 '종(species)' 별로 꽃받침 길이(Sepal.Length)의 히스토그램을 그려주는 것입니다. lattice 패키지의 historgram 함수를 이용합니다. 패키지를 불러온 뒤 위 iris 예제를 직접 그려봅시다. histogram( ~Sepal.Width | Species, data = iris) 옵션이 상당히 많은데, 몇가지 중요한 옵션만 알아봅시다. 두가지 입니다. breaks : 간격 type = c("percent", "count", "density") : 타입(퍼센트, 개수, 밀도) 적용해서 그려봅시다. histogram( ~Sepal.Width | Species, d.. 2021. 1. 1.
[R시각화] 조건에 따른 그래프를 출력하는 coplot 함수, 매우 유용함 coplot 함수는 조건에 따른 그래프를 출력해줍니다. 조건에 따른 그래프라고 하면 무슨 말인지 잘 이해가 되지 않을테니 예제를 통해 이해해봅시다. 예제에 사용할 데이터는 quakes 라는 데이터입니다. 피지에서 지진이 발생할 때 마다 기록한 정보입니다. lat은 위도, long은 경도, depth는 깊이, mag는 리히터 규모, stations은 관측소 수 입니다. > str(quakes) 'data.frame':1000 obs. of 5 variables: $ lat : num -20.4 -20.6 -26 -18 -20.4 ... $ long : num 182 181 184 182 182 ... $ depth : int 562 650 42 626 649 195 82 194 211 622 ... $ m.. 2020. 12. 31.
[R시각화] 색 투명도 설정하는 방법 색은 보통 그래프에 사용됩니다. 그래프 함수나 점,직선 함수 안에 col 옵션을 설정하는데요. col 옵션의 입력값으로 adjustcolor 함수값을 사용하면 됩니다. col=adjustcolor("red",alpha=0.5) alpha 는 투명도입니다. 0에 가까울 수록 투명합니다. col1=adjustcolor("red",alpha=0) col2=adjustcolor("red",alpha=0.25) col3=adjustcolor("red",alpha=0.5) col4=adjustcolor("red",alpha=0.75) col5=adjustcolor("red",alpha=1) plot(1:5,rep(1,5),cex=7,xlim=c(0,6),pch=16,col=c(col1,col2,col3,col4,c.. 2020. 12. 31.
[R시각화] 산점도의 테두리 영역을 지정하는 chull 함수 chull 함수는 입력된 산점도 데이터에서 convex hull을 형성하는 점들의 index를 출력해줍니다. 쉽게 말하면 테두리입니다. 먼저 산점도 데이터가지고 그래프를 하나 그려봅시다. iris 데이터를 이용하겠습니다. x=iris$Sepal.Length y=iris$Sepal.Width plot(x,y,xlab="sepal length",ylab="sepal width") 이 데이터에 chull 함수를 적용해봅시다. 테두리 점들의 index 입니다. > chull(x,y) [1] 119 69 61 42 14 23 33 16 132 위 index를 이용하여 테두리가 추가된 그래프를 그려봅시다. x=iris$Sepal.Length y=iris$Sepal.Width plot(x,y,xlab="sepal l.. 2020. 12. 31.
[R시각화] 수식입력에 관한 정보 plotmath() R에 수식을 입력하는 방법을 알고 싶으면 명령창에 help(plotmath) 라고 검색하면 됩니다. 스크롤을 내려보면 표현가능한 수식 예시를 볼 수 있습니다. 데모 기능도 있습니다. 명령창에 demo(plotmath)라고 입력하면 실제 예시들을 출력해줍니다. 콘솔창에 엔터를 치면서 다양한 출력 예시들을 볼 수 있습니다. 2020. 12. 31.
[R시각화] 모집단 평균, 기각역 표시된 정규분포 그래프 그리기 모집단의 평균(mu0), 임계값(z*), 우리가 뽑은 표본의 평균(bar_X) 가 표시된 그래프입니다. #표준정규분포 그래프 x=seq(-4,4,by=0.01) y=dnorm(x) plot(x,y,type="l",ann=FALSE,axes=FALSE) #임계값 설정(기각역) margin=qnorm(0.95) #축 및 값 추가, pos=c(0,0) 으로 설정해야 축과 그래프 사이 간격 없어짐 axis(1,at=c(-4,0,margin,qnorm(0.99),4), pos=c(0,0), label=c("",expression(mu[0]),expression(z^"*"),expression(bar(x)[0]),"")) #색칠을 위한 값 설정 x_margin=seq(margin,4,by=0.01) y_margin.. 2020. 12. 31.
[R시각화] 색 팔레트를 만들어주는 colorRampPalette 함수 colorRampPalette 는 입력한 색을 보간하여 원하는 수의 색팔레트를 출력해줍니다. 값으로 함수를 반환하기 때문에, 반환된 함수에 다시 값을 입력해줘야 합니다. 아래는 예시입니다. 흰색과 빨간색 사이를 5개로 나누고 색 팔레트로 출력하였습니다. > colorRampPalette(c("white","red"))(5) [1] "#FFFFFF" "#FFBFBF" "#FF7F7F" "#FF3F3F" "#FF0000" 원그래프를 이용하여 색을 확인해봅시다. par(mar=c(2,2,2,2)) pltte1=colorRampPalette(c("white","red"))(5) pie(rep(1,5),col=pltte1) 색은 2개 이상도 입력 가능합니다. 아래와 같습니다. par(mar=c(2,2,2,2)) .. 2020. 12. 31.
[R시각화] 점의 밀도를 시각화해주는 smoothScatter 함수 smoothScatter 함수는 점의 밀도를 시각화해줍니다. 점이 많이 모여있는 곳은 진한 색으로, 그렇지 않은 곳은 흐린 색으로 시각화합니다. 산점도 그래프 plot 처럼, 점 데이터를 입력해주면 됩니다. 예를 들어봅시다. 옵션을 적용한 경우도 출력하였습니다. par(mfrow=c(2,2)) par(mar=c(2,2,2,2)) #산점도 plot(iris$Sepal.Length) #밀도그래프, 옵션 미적용 smoothScatter(iris$Sepal.Length) #nrpoint 옵션 적용. 출력될 점의 수, 낮은 밀도부터 출력 smoothScatter(iris$Sepal.Length,nrpoint=0) #색 설정, colorRampPalette 사용해야함. mypltt 2020. 12. 31.
[R시각화] 노이즈를 발생시키는 jitter함수 jitter 함수는 입력 값에서 노이즈를 발생시킵니다. 아래는 간단한 예시입니다. factor 옵션을 이용하여 강도를 조절할 수도 있습니다. > x=1:5 > jitter(x) [1] 1.1837416601367294 [2] 1.8277301006950437 [3] 3.0211889690719547 [4] 4.0621753104031084 [5] 5.0300368266180158 그래프를 이용하여 jitter 함수 적용 전후를 비교해봅시다. par(mfrow=c(1,2)) x=seq(0,10,len=30) y=rep(1,length(x)) plot(x,y) plot(x,jitter(y)) 이번에는 옵션인 factor를 변경하고 비교해봅시다. 디폴트 값은 1입니다. x=seq(0,10,len=30) y=r.. 2020. 12. 30.
[R시각화] 사각형을 입력하는 rect 함수 rect 함수는 그래프에 사각형을 추가합니다. 아래와 같은 형식으로 사용합니다. rect(xleft, ybottom, xright, ytop) 네개의 직선을 긋고 만들어지는 사각형이라고 생각하면 됩니다. xleft는 왼쪽 세로선, ybottom은 아래 가로선, xright은 오른쪽 세로선, ytop은 위 가로선입니다. 아래는 예시입니다. plot(0,xlim=c(0,10),ylim=c(0,10),type="n") rect(3,5,1,2) 옵션 기능 density = NULL 빗금으로 채우기 angle = 45 빗금 각도 col = NA 채우기 색 border = NULL 테두리색 lty = par("lty") 선 스타일 0 : blank 1 : solid 2 : dashed 3 : dotted 4 : d.. 2020. 12. 30.
[R시각화] 데이터의 위치를 눈금으로 표시 rug 함수를 이용하면 데이터의 위치를 눈금으로 표시해줍니다. 점들을 부드러운 곡선으로 연결한 경우, rug 함수를 적용하면 어느 영역에 데이터가 몰려 있는지를 한눈에 알 수 있습니다. > x=c(1,2,3,4,10,11,12,20,21,22) > y=1:10 > plot(x,y,type='l') > rug(x) 2020. 12. 30.
[ R시각화] 바로 가져다 쓰는 범례(legend) 1. 범례를 색으로 구분 x 2020. 12. 30.
[R시각화] 그래프의 제목을 추가해주는 title 함수 title 함수는 그래프에 제목을 추가해줍니다. 그래프 제목은 plot(), barplot() 등의 고수준함수 안에도 옵션으로 설정할 수 있습니다. title 함수는 저수준함수로, 그래프가 그려진 상태에서만 사용이 가능합니다. 고수준함수에 제목 옵션이 설정된 경우에 title 함수로 제목을 입력하면 두 제목이 중첩되어 보이게 됩니다. title 함수에서는 네가지 제목을 설정할 수 있습니다. main : 그래프 제목 sub : 부제목 xlab : x축 이름 ylab : y축 이름 아래는 예시입니다. ann=FALSE로 설정하여 자동으로 설정되는 x,y축 이름을 제거해줍니다. > plot(iris$Sepal.Length,ann=FALSE) > title(main="IRIS graph",sub="sepal l.. 2020. 12. 30.
[R시각화] 마진(margin)에 텍스트 추가해주는 mtext함수 먼저 마진이 어딘지를 확인해봅시다. par(mar=c(5,5,5,5),oma=c(3,3,3,3)) plot(0,xlim=c(0,10),ylim=c(0,10),type="n") box(col="red") box("figure", col="green") box("outer", col="blue") 두개의 마진이 있습니다. 파란상자와 초록상자 사이 공간이 내부마진이고, 초록상자와 파란상자 사이 공간이 외부마진입니다. 내부마진을 그냥 '마진'이라고 부르기도 합니다. 마진에 글을 추가할 때는 mtext 함수를 사용합니다. 아래와 같은 형식으로 입력합니다. mtext(text, side = 3, line = 0, outer = FALSE, at = NA, adj = NA, padj = NA, cex = NA, co.. 2020. 12. 30.
[R시각화] 현재 그래프의 여백(margin)을 눈으로 확인 방법 그래프가 그려진 상태에서 아래 코드를 입력하면 됩니다. box(col="red") box("figure", col="green") box("outer", col="blue") 각각 어떤 의미인지는 아래 그래프를 보시면 알 수 있습니다. par(mar=c(2,2,2,2),oma=c(2,2,2,2)) plot(0,xlim=c(0,10),ylim=c(0,10),type="n") box(col="red") box("figure", col="green") box("outer", col="blue") 2020. 12. 30.
반응형