본문 바로가기

R

[R] cut

cut 

: 연속형 변수를 범주형 변수로 변환하는 함수

cut(데이터,breaks = seq(최솟값,최댓값,by=간격),right=F/T)

cut(score,breaks = seq(60,100,by=10),right=F) #right=F : (60,70] 60이상 70미만
cut(score,breaks = seq(60,100,by=10),right=T) #right=T : [60,70) 60초과 70이하
x <- cut(score,breaks = seq(60,100,by=10),right=FALSE,
         labels=c("60점이상~70점미만","70점이상~80점미만","80점이상~90점미만","90점이상"))

result <- cbind(table(x),prop.table(table(x)))
data.frame(result)


[문제169] cost.txt 데이터를 분석하세요.

cost <- read.table("c:/data/cost.txt")
cost <- as.matrix(cost)
dim(cost) <- c(50,1)

1)최댓값, 최솟값 확인하기

min(cost) #52
max(cost) #109


2)계급의 수,구간의 크기 설정하기

cost_cut <- cut(cost,breaks = seq(50,110,by=10),right=F,
                labels=c("50이상~60미만","60이상~70미만","70이상~80미만",
                         "80이상~90미만","90이상~100미만","100이상~"))
cost_result <- data.frame(cbind(table(cost_cut),prop.table(table(cost_cut))))
names(cost_result) <- c("도수","상대도수")
cost_result$누적도수 <- cumsum(cost_result$도수)

 

 

'R' 카테고리의 다른 글

[R] 시각화 - ggplot  (0) 2022.01.27
[R] 시각화 - histogram, box plot  (0) 2022.01.27
[R] 빈도표 문제2  (0) 2022.01.26
[R] reshape2::melt,dcast  (0) 2022.01.26
[R] 시각화 - 산점도 그래프(scatter plot)  (0) 2022.01.25
Recent Posts
Popular Posts
Recent Comments