cut
: 연속형 변수를 범주형 변수로 변환하는 함수
cut(데이터,breaks = seq(최솟값,최댓값,by=간격),right=F/T)
cut(score,breaks = seq(60,100,by=10),right=F) #right=F : (60,70] 60이상 70미만
cut(score,breaks = seq(60,100,by=10),right=T) #right=T : [60,70) 60초과 70이하
x <- cut(score,breaks = seq(60,100,by=10),right=FALSE,
labels=c("60점이상~70점미만","70점이상~80점미만","80점이상~90점미만","90점이상"))
result <- cbind(table(x),prop.table(table(x)))
data.frame(result)
[문제169] cost.txt 데이터를 분석하세요.
cost <- read.table("c:/data/cost.txt")
cost <- as.matrix(cost)
dim(cost) <- c(50,1)
1)최댓값, 최솟값 확인하기
min(cost) #52
max(cost) #109
2)계급의 수,구간의 크기 설정하기
cost_cut <- cut(cost,breaks = seq(50,110,by=10),right=F,
labels=c("50이상~60미만","60이상~70미만","70이상~80미만",
"80이상~90미만","90이상~100미만","100이상~"))
cost_result <- data.frame(cbind(table(cost_cut),prop.table(table(cost_cut))))
names(cost_result) <- c("도수","상대도수")
cost_result$누적도수 <- cumsum(cost_result$도수)
'R' 카테고리의 다른 글
[R] 시각화 - ggplot (0) | 2022.01.27 |
---|---|
[R] 시각화 - histogram, box plot (0) | 2022.01.27 |
[R] 빈도표 문제2 (0) | 2022.01.26 |
[R] reshape2::melt,dcast (0) | 2022.01.26 |
[R] 시각화 - 산점도 그래프(scatter plot) (0) | 2022.01.25 |