bigdata

1. summarize() - 데이터프레임을 하나의 행으로 축약한다. summarize(flights,delay = mean(dep_delay,na.rm=TRUE)) # A tibble: 1 × 1 delay 1 12.6 -summarize()는 group_by()와 함께 사용하는게 효율적이다. -group_by() : 분석의 단위를 전체 데이터셋에서 개별 그룹으로 변경시킴 ex) by_day %) -ex) 각 위치에 대해 거리와 평균 지연 사이에 관계를 탐색하고 싶다고 해보자 -ex) by_dest %로 해결할수 있음 delay % group_by(dest) %>% summarize( count = n(), dist = mean(distance,na.rm=TRUE), delay = mean(arr_de..
23학번이수현
'bigdata' 태그의 글 목록