1. 결측값 - 데이터셋에서 이상값을 발견하고 다음 분석으로 넘어가고자 할 때, 다음의 두가지 옵션이 존재함 1) 이상값이 포함된 행 전체를 삭제한다. diamonds2 % filter(between(y,3,20)) -하나의 측정값이 유효하지 않다고 해서 모든 측정값이 유효하지 않은 것은 아니므로 -해당 옵션은 권장하지 않는다. - 저품질의 데이터가 있을 때마다 모든 변수에 대해서 이 방법을 적용하게 된다면 - 어떤 데이터도 남아있지 않게 될 것이다. 2)이상값을 결측값으로 변경한다.(권장) - mutate()를 사용하여 변수를 수정된 복사값으로 대체가능하다 --> ifelse()함수를 사용하면 이상값을 NA로 바꿀수 있다. diamonds2 % mutate(y = ifelse(y20 , NA , y))..
1. 좌표계 - 좌표계는 ggplot2에서 가장 복잡한 부분 - 기본적인 좌표계는 x,y가 서로 독립적으로 움직이는 데카르트좌표계 - 이것말고도 다른 좌표계에 대해서 알아보자. 2. coord_flip() - x,y축을 바꾼다. - ex) 수평 박스 플롯이 필요할 때 유용함 - 라벨이 길어서 x축과 겹치지 않고 들어 맞게 하기 힘들경우에도 유용함 ggplot(data = mpg, mapping =aes(x = class, y = hwy)) + geom_boxplot() ggplot(data = mpg, mapping =aes(x = class, y = hwy)) + geom_boxplot() + coord_flip() - 더 시각적으로 편안함을 준다는 것을 알 수 있다. 3. coord_quickmap(..