[R4DS] [1-6] 위치 조정

2024. 3. 30. 15:16· DS Study/R4DS(R언어)
목차
  1. 1. 위치 조정 
  2. 2. Position 인수 
  3. 3. position - "jitter"
  4. 4. 연습문제

1. 위치 조정 

- 막대 그래프에 색상을 입힐 수 있다. 크게 두가지 방법이 있다.

- 1. color 심미성 

ggplot(data = diamonds) + 
     geom_bar(mapping = aes(x = cut, color = cut))

- bar의 테두리가 색깔로 구분되어있음을 알수 있다. 하지만 육안으로 확인하기 어렵다는 단점이 있다.

- 그렇기에 좀 더 유용한 방법으로 fill을 사용할 수 있다.

ggplot(data = diamonds) + 
     geom_bar(mapping = aes(x = cut, fill = cut))

 

- color 심미성에 비해 fill 심미성이 조금 더 시각적으로 유용함을 알 수 있다.

 

- fill심미성을 clarity에 매핑을 해보자

- 다음과 같이 누적 막대 그래프가 생성된다. 

2. Position 인수 

- Position 인수로 지정하는 위치 조정에 의해 막대 누적이 자동으로 수행됨

- 누적 막대 그래프를 원하지 않는다면 "identity","dodge","fill" 세옵 션 중 하나를 선택하면 됨

 

2.1) identity

- 각 객체를 그래프 문맥에 해당되는 곳에 정확히 배치 --> 겹쳐서 배치됨

- 막대가 겹치기 때문에 막대그래프에 대해서는 그다지 유용하지 않음

- 겹치는 것을 구분하려면 alpha(밝기)를 적은 값으로 설정하여 투명하게 하거나

ggplot(
    data = diamonds,
    mapping = aes(x = cut , fill = clarity)
) + 
    geom_bar(alpha = 1/5 , position = "identity")

- fill = NA 로 설정하여 완전히 투명하게 해야함

- 대신 심미성은 color 로 부여해야함

ggplot(
    data = diamonds,
    mapping = aes(x = cut , color = clarity)
) + 
    geom_bar(fill = NA , position = "identity")

2.2) fill

- 누적막대처럼 동작하지만 누적막대들이 전부 동일한 높이이다.

- 쉽게 설명하자면 그룹들사이에 각각의 비율을 설명해준다.

- 그래프를 보면 이해하기 쉬울것이다.

ggplot(data = diamonds) + 
    geom_bar(
        mapping = aes(x=cut,fill = clarity),
        position = "fill"
    )

2.3) dodge

- 겹치는 객체가 서로 옆에 배치된다. --> 개별 값들을 비교하기 쉬워진다.

ggplot(data = diamonds) + 
    geom_bar(
        mapping = aes(x=cut,fill = clarity),
        position = "dodge"
    )

 

3. position - "jitter"

- [1]강에서의 첫 번째 산점도 플롯을 살펴보자

- 데이터셋엔 234개의 관측값이 있지만 해당 플롯엔 126개의 점만 표시되어있다.

- 그 이유는 hwy, displ의 값들이 반올림되어서 격자위에 나타나기 때문에 많은 점들이 겹쳤기 때문이다.

----> 이를 오버플롯팅 이라고한다.

 

- 이를 해결하고자 position 을 jitter(조금씩 움직임)로 설정하면 겹치는 것을 피할 수 있다.

- position = "jitter"를 하면 각 점에 적은 양의 랜덤 노이즈가 추가되어 포인트가 퍼지게 된다.

ggplot(data = mpg) +
    geom_point(mapping = aes(x = displ, y = hwy),
    position = "jitter")

-의문이 있을거다 이렇게 랜덤을 추가하면 덜정확해지지 않을까?

- 작은 스케일에서는 덜 정확해지는건 맞다.

- 하지만 큰 스케일에서는 더 표현력 있게 된다.

 

4. 연습문제

Q1) 다음 플롯의 문제는 무엇인가? 어떻게 고치겠는가?

ggplot(data = mpg , mapping = aes(x=cty, y = hwy)) +
    geom_point()

- 해당 플롯의 문제점은 너무 겹치는 데이터가 많다는 것이다. 

- position = "jitter"를 이용하여 해결할 수 있다.

ggplot(data = mpg , mapping = aes(x=cty, y = hwy)) +
    geom_point(position = "jitter")

 

Q2) geom_jitter()에서 지터의 정도를 제어하는 파라미터들은 무엇인가?

- width : 지터의 범위를 지정

- height : 지터의 높이를 지정

- seed : 지터를 생성하는데 사용되는 시드 값을 지정 

 

Q3) geom_jitter()와 geom_count()를 비교 대조하라

ggplot(data = mpg , mapping = aes(x=cty, y = hwy)) +
    geom_jitter()

ggplot(data = mpg , mapping = aes(x=cty, y = hwy)) +
    geom_count()

- Jitter와 다르게 count는 겹치는 점들을 합쳐서 점의 크기를 키운다.

'DS Study > R4DS(R언어)' 카테고리의 다른 글

[R4DS] [1-8] 그래프 레이어 문법  (0) 2024.03.30
[R4DS] [1-7] 좌표계  (0) 2024.03.30
[R4DS] [1-5] 통계적 변환  (0) 2024.03.30
[R4DS] [1-4] 기하 객체 (Geom 함수 정리)  (0) 2024.03.30
[R4DS] [1-3] Facet  (0) 2024.03.29
  1. 1. 위치 조정 
  2. 2. Position 인수 
  3. 3. position - "jitter"
  4. 4. 연습문제
'DS Study/R4DS(R언어)' 카테고리의 다른 글
  • [R4DS] [1-8] 그래프 레이어 문법
  • [R4DS] [1-7] 좌표계
  • [R4DS] [1-5] 통계적 변환
  • [R4DS] [1-4] 기하 객체 (Geom 함수 정리)
23학번이수현
23학번이수현
23학번이수현
밑바닥부터 시작하는 AI보안전문가
23학번이수현
전체
오늘
어제
  • 분류 전체보기 (243)
    • Statistic Study (47)
      • Mathematical Statistics(수리통.. (47)
    • Mathematics Study (15)
      • Linear Algebra (선형대수학) (15)
    • CS Study (74)
      • CLRS (자료구조 | 알고리즘) (49)
      • Database(DB) (11)
      • C++ (11)
      • 컴퓨터 구조 (2)
      • MongoDB (1)
    • DS Study (56)
      • CS 229(Machine Learning) (19)
      • CS 224n(NLP) (5)
      • Web Scraping (7)
      • R4DS(R언어) (20)
      • 밑바닥부터 시작하는 딥러닝 1 (5)
    • Hacking Study (0)
      • Web Hacking (0)
    • 코딩테스트 (5)
      • 백준-Python (5)
    • Paper Review(논문 리뷰) (43)
      • Deep Learning (16)
      • TCGA 관련 논문 (4)
      • Computer Vision (18)
      • NLP (5)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • 선형대수학
  • 백준
  • R언어
  • 데이터분석
  • 시간복잡도
  • 수리통계학
  • db
  • 정렬
  • 논문 리뷰
  • NLP
  • graph
  • Data Structure
  • R4DS
  • 자료구조
  • 파이썬
  • AI
  • 알고리즘
  • clrs
  • 딥러닝
  • Introduction to Algorithms
  • deep learning
  • Linear Algebra
  • introduction to algoritmhs
  • Machine Learning
  • LSTM
  • cs229
  • C++
  • cs 224n
  • web scraping
  • Algorithms

최근 댓글

최근 글

hELLO · Designed By 정상우.v4.2.2
23학번이수현
[R4DS] [1-6] 위치 조정
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.