'AI' 태그의 글 목록 (3 Page)

2024.03.31· DS Study/R4DS(R언어)

1.select() - 변수가 수백,수천 개인 데이터셋을 자주 만나게 될 것이다. - 실제로 관심있는 변수들로 좁혀 신속하게 zoom in해준다. ex) 이름으로 열 선택 select(flights,year,month,day) # A tibble: 336,776 × 3 year month day 1 2013 1 1 2 2013 1 1 3 2013 1 1 4 2013 1 1 5 2013 1 1 6 2013 1 1 7 2013 1 1 8 2013 1 1 9 2013 1 1 10 2013 1 1 # ℹ 336,766 more rows # ℹ Use `print(n = ...)` to see more rows ex) year과 day사이의 (경계포함) 열 모두 선택 select(flights,year:day) ..

[R4DS] [2-3] arrange()

2024.03.31· DS Study/R4DS(R언어)

1. arrange() - 데이터프레임의 행을 기준에 따라 정렬하는 데 사용된다. 이 함수를 사용하면 데이터를 원하는 순서대로 정렬 가능 - arrange()의 함수의 구문 arrange(, ...) #... : 정렬할 기준이 되는 열 이름 ex) arrange(flights,year,month,day) # A tibble: 336,776 × 19 year month day dep_time sched_dep_time dep_delay arr_time sched_arr_time arr_delay carrier flight tailnum origin dest air_time distance hour 1 2013 1 1 517 515 2 830 819 11 UA 1545 N14228 EWR IAH 227 14..

[R4DS] [2-2] filter()

2024.03.31· DS Study/R4DS(R언어)

1. filter() - filter()를 이용하면 값을 기준으로 데이터를 서브셋가능 - 첫 번째 인수 : 데이터프레임 이름 - 두 번째 이후의 인수 : 데이터프레임을 필터링하는 표현식 ex) 1월 1일 항공편 모두선택하는 방식 filter(flights, month==1,day ==1) # A tibble: 842 × 19 year month day dep_time sched_dep_time dep_delay arr_time sched_arr_time arr_delay carrier 1 2013 1 1 517 515 2 830 819 11 UA 2 2013 1 1 533 529 4 850 830 20 UA 3 2013 1 1 542 540 2 923 850 33 AA 4 2013 1 1 544 545 ..

[R4DS] [2-1] 데이터 변형 (nycflights13, tidyverse)

2024.03.30· DS Study/R4DS(R언어)

1. tidyberse library(nycflights13) # A tibble: 336,776 × 19 year month day dep_time sched_dep_time dep_delay arr_time sched_arr_time arr_delay 1 2013 1 1 517 515 2 830 819 11 2 2013 1 1 533 529 4 850 830 20 3 2013 1 1 542 540 2 923 850 33 4 2013 1 1 544 545 -1 1004 1022 -18 5 2013 1 1 554 600 -6 812 837 -25 6 2013 1 1 554 558 -4 740 728 12 7 2013 1 1 555 600 -5 913 854 19 8 2013 1 1 557 600 -3 7..

티스토리툴바