[R] 연습 33

[R] 빅데이터 분석기사 예시 문제로 연습하기

이번 포스팅은 빅데이터 분석기사 예시 문제를 활용해서 데이터셋을 자유롭게 다루는 연습을 해보도록 하겠다. - 사용된 라이브러리: dplyr # 굳이 쓸 필요는 없지만, 지난 포스팅에서 dplyr을 사용봤기 때문에 한번 시도했다. - 사용한 데이터셋: BankExample.csv (첨부파일) # 예시 문제는 데이터셋에 맞도록 변형했다. ★ Q1) 데이터셋의 Experience 칼럼을 기준으로 상위 10개의 데이터를 구하고, Experience 칼럼 10개 중 최소값으로 데이터를 대체한 후, Income 칼럼에서 80 이상인 데이터의 Experience 칼럼 평균값을 구하시오. 방법 구상) 일단 상위 10개를 구해야 하니까 dplyr에서 arrange(desc())써서 내림차순 정렬을 할 수 있겠다. 내림차..

[R] 연습 2021.11.28

[R] dplyr 패키지 활용하기 (2편)

지난 포스팅에서 다루었던 내용은 1) 데이터프레임에서 특정 조건에 맞는 행을 추출하고 싶다면 filter()함수를 사용하자. 2) 데이터프레임에서 특정 열만 추출하고 싶다면 select()함수를 사용하자. 이번 포스팅에서는 정렬과 파생 변수를 추가해보는 연습을 할 것이다. 또한 지난 내용을 활용한 코드를 연습할 생각이다. # 참고로 mpg 데이터를 불러오기 위해서는 ggplot2 패키지의 설치가 필요하다. # mpg.df % arrange(displ) 배기량(displ)이 많은 차에서 적은 순으로 정렬하고 싶다면(내림차순), 다음과 같이 작성하자. mpg.df %>% arrange(desc(displ)) ★ 예시문제 1) 제조사(manufacturer)가 "chevrolet"인 자동차 중에서 고속도로 연..

[R] 연습 2021.11.27