Simon Yoon's blog

  • 홈
  • 태그
  • 방명록

ESD 1

[R] 데이터 정제하기 (이상값편)

지난 포스팅에서는 결측치에 대해서 다루었다. 결측치 편에서 다루었던 내용을 요약하자면, 1) 데이터셋에 결측치가 있는지 확인하기 위해서는, summary(), is.na(), complete.cases() 함수를 사용하자. 2) 좀 더 보기 좋게 칼럼별 결측치의 개수를 알고 싶다면, apply(is.na(), 2, sum)이나 colSums(is.na()) 함수를 사용하자. 3) 결측값이 존재하는 행의 수를 확인하기 위해서는, sum(complete.cases()) 함수를 사용한다. 4) 결측치가 너무 많은 열 혹은 행을 삭제하고 싶다면, 열 직접 삭제를 하거나, 행을 삭제하고 싶다면, !is.na() / complete.cases() / filter() / na.omit() 함수를 사용할 수 있다. 5..

[R] 연습 2021.12.10
1
더보기
프로필사진

Simon Yoon's 데이터 저장소

  • 분류 전체보기 (220)
    • [R] 연습 (33)
    • [Python] 연습 (35)
    • [SQL] 연습 (82)
    • [Tableau] 연습 (10)
    • Server (5)
    • 워크시트 (22)
    • 리뷰 (8)
    • 일상 (11)
    • 이론 (14)

Tag

R, mysql, solvesql, python, 프로그래머스, 티스토리챌린지, AI, tableau, sql, dplyr, 태블로, 엑셀, CSS, html, pandas, 오블완, 파이썬, 코딩테스트, server, EBS,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바