전체 글 209

[R] 시각화(graphics 패키지편)

가장 베이스 패키지인 graphics는 별도 설치 없이 바로 사용할 수 있다. graphics 패키지에는 plot( ), hist( ), barplot( ), pie( ), boxplot( ) 등이 있다. 함수 설명 plot( ) 산점도 hist( ) 히스토그램 barplot( ) 막대그래프 pie( ) 파이 차트 boxplot( ) 박스 플롯 1. plot 함수 plot(x축 데이터, y축 데이터, [ xlab = "x축 이름", ylab = "y축 이름", main = "그래프 제목", type = "p"] ) 데이터가 하나만 입력되면 x축은 Index로 자동 지정되고 y축에 데이터 값이 표현된다. type인자로 산점도의 출력 형태를 지정할 수 있다. p 점 출력 l (소문자 L) 선 출력 b 점, ..

[R] 연습 2022.01.22

[Excel] 엑셀 데이터 분석 기본

1. 엑셀의 붙여넣기 Ctrl + C(복사) / Ctrl + V(붙여넣기)를 하면 값, 서식, 수식 모두를 붙여넣기 때문에 주의하자. 따라서 Ctrl + V 보다 값만, 서식만, 수식만 붙여넣는 기능을 활용하도록 하자. 빠른실행도구모음에 등록해두면 편하게 사용할 수 있다. 2. 엑셀의 참조 상대참조: 함수를 복사/붙여넣기 할 때 참조된 셀이 함께 이동 절대참조: 함수를 복사/붙여넣기 해도 참조된 셀이 이동하지 않는 참조 혼합참조: 한 셀의 열 또는 행에만 절대 참조 3. 기초통계량 계산 합계 =SUM(범위) 중앙값 =MEDIAN(범위) 최대값 =MAX(범위) 최소값 =MIN(범위) 평균 =AVERAGE(범위) 최빈값 =MODE(범위) 분산 =VAR(범위) 표준편차 =STDEV(범위) 4. 피벗테이블 활용..

워크시트 2022.01.20

[R] 기초 문법 4

2022.01.09 - [[R] 연습] - [R] 기초 문법 1 2022.01.13 - [[R] 연습] - [R] 기초 문법 2 2022.01.15 - [[R] 연습] - [R] 기초 문법 3 지난 포스팅에 이어서 R의 기본적인 문법을 계속해서 정리해볼 것이다. 팩터(Factor) 팩터는 범주형 자료를 표현factor(x = 범주형 데이터, levels = 범주 목록, labels = 범주별 표시 값, ordered = TRUE는 순서형, FALSE는 명목형)로 생성 # 팩터 예시 payment

[R] 연습 2022.01.16

[R] 기초 문법 3

2022.01.09 - [[R] 연습] - [R] 기초 문법 1 2022.01.13 - [[R] 연습] - [R] 기초 문법 2 지난 포스팅에 이어서 R의 기본적인 문법을 계속해서 정리해볼 것이다. 조건문 if문(if - else if - else) grade = 89 if(grade > 90){ print("A") } else if(grade > 80){ print("B") } else if(grade > 70){ print("C") } else { print("D") } # [1] "B" ifelse(조건식, 참일 때 실행문, 거짓일 때 실행문) # ifelse() 활용 예시 exam_result

[R] 연습 2022.01.15

[R] 기초 문법 2

2022.01.09 - [[R] 연습] - [R] 기초 문법 1 지난 포스팅에 이어서 R의 기본적인 문법을 계속해서 정리해볼 것이다. 리스트(list) 리스트의 형태는 (키, 값) 형태로 list(key = value, key = value, ...)로 작성 # 리스트 생성 예시 list(name = c("simon", "micheal", "kyle"), height = c(180, 176, 169) # $name # [1] "simon" "micheal" "kyle" # $height # [1] 180 176 169 추가로, 리스트 안에 리스트를 중첩으로 작성할 수도 있다. 행렬(Matrix) 행렬은 행과 열로 구성되어 있다. 벡터와 마찬가지로 한 가지 유형의 스칼라만 저장할 수 있다. matrix(d..

[R] 연습 2022.01.13

[Python] 기초 문법 6

함수 def 함수이름(매개변수1, 매개변수2, ...): code ... return 함수의 형태 - parameter와 return이 존재 def add(x1, x2): y = x1 + x2 return y - return이 없는 함수 def noReturn(a, b): print(a + b) - parameter가 없는 함수 def noParam(): a = '매개변수가 없는 함수' return a noParam() # 매개변수가 없는 함수 - parameter와 return이 둘 다 없는 함수 def noBoth(): print('모두 없는 함수') noBoth() # 모두 없는 함수 매개변수의 수가 일정하지 않을 때 함수의 구현 '*'을 매개변수 앞에 사용함으로써 여러 개의 매개변수를 받을 수 있..

[Python] 연습 2022.01.08

[Python] 기초 문법 5

If statement (조건문) 명시한 조건이 참인지 거짓인지에 따라 해당 코드를 수행하는 명령어 if/else 문 if 조건 입력 부분(True/False): 조건을 만족하면 실행 else: 조건을 만족하지 않으면 실행 참고) if, else 뒤에 항상 ':'을 붙여야 하는 것에 유의해야 함 조건문은 항상 들여쓰기에 유의해야 함 조건에는 비교 연산자나 and, or, not 연산자를 통해 표현할 수 있음 elif 문 if/else로 나누는 것 외에 조건에 따라 그 이상의 분기로 나누어야 할 때 사용하는 명령어 grade = 90 if 80 < grade

[Python] 연습 2022.01.07

[Python] 기초 문법 4

사전(Dictionary) # 빈 사전 D = {} # 다양한 자료형의 사용 D = {'Name':'James', 'Age':23, 'Friends':['John', 'Bob']} # 다만, key에는 리스트, 딕셔너리를 포함할 수 없다. # key-value 추가 D['Hobby'] = 'Programming' # key-value 삭제 del D['Age'] Key를 사용하여 값을 가져오기 # 인덱싱, 슬라이싱의 방법으로 요소 값을 접근할 수 없다 # 딕셔너리에서는 value를 얻기 위해서는 오로지 key를 통해서만 접근이 가능 D['Name'] # 'James' 사전 관련 함수 - 사전의 모든 key값들 보기 keys() D.keys() - 사전의 모든 value들 보기 values() D.valu..

[Python] 연습 2022.01.07

[Python] 기초 문법 3

리스트 # 리스트 생성 myList = [1, 2, 3] # 빈 리스트 생성 myList = [] myList = list() # 다양한 원소 myList = [1.5, "two", [5, 4, 3]] 리스트 연산(덧셈, 곱셈) myList1 = [1, 3, 5, 7] myList2 = [2, 4, 6, 8] print(myList1 + myList2) # [1, 3, 5, 7, 2, 4, 6, 8] myList = [1, 2, 3] print(myList * 3) # [1, 2, 3, 1, 2, 3, 1, 2, 3] 리스트 인덱싱, 슬라이싱 myList = [2, 4, 6, 8] myList[2] # 6 myList = [1, 3, 5, 7, 9] print(myList[1:3] # [3, 5] myL..

[Python] 연습 2022.01.07

[Python] 기초 문법 2

문자열 큰 따옴표("") 혹은 작은 따옴표('')로 문자열 작성 myStr = "Life is too short, You need Python." 이스케이프 코드 이스케이프 코드 의미 \\ 역 슬래시(\) \' 작은 따옴표(') \" 큰 따옴표(") \n 개행(줄 바꿈) \t 가로 탭 문자열 인덱싱 myStr = "Python" print(myStr[3]) # h print(myStr[-1]) # n # 문자열 인덱스를 통한 수정 주의 (이렇게 수정할 수 없다) myStr = "Auktion" myStr[2] = 'c' print(myStr) # 문자열 슬라이싱을 이용한 수정 myStr = "Auktion" myStr = myStr[:2] + 'c' + myStr[3:] print(myStr) # Auc..

[Python] 연습 2022.01.07

첫 토익 950점 후기 + 뤼이드 튜터(산타토익) 환급반

지난 21년 12월 19일에 치른 토익 점수가 12월 31일에 발표되었다. 점수 잘 나오면 블로그에 후기를 써야겠다고 생각했는데, 그래도 개인적 기준으로는 잘 나온 편이라 생각해서 후기를 작성하게 되었다. 그동안 몇 번 토익을 보려고 했지만, 5만원 가까이 드는 시험이므로 한 번 볼 때 무조건 고득점 해야겠다는 생각이 들어서 미루다가 결국 연말에 보게 되었다. 사실 그렇다고 공부를 열심히 한 것 같지는 않다. 개인적으로 토익도 어차피 하나의 시험이고 얼마나 효율적으로 공부하는지가 중요하다고 생각했기 때문이다. 공부를 위해서 영단기 1000제 모의고사 책을 4권 정도 샀는데, 진짜 한 권만 다 풀고 나머지는 건드리지도 않았다. 사두고 풀지도 않는 문제집이 너무 아까워서 앞으로 책은 안 살 것 같다. 심지어..

리뷰 2022.01.01

[Python] 기초 문법 1

변수(variable) = 사용자가 정의한 값 혹은 객체가 담겨 있는 공간 변수의 초기화 = 생성된 변수에 처음으로 값을 부여하는 것 변수에 데이터를 저장할 때는 = 을 사용한다. 이 때 = 은 할당 연산자(assign operator)라고 한다. 변수 myNum에 10이라는 정수 데이터를 할당(assign)하기 위해서는 아래와 같이 입력한다. myNum = 10 자료형(data type) = 프로그래밍에 사용되는 변수, 객체 혹은 자료의 형태 숫자형은 데이터가 정수인지 실수인지 복소수인지에 따라 int, float, complex로 나뉜다. myInt = 5 myFloat = 3.5 myComplex = 3 + 4j 산술 연산자 연산자 사용 의미 + a + b a와 b를 더한 값 - a - b a에서 ..

[Python] 연습 2021.12.31

MECE와 strategic thinking

"MECE"는 비즈니스 문제 해결 과정에서 논리적이고 전략적인 사고를 위해 반드시 알아야 할 개념이다. M.E.C.E (Mutually Exclusive Collectively Exhaustive)에서 Mutually Exclusive는 상호 중복이 없어야 한다는 것이고, Collectively Exhaustive는 누락된 것이 없는 것을 의미한다. 간단한 예를 보자. A서비스 가입자를 나이 범주별로 구분하여 20대 이하, 30대, 40대, 50대, 60대 이상으로 나눌 수 있을 것이다. 이렇게 하면 각 가입자들 분석에 중복될 일이 없고(Mutually Exclusive), 누락된 가입자도 없을 것(Collectively Exhaustive)이다. 이러한 MECE 사고 방식이 중요한 이유는 1) 필요 내..

이론 2021.12.30

[R] 군집분석(k-means clustering편)

이전 포스팅에서는 차원축소의 방법 중 하나인 다차원 척도법(MDS)을 연습했었다. 시각화 과정에서 k-평균 군집화(k-means clustering)를 시행했었는데, 이번 포스팅에서 이를 한번 다시 다뤄보도록 하겠다. 군집분석 방법에는 계층적 군집화와 비계층적 군집화 방법이 있다. k-평균 군집화 방법은 비계층적 군집화 방법이며, 계층을 두지 않고 유사도를 바탕으로 미리 정한 k개의 군집들 중 하나에 할당한다. k-평균 군집화는 다음과 같은 순서로 진행한다. 초기 군집의 수, k개를 사용자가 정한다. k의 초기 평균값은 랜덤으로 정해진다. 각 레코드는 중심이 가장 가까운 군집으로 할당된다. 군집의 중심점을 다시 계산하고, 3 단계를 반복한다. 더 이상의 변화가 없으면 중단한다. 이제 코드를 연습해보도록 ..

[R] 연습 2021.12.26