분류 전체보기 166

[Python] 클래스와 상속

상속 다른 클래스의 기능을 그대로 물려받을 수 있다 → 기존 클래스에 기능 일부를 추가하거나, 변경하여 새로운 클래스를 정의한다. 기존 클래스는 [Parent, Super, Base class], 상속 받는 새로운 클래스는 [Child, Sub, Derived class]라고 부른다. 1. Parent 클래스를 정의 class Parent: def __init__(self): self.i = 10 2. Parent 클래스의 인스턴스를 생성 father = Parent() print(father.i) # 결과: 10 3. Child 클래스를 정의 class Child(Parent): # 상속 pass c = Child() print(c.i) # 결과: 10 Child 클래스는 Parent 클래스로부터 상속..

[Python] 연습 2022.05.27

[R] apply() 함수

1. apply() 함수 행과 열 단위를 연산할 수 있는 apply() 함수 → 기본 구조가 테이블 형식이어야 한다. apply(x, margin, 함수) # margin에 1을 넣으면 행 연산, 2를 넣으면 열 연산 # 함수에는 함수이름만 쓰기 eg. max, sum, mean lapply() 함수는 연산 결과를 리스트로 반환하므로 변수를 세로로 나열하여 출력 sapply() 함수는 연산 결과를 벡터로 반환하는 함수이므로 변수를 가로로 나열하여 출력

[R] 연습 2022.05.21

[DB] Relation의 키(key)

Relation의 키(Key) 각 tuple을 유일하게 식별할 수 있는 하나 이상의 속성 집합 모든 relation은 key를 가짐 Relation instance는 계속 변화하므로 미래의 입력 값까지를 포함한 속성의 본질적인 의미를 고려하여 키 지정 여부를 결정 후보키(Candidate Key: CK) tuple을 유일하게 식별할 수 있는 속성들의 최소 집합 uniqueness와 minimality 조건을 모두 만족해야 함 유일성 조건(uniqueness): relation에서 key로 지정한 속성 값의 조합은 tuple마다 모두 달라야 한다는 조건 최소성 조건(minimality): relation에서 key로 지정한 속성의 개수를 최소화해야 한다는 의미 결과적으로 모든 relation은 최소 하나 ..

이론 2022.05.07

[DB] MongoDB

문서 모델 속성 값은 간단한 데이터 타입, 배열, 다른 문서도 가능하다. 문서의 구조가 다양하다. 미리 정해진 스키마가 존재하지 않는다. 수평적인 확장성이 좋다. 단, 무결성과 정합성을 보장하지 않기 때문에 장단점이 있다. RDB와 Key-Value 구조의 장점을 결합하여 설계되었다. 질의어 설명 MongoDB (shell) 시스템의 모든 데이터베이스 출력 show dbs 데이터베이스에 정의된 컬렉션 목록 출력 show collections 하나의 데이터베이스에 대한 상세정보 출력 db.stats() 하나의 컬렉션에 대한 상세정보 출력 db.컬렉션명.stats() 데이터베이스 생성 use 데이터베이스명 컬렉션 생성 (생성 안하고 바로 insert하면 자동으로 생김) db.createCollection(컬..

[SQL] 연습 2022.05.01

MapReduce

MapReduce 개념과 특징 HDFS에 저장된 파일을 분산 배치분석 할 수 있게 도와주는 프레임워크 분할 정복 방식으로 대용량 데이터를 병렬 처리 비공유 아키텍쳐 Map 입력 데이터를 가공 Reduce 맵의 결과를 집계(shuffle) 단계를 거쳐 리듀스의 입력으로 전송 하둡 맵리듀스 아키텍처 네임노드(NameNode) 하둡을 이루는 가장 기본적이고 필수적인 데몬으로, 네임 스페이스를 관리하는 마스터 역할을 수행 데이터노드(DataNode) 분산 파일 시스템의 데몬으로 파일의 실질적인 데이터 입출력에 대한 처리를 수행 잡트래커(JobTracker) MapReduce 시스템에서 job이라는 작업을 관리하는 마스터에 해당 (클러스터에 1개의 잡트래커가 존재) 태스크트래커(TaskTracker) 작업을 수행..

이론 2022.04.30

[R] aggregate() 함수

aggregate() 함수는 데이터의 통계량을 계산해주는 함수이다. Splits the data into subsets, computes summary statistics for each, and returns the result in a convenient form. 함수의 기본 형태 # 'data.frame' aggregate(data, by, FUN, ...) # 'formula' aggregate(formula, data, FUN, ...) by a list of grouping elements, each as long as the variable in the data frame x. The elements are coerced to factors before use. FUN a function ..

[R] 연습 2022.04.29

[DB] 데이터베이스 개념

데이터베이스 개념 정보시스템 → 가공 이전의 데이터나 가공 이후 생성된 정보 저장소 필요 → 데이터베이스 데이터와 정보는 연쇄적인 처리 과정 안에 서로의 입,출력으로 반복 사용될 수 있다. 정보시스템이란? - 한 조직의 활동과 운영에 필요한 데이터를 수집, 저장해 두었다가 다양한 방식으로 처리 및 가공함으로써 의사 결정에 필요한 정보를 생성하는 소프트웨어 체계 - 책이나 언론 매체, 사람 등의 전통적 방식으로는 불가능했던 대량의 정보 소비는 다양한 정보시스템을 통해서만 가능함 전통적 파일 정보 시스템의 문제점 1. 데이터 종속성(data dependency)의 증가: 파일 안의 저장 방식이나 접근 방법을 변경할 경우, 연관된 모든 응용 프로그램도 함께 수정되어야 하는 데이터 종속성 문제 발생 2. 데이터..

이론 2022.04.23