워크시트 19

정형 데이터를 다루는 머신러닝 문제해결 패턴

인공지능 팩토리 세미나 발표 by 신백균 Source: https://aifactory.space/learning/detail/2064https://youtu.be/b98H87BIrbo Agenda탐색적 데이터 분석(EDA)의 중요성과 개요베이스라인 모델 설계모델 성능 개선 방안 시작하기 전에…머신러닝 문제해결 프로세스문제 이해어떤 데이터를 활용해서 예측?회귀 | 분류?주어진 데이터는 무엇인가?어떻게 접근할 것인가?배경 지식을 활용할 만한 점은 있는가? EDA ★★★주어진 데이터의 구조를 보고 통계값을 구해봄제공된 파일별 용도 파악데이터의 양(레코드 수, 피처 수, 전체 용량 등) - info(), shape 활용어떤 feature가 중요한지, 어떻게 조합해야 할지에 대해서 인사이트를 얻음이름과 의미, ..

워크시트 2022.09.21

품질이란?

품질(Quality)의 개념 - 전통적 품질관리에서의 품질: "규격에 부합하는 것" - 품질을 보는 5가지 관점 선험적 관점: 품질을 정의할 수는 없더라도 무엇인지 고객이 인지 제품관점: 바람직한 성분이나 속성의 함량 차이가 곧 품질의 차이 사용자관점: 용도 적합성(Fitness for Use) 제조관점: 요구사항에 부합되는 정도(Conformance of Requirements) 가치관점: 품질은 실제 용도와 판매가격의 최적 상태 품질의 구성요소 - 제품특징: 시장점유율의 확대나 보다 높은 가격을 통하여 주로 '판매수익의 증대'에 기여하는 요소. 제품특징은 '설계품질'로서 이를 개선하기 위해서는 원가상승이 수반. - 무결함: 재작업, 폐기처분 고객불만 등의 감소를 통한 '원가절감'에 기여하는 요소. 무..

워크시트 2022.07.29

Mac M1에서 Mongo DB 설치하기 (using brew)

Mac에서 Mongo DB를 설치할 때 두 가지 방법으로 설치할 수 있습니다. 1. brew를 이용해서 설치하는 방법 2. official website에서 다운로드 받아서 설치하는 방법 일반적으로 brew를 사용해서 설치하기 때문에, brew로 설치하는 방법을 알아보겠습니다. Prerequisite: 당연히 brew를 사용하는 것이기 때문에 brew가 미리 설치되어 있어야 합니다. 1단계: 아래의 코드를 작성해서 MongoDB 설치를 위한 패키지 툴 다운로드하기 brew tap mongodb/brew 이 코드를 작성하면 터미널 창에서 자동으로 수행이 될 것입니다. 2단계: 한번 모든 formulae를 update 해주겠습니다. brew update 3단계: MongoDB community 버전을 설치해..

워크시트 2022.07.04

가상환경, 프레임워크에 대한 기본 정리

1. 가상환경 무엇인가? 💡 간단히 말해서 가상 환경은 독립된 공간을 만들어주는 기능입니다. 프로젝트를 여러개 개발하는데 이때, 패키지 문제가 발생할 수 있습니다. 예를들어 프로젝트 A는 버전이 1.5에서 사용해야 되고 B는 패키지 2.0에서 사용해야되면 호환이 되지 않아 문제가 발생할 수 있습니다. 따라서 가상 환경은 이를 해결하기 위해 독립된 공간을 만들어주어 문제가 발생하지 않도록 합니다. 파이썬에서 가상환경은? 💡 각 가상환경별로 다른 버전의 파이썬 인터프리터가 들어갈 수 있습니다. 따라서 스크립트를 실행할 때는 원래 설치된 파이썬 인터프리터가 아닌 가상환경 안의 파이썬 인터프리터를 사용합니다. 왜 필요할까? 💡 같은 모듈을 사용한다고 하더라도 다른 버전을 필요로 한다거니, Python 프로그램을..

워크시트 2022.06.25

파이참 프로젝트 파일 사라져 보일 때

파이참으로 개발 프로젝트를 진행하다가 순간 프로젝트 파일들이 사라져서 기존 디렉토리가 안 보이는 경우가 종종 발생하곤 합니다. Mac이던 Windows이던지 상관없이 이러한 문제가 생기는 경우가 있어서 한 번만 대처법을 확인해두면 좋을 것 같습니다. 만약 파일탐색기에서 해당 폴더와 파일들이 그대로 있는 상태라면, 프로젝트가 다 날아간 것인지 크게 걱정하지 않아도 됩니다. 1) 먼저, 아래의 이미지와 같이 Pycharm 에서 Preferences...(설정) 를 클릭한 후 2) 설정 화면에서 왼편에 Project: 를 선택하시고, '+ Add Content Root'도 클릭해줍니다. Project 파일들에 대한 루트가 제대로 설정되어 있지 않다면 비어있는 화면이 나옵니다. 3) 이제 프로젝트 파일 경로..

워크시트 2022.06.24

InconsistentMigrationHistory 이슈 발생시 해결방법

django 프로젝트를 진행하면서 database와 migration시 InconsistentMigrationHistory 에러가 발생하는 경우가 있습니다. 바로 아래의 사진과 같은 상황이 발생하는 것인데요. 이 에러 메세지를 잘 읽어보면, (제 에러 메세지와 꼭 동일하지 않을 수 있습니다! 직접 이슈 발생 이유가 무엇인지 확인할 필요가 있습니다.) django.db.migrations.exceptions.InconsistentMigrationHistory 라고 하면서 migration 히스토리 상에서 어떤 충돌이 발생한 것임을 알 수 있습니다. 더 자세히보면 Migration admin.0001_initial이 accounts라고 하는 앱보다 먼저 applied 되면서 문제가 발생했다고 하는데요. 사실..

워크시트 2022.06.19

[JavaScript] 레이어(Layer)

레이어(Layer)란, 간단히 말해 층을 의미한다. 하나의 웹 페이지에 여러 개의 레이어를 만들어 한 레이어 위에 다른 레이어를 겹쳐 쌓을 수 있다. 레이어를 보이거나 감추거나 확대 또는 축소도 가능하고 동적인 애니메이션 구현도 가능하다. 레이어 정의 고유한 ID를 가져야 하며 레이어 위치와 크기를 속성값으로 지정한다. 레이어 생성에 필요한 태그 와 태그 사용 class 와 id 속성을 추가하여 원하는 부분의 스타일 지정 표현할 내용1 표현할 내용2 예제 초록 색종이 노란 색종이

워크시트 2022.06.05

[CSS] 구글 폰트 사용하기

구글에서는 무료로 사용할 수 있는 여러 웹 폰트를 제공하고 있다. 이를 html 문서에 링크해서 쉽게 사용할 수 있다. 이번 포스팅에서는 구글 폰트 사용 방법을 작성하고자 한다. 1단계: 구글 폰트 사이트에서 폰트를 선택하기 2단계: 선택한 폰트를 추가하고 코드를 복사하기 적용 예시 Using Default Fonts 구글폰트! Using Google Fonts! 만약 잘 적용이 안된다면, @import문을 상위로 올려서 실행해볼것

워크시트 2022.06.04

[CSS] 기본 스타일과 선택자

CSS 기본 CSS 스타일의 형식: 선택자 { 속성1 : 속성값1; 속성2 : 속성값2 } 예시 li { font-size : 1.2em; line-height: 1.5; color : blue; } css를 한 줄로 표기할 수도 있고, 여러 줄로 표기할 수 있다. 중괄호{} 안에서 스타일 규칙은 세미콜론(;)으로 구분하여 작성한다. 참고로, 주석은 /* ... */ 사이에 작성한다. 인라인 스타일 인라인 ㄴ스타일은 따로 스타일 시트를 사용하지 않고 직접 대상에 적용하는 방법이다. 인라인 스타일 적용 예시입니다. 내부 스타일 시트 아래와 같이 html 문서 안에 스타일 정보를 작성한 것을 내부 스타일 시트라고 한다. 외부 스타일 시트 따로 css 파일을 만들어서 저장한 후, html 문서에 연결하면 해당..

워크시트 2022.06.03

[Excel] VLOOKUP 함수

● VLOOKUP 함수의 의미 = V(Vertical: 수직의) + LOOKUP(검색) ▷ 즉, 열을 기준으로 데이터를 찾아오는 함수 ● VLOOKUP 함수의 사용 조건 1. 작성하고자 하는 표에서 원 데이터와의 기준이 되는 열이 필요함: 기준이 되는 열이 있어야 값을 찾을 수 있다. 2. 찾으려는 데이터는 원 데이터의 기준 열 오른쪽에 있어야 함: 위의 예시에서도 '기초지자체'열 우측에 값이 존재함을 확인할 수 있다. 따라서, 만약 기준 열이 중간에 위치해 있다면 기준 열의 위치를 왼쪽으로 옮겨주어야 한다. 그렇게 할 수 없다면 INDEX(), MATCH() 함수를 활용해서 데이터를 불러와야만 한다. 3. 기준이 되는 열에 중복된 데이터가 없어야 함: 중복 값이 존재하는 경우 첫번째로 찾은 데이터만 불..

워크시트 2022.05.29

[Excel] 엑셀에서 다른 시트, 다른 문서로 가는 링크 만들기

엑셀을 활용하면서 여러 시트에 걸쳐 작업을 하다보면 해당 엑셀 파일의 다른 시트나 작성 중인 다른 문서로 손 쉽게 이동할 수 있는 링크를 만들고자 하는 경우가 있습니다. 오늘은 이 방법에 대해 알아보고자 합니다. 링크 만들기 아래와 같은 엑셀 파일에서 B4셀에 연습시트2로 이동할 수 있는 링크를 만들고자 합니다. 이 때, B4셀을 선택한 후, 단축키 [Ctrl + K]를 누르거나 상단의 [삽입]탭에서 [링크]를 선택해줍니다. 아래와 같이 하이퍼링크 삽입 창이 뜨면, 선택 메뉴 중에 [웹 페이지 또는 파일], [이 문서], [전자 메일 주소]가 있는데, [이 문서]를 선택하고 연결하고자 하는 시트를 선택해줍니다. [확인] 버튼을 누르고 다시 원래 시트로 돌아와 보면, 해당 위치에 링크가 생성된 것을 볼 수..

워크시트 2022.04.16

[Excel] 엑셀 중복 데이터 제거

엑셀을 다루다보면 하나의 열에서 고유한 값들만 보고싶은 경우가 있습니다. 따라서 이번에는 열안에서 중복된 항목을 제거하여 쉽게 고유값만 볼 수 있도록 하는 방법에 대해서 알아보겠습니다. 아래와 같은 예시 데이터가 있다고 하면, 회원ID, 회원등급, 생년월일이 모두 일치하는 경우에 대해서 중복된 행을 제거할 것입니다. 데이터 전체를 범위로 지정해주고(이때, '회원ID'와 같은 열 머리글이 포함되어도 상관 없습니다), 상단 [데이터] 메뉴 → [중복된 항목 제거] 를 선택합니다. 만약 데이터의 범위가 커서 전체를 선택하기 어렵다면 마우스로 드래그 하는 것 보다 단축키를 이용하는 것이 낫습니다. Ctrl + A를 누르면 데이터가 입력된 전체 범위를 선택합니다. 혹은 Ctrl + Shift + 방향키를 사용해도..

워크시트 2022.03.20

[GA] 구글 데이터 스튜디오

개요 구글 데이터 스튜디오(Data Studio)는 구글 마케팅 플랫폼 안에서 데이터 시각화(Data Visualization)을 담당하는 툴이다. 데이터 시각화 → 얻어낸 정보를 다른 사용자들에게 빠르고 직관적으로 전달하도록 한다. 데이터 스튜디오는 보고 단계에서 보고, 보고서 자동화, 모니터링이나 이슈 확인에 사용할 수 있고 KPI를 기반으로한 개선점 파악으로 성장에 기여할 수 있다. Google Analytics의 대시보드와 Data Studio의 대시보드를 비교 구분 GA 대시보드 Data Studio 대시보드 장점 GA 보고서와 함께 보기 쉬움 템플릿 및 데이터 공유 가능 레이아웃 자유롭게 변경 가능 다양한 데이터 소스의 시각화 가능 단점 템플릿만 공유하고 데이터는 공유할 수 없음 레이아웃 변경..

워크시트 2022.03.03