전체 글 110

ADsP (2과목) 데이터 분석 기획 - 분석 방법론

데이터 분석 방법론 = 분석 프로세스 분석 방법론은 상세한 절차(Procedures), 방법(Methods), 도구와 기법(Tools&Techniques), 템플릿과 산출물(Templet&Outputs)로 구성 기업의 합리적 의사결정을 가로막는 장애요소: 고정 관념(Stereotype), 편향된 생각(Bias), 프레이밍 효과(Framing Effect: 문제의 표현 방식에 따라 동일한 사건이나 상황임에도 불구하고 개인의 판단이나 선택이 달라질 수 있는 현상) 등 폭포수 모델(Waterfall Model) -> 프로토타입 모델(Prototype Model) -> 나선형 모델(Spiral Model) 폭포수 모델 단계를 순차적으로 진행하는 방법 문제가 발견될 시 피드백 과정 수행 이전 단계가 완료되어야 다..

취준일기 2020.05.26

ADsP (2과목) 데이터 분석 기획 - 분석기획 방향성 도출

분석기획? 실제 분석을 수행하기에 앞서 분석을 수행할 과제를 정의하고, 의도했던 결과를 도출할 수 있도록 이를 적절하게 관리 할 수 있는 방법을 사전에 계획하는 일련의 작업 분석주제의 4가지 유형 -분석의 대상(what)과 분석의 방법(how) 목표시점별 분석 기획 방안 -문제해결을 위한(Problem Solving) 단기적인 과제 중심적인 접근 방식: 갑자기 이벤트 발생 -분석 과제 정의를 위한(Problem Definition) 장기적인 마스터 플랜 방식: 문제를 다시 정의해야 함 분석 기획시 고려사항 1. 가용데이터 2. 적절한 활용방안과 유스케이스 탐색 (벤치마킹과 내재화) 3. 장애요소들에 대한 사전계획 수립(위험관리, 변화관리(Change Management) 종류 정형데이터 반정형데이터 비정..

취준일기 2020.05.25

파이썬 데이터 분석# 범주형데이터 그래프 그리기 matplotlib과 seaborn 으로 시각화하기

대체로 파라미터가 유사하기 때문에 사용하기에 편리합니다. countplot df['음주여부'].value_counts().plot.bar() sns.countplot( x=None, y=None, hue=None, data=None, order=None, hue_order=None, orient=None, color=None,palette=None, saturation=0.75, dodge=True, ax=None, **kwargs, ) sns.countplot(x='음주여부',data=df) 파라미터 hue 추가해서 색상으로 구별해 줄 수 있습니다. sns.countplot(x='음주여부',data=df,hue='성별코드') barplot 수치형과 범주형 데이터 둘다 표현 가능 sns.barplot(d..

취준일기 2020.05.12

파이썬 데이터 분석 #데이터 로드하기 한글 인코딩 문제 해결하기(utf-8, cp949, 유니코드 한글 깨짐)

데이터 분석 환경도 다 설정했고 이제 분석을 시작하기 위해 데이터를 로드하는데 유니코드디코드에러(UnicodeDecodeError)가 뜨네요. 이럴 경우에는 한글 인코딩 문제인데 cp949를 이용하여 해결할 수 있습니다. encoding='cp949'를 추가해주니 데이터가 이쁘게 로드된 것을 확인 할 수 있습니다. df=pd.read_csv('NHIS_OPEN_GJ_2017.csv', encoding="cp949")

취준일기 2020.05.12

데이터 분석 환경 준비하기 #2 matplotlib 한글폰트 설정하기

matplotlib을 사용하기에 앞서 표나 그래프를 그렸을 때 한글폰트가 깨지거나 흐릿하게 보이는 현상이 있는데 그 문제를 해결하기 위해 사전에 다음과 같이 설정해주시면 됩니다. 1. import os matplotlib 의 한글 폰트를 나의 컴퓨터 내부의 폰트를 가져와서 사용할 것이기 때문에 import os 해주세요. >>> import os >>> os.name nt 2. 운영체제에 따라 폰트를 불러와줍니다. rc를 통해 matplotlib의 폰트를 설정할 수 있습니다. 따로 폰트 경로를 지정하여 폰트를 설정해줄 수 도 있습니다. plt.rc('font',family=폰트위치나 폰트이름) Windows OS 인경우 #폰트 가져오기 plt.rc('font',family="Malgun Gothic") ..

취준일기 2020.05.11

데이터 분석 환경 준비하기 #1 데이터분석용 라이브러리 로드하기 (Pandas, Numpy, Matplotlib, Seaborn)

파이썬은 다양한 패키지를 포함하고 있는데 그중 데이터 분석에 자주 사용하는 패키지를 알려드리겠습니다.저는 보통 데이터분석을 할 때 pandas, numpy, matplotlib, seaborn을 미리 import 하고 시작하는 편입니다.아나콘다 를 사용하시면 자동으로 설치되어 있기 때문에 import 만 해주면 됩니다. import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt %matplotlib inline Numpy수치해석 라이브러리(넘파이)파이썬에서 수학 연산을 위한 가장 기본적인 패키지로 선형대수 계산 기능을 제공합니다. Numpy의 주요 대상은 동종 다차원 배열이고 Numpy의 배열클래스..

취준일기 2020.05.10

정보처리기사- UML( Unified Modeling Language)

사물 사물 내용 구조 사물 시스템의 개념적, 물리적 요소를 표현 클래스, 유스케이스, 컴포넌트, 노드 등 행동 사물 시간과 공간에 따른 요소들의 행위를 표현 상호작용, 상태머신 등 그룹 사물 요소들을 그룹으로 묶어서 표현 패키지 주해 사물 부가적인 설명이나 제약조건 등을 표현 노드 관계 다이어그램 구조적 다이어그램 (정적 다이어그램) 클래스 다이어그램 클래스와 클래스가 가지는 속성, 클래스 사이의 관계 표현 시스템의 구조를 파악하고 구조상의 문제점을 도출 객체 다이어그램 클래스에 속한 사물(객체)들, 즉 인스턴스(Instance)를 특정 시점의 객체와 객체 사이의 관계로 표현 컴포넌트 다이어그램 실제 구현 모듈인 컴포넌트 간의 관계나 컴포넌트 간의 인터페이스를 표현 구현 단계에서 사용되는 다이어그램 배치..

취준일기 2020.05.08