해야겠지?
728x90
반응형

공부/확률통계 4

비전공자 ADsP 자격증 합격 취득 후기

비전공자 ADsP 자격증 합격 취득 후기 우선 자격증 취득 이유는 데이터사이언스/빅데이터 관련 비전공자, 비연관 업무를 하면서 특수대학원에 지원하기 위함이었는데, 결과적으로 매우 큰 도움을 받았다. 인강 수강이나 학원은 다니지 않았고 직장 병행하면서 한달 간 독학으로 취득했다. 전공자나 관련직무 종사자가 아닌 아예 처음 공부를 시작한다면 조금은 도움이 될 것이다. 1. 접수하기 데이터자격검정 홈페이지 (https://www.dataq.or.kr/www/main.do) 시험접수 - 시험일정 에서 빅데이터분석기사/데이터분석(ADsP/ADP), SQLP/SQLD, 데이터아키텍쳐(DAP/DAsP) 모두 접수할 수 있다. ADsP (데이터분석준전문가) 시험은 연4회 치러진다. (시험접수 환불은 접수기간 마감일 1..

공부/확률통계 2023.06.15

[프로그래밍 확률 통계] 03 확률

1. 사건과 확률의 개념 1) 확률(P; probability): 여러 가능한 결과 중 하나 또는 일부가 일어날 가능성으로 0과 1 사이의 값으로 정의 - 실험(Experiment), 시행(Trial): 여러 가능한 결과 중 하나가 일어나도록 하는 행위 - 표본공간(Sample Space): 실험에서 나타날 수 있는 모든 결과를 나열한 집합 (Ω or S) - 사건(Event): 표본공간의 일부분(부분집합) 사건A가 일어날 확률; P(A) or Pr(A) = 사건(A)의 원소 수 / 표본공간(Ω)의 원소 수 - 복원 추출: 모든 시행에서 똑같은 상황으로 시행하는 방법 - 비복원 추출: 앞의 시행이 다음 시행에 영향을 주는 방법 2) 경우의 수: 표본공간에서 사건A가 발생할 확률 - 사건의 연산: 합사건,..

공부/확률통계 2023.05.25

[프로그래밍 확률 통계] 02 논리적인 자료의 요약

수치를 통한 연속형 자료 요약시 그림이나 도표 (시각화)에 의한 분석의 단점으로는 작성자의 주관적 판단에 따라 달라지므로 일관성, 객관성이 부족하다. (시각적 자료는 이론적 근거 제시가 어렵다) → 많은 양의 자료를 의미있는 수치로 요약하여 대략적인 분포상태를 파악 가능하므로 단점 보완 가능 1. 중심위치의 측도 (measure of center): 자료의 중심위치 1) 평균(mean): 가장 많이 사용되는 방법으로 모든 관측값의 합을 자료의 개수로 나눈 것 (관측값들의 무게중심) - np.mean() - 관측값의 산술평균으로, 통계에서 기초적인 통계수치로 가장 많이 사용되나, 극단적으로 큰 값이나 작은 값의 영향을 많이 받음 2) 중앙값(median): 전체 관측값을 정렬했을 때, 가운데 위치하는 값 ..

공부/확률통계 2023.05.22

[프로그래밍 확률 통계] 01 시각화를 통한 자료의 요약

1. 자료의 형태 1) 범주형 자료(=질적자료) > 로지스틱회귀분석 - 순위형 자료(학점), 명목형 자료(혈액형) - 관측값의 크기보다 포함되는 범주에 관심 - 각 범주에 속하는 관측값의 개수 측정 > 전체에서 차지하는 각 범주의 비율 파악 > 효율적으로 범주 간의 차이점을 비교 가능 1-1) 도수분포표 - 도수(Frequency): 각 범주에 속하는 관측값의 개수 df[범주].value_counts() - 상대도수(Relative Frequency): 도수의 자료를 전체 개수로 나눈 비율 df[범주].value_counts(normalize=True) - 도수분포표(Frequency Table): 범주형 자료에서 범주와 그 범주에 대응하는 도수, 상대도수를 나열해 표로 만든 것 - 한가지 범주의 도수분..

공부/확률통계 2023.05.21
728x90
반응형