본문 바로가기

DataScience/통계학5

통계학 _ 기대값, 분산, 체비셰프의 부등식, 적률 통계학_기대값, 분산, 체비셰프의 부등식, 적률 기대값(Expected value) - 사건이 발생했을 때, 이득과 그 사건이 발생할 확률을 곱한 값을 전체 사건에 대하여 합한 값 (=어떤 확률적 사건에 대한 평균의 의미를 가진다.) 분산(Variance) - 확렬변수가 기대값으로부터 얼마나 떨어진 곳에 분포하는지 나타내는 기대값과 분산의 성질 Let X ~(μ, σ²), c: 상수 1) E(c) = c 2) E(X) = μ 3) E(cX) = cE(X) = cμ 4) V(c) = 0 5) V(X) = σ² 6) V(c, X) = c²V(X) = c²σ² 7) E(X₁+X₂) = E(X₁) + E(X₂) = μ₁+μ₂ 8) V(X₁+X₂) = V(X₁) + V(X₂) + 2Cov(X₁+X₂) *Cov(X.. 2023. 7. 15.
통계학 _ 이산형 확률변수, 연속형 확률변수 통계학_이산형 확률변수, 연속형 확률변수 확률 변수(Random Variable) - 확률적 시행의 결과에 따라 결과 값이 결정되는 변수 - 이산형(Discrete) 확률변수 → 이산형 확률분포, 확률질량함수(Probability Mass Function, Pmf) → 이산형 확률변수의 누적분포함수 * 특성 1) F(∞) = 1, F(-∞) = 0 2) F(x)는 단조함수이면서 비감소함수이다. F(a) ≤ F(b) (*단 a < b) 3) F(x)는 h가 0으로 변화하는 구간에서 연속이다. lim F(x+h) = F(x) (* - 연속형(Continuous) 확률변수 → 연속형 확률분포, 확률밀도함수(Probability Density Function, Pdf) → 연속형 확률분포에서 X가 a와 b사이의.. 2023. 7. 14.
통계학 _ 확률, 베이즈 정리 통계학_확률, 베이즈 정리 사상 & 표본공간 - 확률실험 (random experiment) : 확실히 예측할 수 없는 결과를 유발하는 행위 또는 과정 - 표본공간 (sample space) : 출현가능한 모든 단일사상들의 집합 - 사상 (events) : 표본공간의 부분집합, 하나 이상의 단일사상의 집합 - 근원사상 (elementary outcome, =단일사상) : 표본공간을 구성하는 분해할 수 없는 무작위 실험의 기본적인 결과 - 여사상 (complement) : 특정 사상의 나머지 집합, P(A^c) = 1-P(A) 확률(Probability) - 각 근원사상들이 발생할 가능성이 발생할 가능성이 같을 때, 사상 A의 확률 P(A)는 확률의 성질 - 임의의 사상 A에 대하여 1) 0 ≤ P(A) .. 2023. 7. 13.
통계학 _ 기술 통계학 통계학_기술통계 자료의 분류 (1) 범주형 자료(Categorical data) : 숫자로 표현이 불가한 자료를 집단화하여 나타낸 자료(질적자료: 명목형, 순서형) (2) 측정형 자료(Measurement data) : 각 관측대상이 되는 자료에 측정단위에 따른 측정값을 부여하여 얻어진 데이터로 숫자의 크기에 의미가 있는 자료(양적자료: 이산형, 연속형) 척도에 대한 분류 (1) 명목척도(Norminal) : 빈도 분석 (2) 순서척도(Ordinal) : 차례가 있으며 각 간격은 다를 수 있다..(ex. 초, 중, 고) (3) 구간(=등간)척도(Interval) : 간격과 순서가 있는 척도 (4) 비율척도(Ratio) : 절대 0점이 있는 척도(연산이 가능) 위치의 측도 *통계학의 3M : Mean(평균.. 2023. 7. 12.
통계학 _ 통계 기본 개념(모집단, 모수, 표본, 통계량) 통계학_통계 기본 개념(모집단, 모수, 표본, 통계량) 통계학이란? 다양성, 그리고 의외성을 가진 Data들을 모아서(합치다 통, 統), 계산한다(셀 계, 計). 통계학 ┠ 기술 통계학(Descriptive Statistics) ┃ ┝시각적 표현(Visualization) ┃ ┝수치 요약(Statistic) ┗ 추론 통계학(Inferential Statistics) ┝모수 추정(Estimation) ┝가설 검정(Hypothesis test) 모집단과 표본간의 관계 - 모집단(Population) : 연구대상이 되는 모든 가능한 관측값이나 측정값의 전체집합 - 모수(Parameter) : 모집단 특성값(예 : 모평균, 모표준편차, 모분산, 모비율 등) - 표본(Sample) : 모집단 전체의 특성을 파악하.. 2023. 7. 3.
반응형