Data Analysis/통계

간략 통계 용어 정리

간략 통계 용어집


1)  데이터 : 수적자료

2) 대표값 :
- 집단(데이터)를 구성하는 개체(=관측치)들의 "집중경향"(=중심경향)을 나타내는 통계적 수치
- 위치의 통계량이라고도 불림
- 대표적인 예: 산술평균, 중위수, 최빈값, 기하평균, 조화평균

3) 산포도(dispersion)
- 모집단 or 표본에 속하는 객체(=관측치)들의 변이정도(=변동)을 나타내는 통계량
- 변동(변이정도): 관측치가 흩어진 정도
- 대표적인 통계량:
      범위(range), 사분위수범위(IQR), 분산, 표준편차, 변이계수(CV), 
      비대칭도(=왜도, skewness), 첨도(kurtosis)

4) 분산
- 집단의 산포도를 나타내는 통계량
- 모분산의 불편추정량(= 편의가 없는 추정량이란 뜻)       

5) 편차
- 집단의 산포도를 나타내는 통계량, 관측치와 평균의 차이를 의미

6) 확률분포
- 확률변수가 취할 수 있는 모든 값 + 이 값들이 나타날 확률을 표시해 놓은 것!!!
- 두가지 종류로 나뉘어짐: 1) 연속확률분포  2) 이산확률분포

7) 확률변수
- 일정한 확률을 가지고 나타나는 사건(=실험결과)에, 수치를 부여한 것!!!!
- 두가지 종로 나뉘어짐:   1) 이산확률변수(예: 저항성 개체수)  
                                      2) 연속확률변수(예: 키, 무게)

8) 확률표본
- 완전확률화(무작위)에 의해 추출된 표본
- 모집단을 대표함

- 그래서, "무작위 표본"이라고도 함

9) 모집단 
- 관찰(관측)의 대상이 되는 모든 객체를 포함하는 집단
- 두가지로 나뉘어짐:  1) 무한 모집단   2) 유한 모집단

10) 표본
- 모집단의 일부
- 실제 관찰하는 객체들(=개체군)

11) 모수
- 모집단의 성질이나 특성을 설명하는 통계적 수치
- 표본의 통계량으로부터 추정
- 그리스문자로 표시
- 예: 모평균, 모분산, 등....

12) 영상관(=무상관) <- 상관계수
    - 상관계수 r = 0
    - 두 독립변수 사이에 직선적(=선형적) 관계가 없음을 나타냄
    - 그래서 "0상관"이라고도 함

13) 첨도(kurtosis)
- 변수(데이터)의 분포가 평균을 중심으로, 
- 정규분포인지     if a4  == 3
- 흩어진분포인지  if a4   < 3
- 밀집된분포인지   if a4   >  3
   를 나타냄

14) 공분산(covariance, Cov)
- 짝지은 두 변수 X의 편차와 Y의 편차를 곱하여,
- 모두 합한 다음, 그 값을 자유도(df)로 나누어준 값
- 부호(+, -)는 두 변수가 함께 변화하는 관계를 의미함
- 0: 영상관 (두 변수가 관계가 없음을 의미)