취준일기

SPSS 기술통계량

둉영 2020. 11. 27. 16:35

SPSS 메인화면 - 데이터 보기 - 분석탭 - 기술통계량

 

빈도분석 : 이상치나 결측치 찾기

기술통계 : 중심경향과 산포도 및 분포의 형태를 나타내는 통계량 구하기

교차분석 : 범주형 자료에 의한 교차표 분석

데이터탐색 ,TURF 분석, 비율통계량, P-P 도표, Q-Q 도표

 

7을 결측값으로 지정하는 것은 하단의 페이지 참고하기

※빈도표에서 퍼센트는 상대도수, 유효 퍼센트는 유효 상대도수, 누적 퍼센트는 누적 상대도수를 의미

 

추정과 가설검정

 

신뢰수준 신뢰구간에 평균이 포함될 확률

유의수준 신뢰구간에 평균이 포함되지 않을 확률

원래는 임계치(기각, 채택을 결정하는 기준)을 결정해야 하지만 임계치를 구하기 어려워 유의수준과 P값 비교를 통해 결정

※유의수준 > 유의확률 = P값 : 귀무가설 기각

유의수준 < 유의확률 = P값 : 귀무가설 채택

 

통계적 검정

단측검정: 평균보다 크다,작다
양측검정: 평균과 차이가 있다, 없다

통계적 검정 데이터 방식 가설
교차 분석
=분할표검정, 카이스퀘어,카이제곱 검정
범주형 자료 2개 이상인 변수 빈도집계 (기대빈도와 관찰빈도간의 차이 검정) 독립이다/아니다
귀무가설: 행과 열이 독립이다.(연관없음)
대립가설: 행과 열이 독립이 아니다.(연관있음)
신뢰도 분석 동일한 단위, 범위를 가지고 있는 양적 변수들간의 응답자 신뢰도 확인


검사-재검사법, 동형검사, 반문법, 복수 양식법, 내적일관성 방법

크롬바하 계수 사용: 0~1까지의 값-> 0.6이상이면 신뢰도가 높다(알파계수)

리커트 척도, 긍정이 최고점으로 변환 후 분석
전체 크론바하 알파값 < 항목이 삭제된 경우 크론바하알파값
해당변수 삭제시 신뢰도 향상

독립표본 t-검정 비교대상이 동일하지 않음

종속 변수: 양적변수
독립 변수: 질적변수
단측검정:

평균보다 작다, 크다

예) 남자의 월평급 급여 평균은 여자의 월평균 급여 평균보다 크다, 작다


양측검정:

평균과 차이가 있다, 없다

예) 성별 월평급 급여의 평균과 차이가 있다/없다 

독립성, 정규성 
두 집단간의 평균 차이를 검정
대응표본 t-검정=쌍체비교 동일한 모집단으로 부터 추출된 두 변수

평균을 사용할 수 있는 양적변수 2개의 평균 차이 검정
동일 집단의 실험 사전사후비교

단측검정: 평균보다 크다,작다

예) 집단A의 몸무게 평균이 다이어트 전보다 다이어트 후에 작다

양측검정: 평균과 차이가 있다, 없다

예) 집단A의 다이어트 전과 후의 몸무게 평균이 차이가 있다, 없다



실험전, 실험 후의 양적 척도간 평균 차이

귀무가설: 사전과 사후의 평균에는 차이가 없다

대립가설: 사전과 사후의 평균은 차이가 있다 (양측검정)
대립가설: 사후에 효과가 있다
(단측검정)
단일표본 t-검정      
분산분석(ANOVA)=아노바 3개 이상의 모집단의 평균 비교

분산을 구해서 평균 비교
집단간분산 SSR
(각집단내평균-전체평균)
집단내분산 SSE
(개별관측치-각집단내평균)
전체분산 SST
(SSR+SSE 개별관측치-전체평균)
일원분산분석 : 독립변수 1개
이원분산분석 : 독립변수 2개
다원분산분석 : 독립변수 3개 이상


(독립성, 정규성, 등분산성)

F검정

 귀무가설: 각 집단별 평균들이 동일하다

대립가설: 최소한 하나의 디자인 평균은 차이가 있다
이원배치분산분석      
상관분석 양적변수대 양적변수/ 질적변수 대 질적변수 ※ 독립변수/종속변수라는 개념 없고 인과관계 아님 상관관계가 없다/있다
회귀분석



단순회귀분석: 독립변수 하나(결정계수)
다중회귀분석: 독립변수 2개 이상(수정결정계수)
회귀분석 오차항의 가정
- 오차항은 독립이다
- 오차항은 정규분포를 따른다
- 오차항은 등분산을 가진다
- 오차항의 평균은 0이다

적합도 검정: F검정 + 결정계수 R제곱(설명력)
귀무: 회귀모형은 통계적으로 유의하지 않다(종속변수와 독립변수간에 선형관계가 없다-> 선형함수로 표현 못함)
대립:회귀모형은 통계적으로 유의하다(종속변수와 독립변수간에 선형관계가 있다-> 선형함수로
표현 가능)

유의성 검정: T검정
귀무: 회귀계수는 통계적으로 유의하지 않다(독립변수는 종속변수에 영향을 미치지 않는다)
대립:회귀계수는 통계적으로 유의하다(독립변수는 종속변수에 영향을 미치는 변수다)

ex1) 직원수를 기준으로 5명 이상을 1그룹, 5명 미만을 2그룹으로 분류한 Size별 성과 평균차이를 검정하고자 한다. 다음을 작성하시오. 유의수준 0.05 (양측검정, 독립표본 t-검정)

 

A. 검증하고자 하는 가설을 쓰시오. 

귀무가설: 1그룹과 2그룹별 성과의 평균에는 차이가 없다

대립가설: 1그룹과 2그룹별 성과의 평균에는 차이가 있다

 

B. 아래의 표를 보고 유의수준 0.05에서 결과를 설명하시오.

T검정 결과 검정통계량의 값이 -26.192이고 P값(유의확률)이 0.000

결과해석: 직원 규모별 성과(Score)의 평균 차이 검정 실시 결과, 검정통계량 t=-26.192, P값은 0.000으로

P값(유의확률)이 유의수준인 0.05보다 작기 때문에 귀무가설을 기각할 수 있다.

따라서, '직원 규모별에 따라 성과 평균에는 차이가 있다'라고 할 수 있다.

구체적으로, 5명 이상의 성과 평균은 80.048, 5명 미만의 성과 평균은 67.419로 유의수준 0.05범위에서 5명 이상의 성과 평균이 5명 미만 집단보다 성과의 평균이 통계학적으로 유의하게 높다고 할 수 있다. 

 

ex2) 영업 1팀의 상반기 성과(SCORE_1)와 A 교육 이후의 하반기(SCORE_2) 성과 점수의 평균 차이가 있는지 알아보고자 한다. 다음을 기재하시오. (유의수준 0.05) (양측검정, 대응표본 t-검정)

 

A. 검증하고자 하는 가설을 쓰시오.

귀무가설: A교육을 통한 상반기 성과와 하반기 성과의 평균은 차이가 없다

대립가설: A교육을 통한 상반기 성과와 하반기 성과의 평균은 차이가 있다

 

B. 아래의 표를 보고 유의수준 0.05에서 결과를 설명하시오.

결과해석: A교육을 통한 상반기, 하반기 성과 평균 차이 검정 실시 결과, 검정통계량 t=-1.1545, 자유도 = 394, P값(유의확률)은 0.249이므로 P값이 유의수준 0.05보다 크므로 귀무가설을 기각할 수 없다. 따라서, '영업 1팀의 상반기 성과(SCORE_1)과 A 교육 이후 하반기(SCORE_2) 성과 점수의 평균은 차이가 없다'라고 할 수 있다. 즉, A교육을 통해 성과 점수의 증가는 있었으나, 통계적 효과는 없음

 

ex3) 지역별 성과의 평균에 차이가 있는지 알아보기 위해 다음과 같은 결과를 도출하였다. 가설 설정과 해석하시오. (유의수준 0.05)

 

A. 검증하고자 하는 가설을 쓰시오.

귀무가설: 각 지역별 성과의 평균은 차이가 없다(동일하다)

대립가설: 최소한 하나의 지역에는 성과의 평균은 차이가 있다.

B. 아래의 표를 보고 유의수준 0.05에서 결과를 설명하시오.

지역별 성과의 평균 차이 검정 실시 결과, ~

 

 

: