통계학의 정의
통계학(statistics)은 수량적인 비교를 기초로 사실을 관찰하고 분석하는 방법을 연구하는 학문
일반적으로 수집되는 데이터가 조사자, 시기, 방법, 목적 등에 따라 다르게 나타나는 불균형적인 데이터이지만, 통계학은 이 안에서 의미를 찾아내고 실생활에서 적용가능한 유용성을 찾아내 이를 수치로 표현할 수 있다.
- 기술통계(descriptive statistics):
표본에 대한 분석 결과의 각종 수치들을 활용하여 집단의 특성을 설명 - 추론통계(inference statistics):
표본을 활용하여 모집단의 특성을 나타내는 것
통계학의 목적
- 의사결정
많은 정보를 지각하고 평가하여 하나를 선택- 정보와 반응 사잉의 다대일 대응으로 나타남
- 여러가지 대안 가운데 하나를 선택할 때 사용
- 불확실성의해소
의사결정을 하게 되면 그 결과가 정확한 것이라 할 수 있는가의 문제- 빅데이터의 개념을 들여와 불확실성을 해소
- 정보수집이 어려움
- 시장의 변화와 대응의 어려움에대한 극복 필요
- 요약
다양한 데이터를 신속히 이해할 수 있도록 다양한 형태로 표현- 불확실성의 감소를 위해 사용
- 반복되어 생산되는 데이터를 정리된 보고서로 표현하여 불확실성이 낮은 상황의 의사결정이 가능하도록 함
- 연관성 파악
요약된 보고서에서 주요한 항목들 간의 연관성을 파악한 경쟁우위의 확보- 의사결정권자에게 항목 간 연관성을 제시해 미래의 계획을 지원
- 다양한 자료는 의사결정에 있어 세부적 판도에 기여
- 예측
인과관계 파악을 통해 패턴을 찾아내고 이러한 패턴을 통해 추세를 판단- 다양한 변수의 대입과 삭제를 통해 예측 가능
통계분석의 과정
통계분석은 표본을 통해 의미 있는 자료를 추출하고, 이를 기반으로 의사결정, 불확실성의 해소요약, 연관성 파악, 예측 등의 결과로 이어지도록하는 일련의 과정이다
수집 -> 정제 -> 추정 -> 검정
- 수집
- 조사과정에서 자연스럽게 수집
- 조사자가 특정 목적에 맞는 자료를 얻기 위해 설계한 수집 도구를 이용
보통 자료가 많을 수록 통계분석에서 더 좋은 결과를 얻을 것이라고 생각하지만 조사의 목적에 맞는 적절한 자료를 수집해서 최적의 통계방법으로 분석한 결과가 가장 정확도가 높음
- 정제
- 분석에 적합한 자료를 선별
- 적합하지 않은 자료는 삭제
- 추정
- 통계 분석을 진행하는 것 -> 모수를 추정하는 것
- 표본의 특성을 설명하는 통계량을 통해 모집단의 모수를 추정하게 됨
- 검정
- 통계조사의 목적 -> 주장이 믿어지는 사실이 실제로 옳은지 아닌지를 확인
- 수립된 가설이 유의미하고 타당성을 가지는지 통계적으로 확인하는 과정
- 확인을 통해 가설의 기각와 채택여부를 판단
통계분석의 한계
-
확률이 없으면 무의미 - 통계분석의 결과는 항상 확률과 연관되어 표현
-
항상 틀릴 가능성 내포 - 신뢰수준 100% -> 신뢰구간에 해당하는 값 (-무한 ~ + 무한) - 결과의 범위가 줄수록 신뢰구간은 100%에서 멀어짐