엑셀을 활용한 통계 기초

변수의 종류

척도에 따른 분류

  • 척도 : 입력자료를 수치적으로 측정하는 단위
  • 명목 척도 : 성별, 직업, 지역 -> 순서와 무관, 수학적 계산 불가
  • 순서 척도 : 대소, 다과 등 서열적 자료 -> 순서상 상대적 위치 표현
  • 등간 척도 : 온도, 만족도 -> 수학적 연산 가능
  • 비율 척도 : 매출액, 가격 -> 절대적 원점 존재, 수학적 연산 가능
    데이터종류

인과관계예 따른 분류

  • 독립변수(설명변수)
    • 다른 변수에 영향을 주는 변수
    • 원인에 해당
  • 종속변수(반응변수)
    • 다른 변수에 영향을 받는 변수
    • 결과에 해당
      독립변수 종속변수 예

자료형식에 따른 분류

  • 숫자변수
    • 숫자로 처리되는 변수
  • 문자변수
    • 문자열로 처리되는 변수
  • 날씨변수
    • 날짜 표기형식으로 처리되는 변수

기술통계와 추론통계

  • 기술통계
    • 측정이나 실험으로 수집한 자료의 정리, 표현, 요약, 해석 등을 통해 자료의 특성과 변수 간의 관계를 분석하는 통계적 방법
    • 도수분포, 백분율, 평균, 표준편차 등 분석 포함
  • 추론통계
    • 표본정보를 가지고 그 모집단의 특성 및 가능성 등을 추론해내는 통계적 방법
    • 표본통계량을 이용하여 모수를 추론
    • 추론과정에서 모집단의 분포가 정규분포이면 모수검정 실시
    • 모집단이 정규분포를 가정하지 못하면 비모수검정 실시
      변수에 따른 분석모형

범주형 데이터 기초분석

  • 빈도분석
    • 실행메뉴
      • 분석 -> 기술통계량 -> 빈도분석
    • 분석할 변수의 빈도, 퍼센트, 무응답을 제외한 유효퍼센트, 누적퍼센트 등이 분석
  • 통계량
    • 수학적 분석결과 표시
    • 백분위수
    • 산포도
    • 중심경향
    • 분포
  • 도표
    • 범주형 변수
      • 막대도표
      • 원도표
    • 정량적 변수
      • 히스토그램
      • steam&leaf
      • Box-plot

연속형 데이터 기초 분석

기술 통계값

  • 주어진 데이터를 요약하며 의미 있는 몇 개의 값으로 분석
  • 요약과정에서 정보의 손실에 의한 정확성이 상실되나, 대부분 요약성이 정확성보다 중요한 의미를 갖음
    기술통계값

평균값 mean

  • AVERAGE()
  • 평균값은 어디에나 존재
  • 자료의 모든 값을 고려
  • 극단치에서 변동의 폭이 심함
    평균값

중앙값 median

  • MEDIAN()
  • 중앙값은 어떤 경우에나 존재
  • 자료의 모든 값 자체를 고려하지는 않고 몇 개의 값이 있는지만 고려
  • 극단적인 자료에서도 크게 변하지 않음
  • 극단치가 있다면, 평균값보다 중앙값이 더 대표성을 띔

최빈값 mode

  • MODE()
  • 특히 이름으로 표현한는 명목변수나 이산변수를 기술할 때 사용
  • 하나 이상일 수 있지만, 전혀 없을 때도 있음
  • 모든 값을 반영하지는 않음

범위 range

  • MAX() - MIN()
  • 연속형 변수에서 사용
  • 변수의 최고값에서 최소값을 뺀 것
  • 계산하기에 간편함
  • 최고값과 최소값에 의해서 범위가 결정되므로 그 사이에 값들의 퍼진 정도는 알수 없음
  • 극단치가 있을 때는 변동이 큼

분산 variance

  • 모집단의 분산 VAR.P()
  • 표본집단의 분산 VAR.S()
  • 측정값의 편차를 제곱하여 계산
  • 모 분산의 단위는 관측 값이 갖는 측정단위와 일치하지 않음
    분산

표준편차 standard eviation

  • 모집단 표준편차 STDEV.P()
  • 표본집단의 표준편차 STDEV.S()
  • 분산의 양의 제곱근
  • 측정값의 측정단위와 일치하기 위함
  • 크다
    • 자료가 평균값을 중심으로 광범위하게 분포
  • 작다
    • 평균값을 중심으로 밀접하게 분포
      표준편차

변동계수 coefficient of variation, CV%

  • 변동계수는 표준편차를 평균으로 나눈 값
  • 측정단위에 따라 표준편차의 값의 크기가 달라지므로, 단위가 다른 두 집단을 비교하는 경우, 두 표준편차의 단위를 같게 하기 위해 표준편차를 평균으로 나눈 값에 100을 곱하여 CV%로 표시(그전에는 단위가 없음)
    변동계수

사분위수범위 interquartile range : IQR

  • 상위 25%에 해당하는 값과 하위 25%에 해당하는 값을 제외하고 범위를 구한 값
  • IQR는 주우이수를 중심으로 상위25%와 하위 25% 관측값의 차이를 의미
    사분위수범위

왜도 skewness

  • SKEW()
  • 0SKEW.P()
  • 분포도의 기울어진 방향과 정도를 나타내는 양
  • '0’에 가까울수록 정규분포와 비슷
    왜도
    왜도 표

첨도 kurtosis

  • KURT()
  • 분포도의 모양이 얼마나 뾰족한 가를 나타내는 양
  • '0’에 가까울수록 정규분포와 비슷
    첨도
    첨도 표

엑셀에서 통계도구 사용하기

  • 파일 -> 옵션 -> 추가기능 -> 분석도구 -> 이동 -> 분석도구 check
  • 데이터 탭 -> 데이터분석

데이터입출력구현 - 핵심정리

데이터입출력구현

1. 데이터 조작 프로시저 개발

  • SQL은 관계형 데이터베이스 관리시스템의 데이터를 관리하기 위해 설계된 특수 목적의 프로그래밍 언어로 데이터 정의어, 데이터 조작어, 데이터 제어어를 가짐
  • PL/SQL은 Oracle에서 개발한 데이터 조작 언어이며, 프로그래밍 언어의 특성을 수용한 SQL의 확장 기능이 우수
  • 저장형 객체
    • Trigger
    • Stored Function
    • Stored Procedure
    • Stored Package

2. 데이터 조작 프로시저 테스트

  • Oracle DBMS는 모든 데이터 조작 프로시저에 대한 테스트 환경으로 SQL*Plus 도구를 제공

데이터입출력구현 - 데이터 조작 프로시저 테스트

데이터입출력구현

SQL*Plus 개요

  • Oracle DBMS에서 제공하는 데이터 조작 프로시저에 대한 테스트 도구
    SQL*Plus

SQL과 SQL*Plus 차이점

  • SQL은 데이터를 조작하는 표준 언어
  • SQL*Plus는 이러한 SQL을 DBMS 서버에 전송하여 처리할 수 있도록하는 Oracle에서 제공하는 도구
    SQL과 SQL*Plus 차이점

SQL*Plus 명령어 유형

  • 파일
    • SAVE
    • GET
    • SPOOL
  • 편집
    • A
    • C
    • L
    • I
    • DEL
    • n
  • 실행
    • START
    • @
    • RUN
  • 환경
    • SET HEAD ON
  • 형식
    • COLUMN
    • TITITLE
    • BTITLE
    • BREAK
  • 대화
    • DEFINE
    • PROMPT
    • ACCEPT

DBMS_OUTPUT 패키지 활용

  • 메시지를 버퍼에 저장하고 버퍼로 부터 메시지를 읽어오기 위한 인터페이스를 제공하는 패키지
API API오용 Anaconda Beacon Bluetooth CRUD분석 Camera ChatBot DB관련신기술 DB관리기능 DB서버 DB표준화 ER다이어그램 ER모델 ETL Flask HW관련신기술 IDE도구 IP IoT Machine_Translation NLP배경 ORM프레임워크 Package Recurrent Neural Network SDLC SW개발방법론 SW개발방법론선정 SW개발보안정책 SW개발표준 SW관련신기술 Sequence_Tagging ShellScript TCP_UDP Vector WordCloud c 자료형 class embedding konlpy python python 자료형 가설검증 개발환경구축 객체지향프로그래밍언어 관계데이터베이스모델 관계데이터언어 국제표준제품품질특성 네트워크7계층 네트워크관련신기술 네트워크장비 네트워크침해공격용어 논리데이터모델개요 논리데이터모델품질검증 논리적데이터모델링 논문 단위모듈구현 단위모듈테스트 데이터검증 데이터모델개념 데이터베이스무결성 데이터베이스백업 데이터베이스암호화 데이터베이스용량설계 데이터베이스이중화구성 데이터베이스정규화 데이터분석 데이터분석 - 순열 - 조합 데이터분석 - 정규분포 데이터분석 - 통계기초 데이터사이언스개념 데이터입출력 데이터전환수행계획 데이터정제 데이터조작프로시저작성 데이터조작프로시저최적화 데이터조작프로시저테스트 데이터지역화 데이터타입 데이터표준확인 데이터품질분석 라이브러리 로그분석 메모리관리 모델화 몬테카를로 물리데이터모델설계 물리데이터모델품질기준 물리데이터저장소구성 물리요소조사분석 반정규화 배치프로그램 변수 보안기능 보안솔루션 보안아키텍처 보안취약성식별 분산데이터베이스 분산분석 비용산정모델 빌드자동화도구 사용자정의함수 상관분석 서버개발프레임워크 서버인증 서버장비운영 서버접근통제 서비스공격유형 선언형언어 세션통제 소스코드인스펙션 소프트스킬 소프트웨어개발프레임워크 소프트웨어버전관리도구 소프트웨어연계테스트 슈퍼디엠지 스크립트언어 시스템카탈로그와뷰 암호알고리즘 애플리케이션모니터링도구 애플리케이션배포도구 애플리케이션성능개선 애플리케이션테스트결과분석 애플리케이션테스트시나리오작성 애플리케이션테스트케이스작성 애플리케이션통합테스트수행 애플리케이션패키징 연산자 예외처리 오답노트 오류데이터측정 오류처리 오류처리확인및보고서작성 요구공학방법론 운영체제 웹서버 이벤트 인터넷구성의개념 인터페이스구현검증 인터페이스기능확인 인터페이스보안 입력데이터검증및표현 자료구조 자연어처리 재사용 절차적프로그래밍언어 정보보안침해공격용어 정보처리기사 제품소프트웨어매뉴얼작성 집계성DCL작성 체크리스트 초기데이터구축 취약점분석 칼럼속성 캡슐화 코드오류 클러스터링 키종류 테일러링기준 트랜잭션인터페이스 트리거 파일처리기술 파티셔닝 패키지 포트포워딩 프로세스스케줄링 프로토타입 한국어임베딩 핵심정리 현업도구 형상관리도구 환경변수 회귀분석
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×