데이터사이언스 총정리

주어진 신장 데이터의 기술통계를 구하시오

신장 데이터

분석도구를 활용한 방법

  • 분석도구 설정
    1. '파일’탭
    2. 좌측 하단 ‘옵션’
    3. 좌측 하단 ‘추가기능’
    4. 화면 중앙에 ‘분석도구’ 선택
    5. 중앙 하단 ‘이동;’ 클릭
    6. 추가 기능 창 생성
    7. ‘분석도구’ 체크
    8. 확인
    9. ‘데이터’ 탭에 ‘분석’ 메뉴에 ‘데이터분석’ 확인
  • 기술통계법
    기술통계법1
    기술통계법2
    기술통계법3

함수를 사용한 방법

함수

  • 평균 AVERAGE()
  • 표준오차 Val / SQRT()
  • 중앙값 MEDIAN()
  • 최빈값 MODE()
  • 표준편차 STDEV()
  • 분산 VAR()
  • 범위 ABS()
  • 최소값 MIN()
  • 최대값 MAX()
  • 합 SUM()
  • 관측수 COUNT()

로또 6/45의 1~5등 까지의 조합수와 당첨확률을 구하시오

  • 45개의 로또 공 가운데 무작위로 6개를 뽑는다
  • 6개의 공을 무작위로 하나씩 뽑기 때문에 순서는 고려하지 않아도됨
  • 해결방법
    1등 : 모두 당첨 -> 45개 공에서 순서 상관없이 6개가 한 번에
    = COMBIN(45,6) = PERMUT(45,6) / FACT(6)
    2등 : 5개 당첨 -> 6개 중에서 5개가 맞고 나머지 1개는 보너스 번호
    = COMBIN(45,6) / COMBIN(6,5) _ COMBIN(1,1)
    3등 : 5개 당첨 -> 6개 중에서 5개가 맞고 보너스 1개를 제외한 38개 중에 1개가 포함
    = COMBIN(45,6) / (COMBIN(6,5) _ COMBIN(39,1))
    4등 : 6개 중 4개 포함하고 39개 중에 2개 포함
    = COMBIN(45,6) / (COMBIN(6,4) _ COMBIN(39,2))
    5등 : 6개 중 3개 포함하고 39개 중에 3개 포함
    = COMBIN(45,6) / (COMBIN(6,3) _ COMBIN(39,3))
  • 결과
    등수별 당첨확률

몬테카를로 시뮬레이션을 사용하여 원주율을 구하시오

  • 알고 있는 정보
    1. 사각형의 면적 : (2r)^2
    2. 원의 면적 : πr^2
  • 사각형의 면적/원의 면적 = 4r^2 / πr^2 = 4/π
  • π = 4 * 원의 면적 / 사각형의 면적
  • 랜덤으로 출력할 x, y
    = RAND() : 0~1까지의 난수
  • 원의 방정식
    x^2 + y^2 = 1 이므로 y = (1-x2)0.5
    위 값이 원 내에 있는지 즉 1보다 작은지 확인 IF(Val<=1.“원내”,“원밖”)
  • 원내 수 세기
    COUNTIF(범위, “원내”)
    몬테카를로 시뮬레이션

한 중학생의 시험점수를 이용하여 등수를 구하시오(전체성적평균과 표준편차는 제공)

문) 우리집 막내A 는 중학교 2학년에 재학중이다. 이번 중간고사 시험결과가 학교로부터 우편으로 배달되었다. 시험결과 안내는 A의 등수가 아니라 표로 제시되었다. 2학년 전체의 시험성적이 정규분포를 나타낼때 A의 등수는?

A의평균점수 2학년 평균점수 2학년 표준편차 2학년 학생 수
81.5 78.6 16.4 347
  • 정규분포를 알고 가야한다.
    정규분포
  • 표준정규분포는 정규분포에서 평균이 0 표준편차가 1인 조건이 추가된다
    표준정규분포
    평균에 가장 많은 수가 몰려있고 평균을 기점으로 좌우 대칭이고 서서히 분포가 낮아지는 종모양이다.
  • z값을 구하자
    점수에서 평균을 빼고 그것을 표준 편차로 나누면 z이다
    z = (81.5 - 78.6) / 16.4 = 0.1768
  • z에 대응하는 값을 정규분포표에서 찾기
    표준정규분포표
    음수라면 절대값을 취한다
    0.1768이므로 반올림해서 0.18로 하겠다
    대응값 : 0.0714 를 찾았다
  • 등수구하기
    대응값(면적)을 평균이 아닌 오른쪽 면적으로 바꾸어주고 전체 인원만큼 곱해야한다
    z가 양수라면 0.5-(대응값)
    z가 음수라면 대응값+0.5
    0.18은 양수이므로 0.5 - 0714 = 0.4286
    0.4286에 전체 학생수를 곱한다
    0.43 * 347 = 148.724
    149등이 추정 등수이다.
    참고링크

몬테카를로 시뮬레이션

몬테카를로 방법

  • 몬테카를로 카지노에서 따온 이름
  • 무작위 추출된 난수를 이용하여 함수의 값을 계산하는 통계학의 방법
  • 어느정도 오차는 존재
  • 인공지능에서 많이쓰임
    • 바둑 AI
    • 체스 딥블루

몬테카를로 시뮬레이션

  • 불확실성을 갖는 정보로 결론을 내리기 어려운 경우, 컴퓨터의 장점인 난수를 반복적으로 생성 적용시켜 근사적으로 답을 찾아내는 방법
    • EX) 원주율을 찾는 방법
  • 어떤 문제에 대해 해를 무수히 많은 시도를 통해 얻어진 확률을 기반으로 하는 계산법
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import random

n = 1000000
count = 0

for i in range(n):
# x,y를 무작위로 0~1 사이의 값으로 결정
x = random.uniform(0,1)
y = random.uniform(0,1)

# 사분원 내부에 발생하는 경우수
if (x**2 + y**2) <= 1 : count += 1

# 백만번 시도 중 사분원 내부일 경우에 대한 확률
# 사분원의 넓이이므로 일르 4배 곱하여 n 계산
print('phi', 4*count/n)

원주율

엑셀에서 만들어 보기

문제
결과

Excel을 분석도구를 활요한 예제 - t검정, F검정, 이동평균

t검정

  • 데이터분석 -> t-검정:쌍제비교
    t검정
    -결과
    결과
  • 해석
    • P가 0.05 이상인지 아닌지로 분석법을 채택할지 안할지 선택할 수 있음

F검정

  • 데이터분석 -> F-검정:분산에 대한 두 집단
    F검정
    -결과
    결과
  • 해석
    • P가 0.05 이상인지 아닌지로 분석법을 채택할지 안할지 선택할 수 있음

이동평균법

  • 데이터분석 -> 이동 평균법
    이동평균법
API API오용 Anaconda Beacon Bluetooth CRUD분석 Camera ChatBot DB관련신기술 DB관리기능 DB서버 DB표준화 ER다이어그램 ER모델 ETL Flask HW관련신기술 IDE도구 IP IoT Machine_Translation NLP배경 ORM프레임워크 Package Recurrent Neural Network SDLC SW개발방법론 SW개발방법론선정 SW개발보안정책 SW개발표준 SW관련신기술 Sequence_Tagging ShellScript TCP_UDP Vector WordCloud c 자료형 class embedding konlpy python python 자료형 가설검증 개발환경구축 객체지향프로그래밍언어 관계데이터베이스모델 관계데이터언어 국제표준제품품질특성 네트워크7계층 네트워크관련신기술 네트워크장비 네트워크침해공격용어 논리데이터모델개요 논리데이터모델품질검증 논리적데이터모델링 논문 단위모듈구현 단위모듈테스트 데이터검증 데이터모델개념 데이터베이스무결성 데이터베이스백업 데이터베이스암호화 데이터베이스용량설계 데이터베이스이중화구성 데이터베이스정규화 데이터분석 데이터분석 - 순열 - 조합 데이터분석 - 정규분포 데이터분석 - 통계기초 데이터사이언스개념 데이터입출력 데이터전환수행계획 데이터정제 데이터조작프로시저작성 데이터조작프로시저최적화 데이터조작프로시저테스트 데이터지역화 데이터타입 데이터표준확인 데이터품질분석 라이브러리 로그분석 메모리관리 모델화 몬테카를로 물리데이터모델설계 물리데이터모델품질기준 물리데이터저장소구성 물리요소조사분석 반정규화 배치프로그램 변수 보안기능 보안솔루션 보안아키텍처 보안취약성식별 분산데이터베이스 분산분석 비용산정모델 빌드자동화도구 사용자정의함수 상관분석 서버개발프레임워크 서버인증 서버장비운영 서버접근통제 서비스공격유형 선언형언어 세션통제 소스코드인스펙션 소프트스킬 소프트웨어개발프레임워크 소프트웨어버전관리도구 소프트웨어연계테스트 슈퍼디엠지 스크립트언어 시스템카탈로그와뷰 암호알고리즘 애플리케이션모니터링도구 애플리케이션배포도구 애플리케이션성능개선 애플리케이션테스트결과분석 애플리케이션테스트시나리오작성 애플리케이션테스트케이스작성 애플리케이션통합테스트수행 애플리케이션패키징 연산자 예외처리 오답노트 오류데이터측정 오류처리 오류처리확인및보고서작성 요구공학방법론 운영체제 웹서버 이벤트 인터넷구성의개념 인터페이스구현검증 인터페이스기능확인 인터페이스보안 입력데이터검증및표현 자료구조 자연어처리 재사용 절차적프로그래밍언어 정보보안침해공격용어 정보처리기사 제품소프트웨어매뉴얼작성 집계성DCL작성 체크리스트 초기데이터구축 취약점분석 칼럼속성 캡슐화 코드오류 클러스터링 키종류 테일러링기준 트랜잭션인터페이스 트리거 파일처리기술 파티셔닝 패키지 포트포워딩 프로세스스케줄링 프로토타입 한국어임베딩 핵심정리 현업도구 형상관리도구 환경변수 회귀분석
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×