일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 피파온라인 API
- 데벨챌
- Roberta
- Tableu
- 개체명 인식
- 옵티마이저
- BERTopic
- 구글 스토어 리뷰
- 토픽 모델링
- 포아송분포
- geocoding
- 자연어 모델
- LDA
- 데이터리안
- 원신
- 데이터넥스트레벨챌린지
- 조축회
- 다항분포
- KeyBert
- 블루아카이브 토픽모델링
- 문맥을 반영한 토픽모델링
- 붕괴 스타레일
- 클래스 분류
- CTM
- 트위치
- Optimizer
- 블루 아카이브
- SBERT
- 코사인 유사도
- NLP
- Today
- Total
분석하고싶은코코
기초 통계학(Basic Statistics) - 통계학과 모집단, 표본 본문
1. 통계학이란..?
통계학이란 주어진 문장(주장)에 대해서 데이터를 통해 맞는지 아닌지를 다루는 학문이다.
Ex) 동전 돌리기 -> 500원 동전을 돌리면 70%확률로 앞면이 나온다(그냥 도전 500원 동전 돌리기 노가다 실험!!)
2. 모집단(population)과 표본
모집단(Population)
주장(연구) 대상이 있을때 모든 개체의 집합 -> 모집단
모집단은 모든 개체의 집합으로 너무 크다.. 예를들어 선거에서 유권자의 지지율을 알아보려면 대한민국 모든 유권자들에게 정보를 가져오면 가장 좋지다. 이 방법을 전수조사라고 한다. 그런데 대통령, 국회의원, 지방선거 매번 전수조사하려면 예산이 어마어마해서 매번 할 수가 없다. 그렇다면 어떻게 해야할까..? 여기서 나오는 개념이 표본(Sample)이다.
표본(Sample)
모집단으로부터 선택된 일부의 개체. 그런데 여기서 생각해봐야할 부분은 이렇게 선택된 일부 개체인 표본이 모집단을 대표할 수 있느냐 없느냐가 중요한 문제이다. 예를들어보면 대한민국에서 어느 투표를하던 경상도와 전라도 두 곳의 정치성향이 크게 갈린다.(이 작성글을 쓸때는 많이 사라지긴했지만 아직도 남아있다.) 그런데 앞서 모집단 예시에서 유권자의 모집단에서 경상도 지역에서 표본을 뽑는다면 이 표본이 대한민국의 유권자들을 대표할 수 있는가?라는 질문에 답할수가 없다.
그렇다면 어떻게 표본을 추출해야하는가? -> 확률표본추출법(모집단을 대표할 수 있는 표본 추출법)
그럼에도 표본은 불안정한 특성은 지울 수 없다. 이때문에 오차가 발생하고 오류를 범할 수 있다. 그래서 표본을 통해 확률을 통해 모집단을 추론하게 되는데 이를 통계적 추론이라고 한다.
'통계' 카테고리의 다른 글
기초 통계학 - 베르누이 실행, 이항 분포와 초기하 분포 (0) | 2023.09.21 |
---|---|
기초 통계학 - 확률변수와 기댓값 (0) | 2023.09.20 |
기초 통계학 - 확률(2) (0) | 2023.09.19 |
기초 통계학 - 확률(1) (0) | 2023.09.19 |
기초 통계 (0) | 2022.10.26 |