일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- selenium
- 기초통계
- pandas
- 부트캠프
- 파이썬
- 딥러닝
- 매일매일
- 꾸준히
- 선형회귀
- 2021
- yolo
- 코드스테이츠
- Ai
- bootcamp
- Codestates
- 자료구조
- 빅데이터
- python
- JavaScript
- 노마드코더
- 주간보고
- 성실히
- SQL
- 재미져
- MYSQL
- 리뷰
- leetcode
- 열심히
- 독서
- 코딩테스트
- Today
- Total
코딩일기
pandas 기초통계(hypothesis, t-test, p-value, confidence) 본문
안녕하세요. 다제입니다.
오늘 pandas 기초통계에 대해서 알아보도록 하겠습니다.
오늘 글의 흐름은
①가설검정 흐름, ②용어별 개념에 대해서 알아보도록 하겠습니다.
<가설검정 흐름도>
1) 가설 설정
2) t-test값 구하기
3) t-test값, p-value 구하기
4) 95%의 신뢰도(confidence = 1 - p-value)에 드는지 확인
<용어의 개념>
1) hypothesis : 테스트할 수 있는 아이디어
2) t-test
-. 정의 : a와 b그룹 사이의 차이를 나타내는 지표
-. 의미 : t-test ↑ -> 그룹 간의 차이 ↑ -> 두 그룹 간의 유사성 ↓
-. 종류
* 독립된 두 그룹 간의 비교
* 동일한 그룹인데 시간대를 다르게 하는 비교
* 이미 알려진 평균(또는 내가 임의로 설정한 평균)으로 단일 그룹의 평균 비교
3) p-value
-. 정의
* (귀무)가설이 참일 (우연한)가능성에 대한 확률
* 일반적인 p-value 기준 : 0.05 ( 5% )
※ 귀무가설 : 모든 노력이 허무하게 돌아가게하는 가설
-. 의미 : p-value ↓ -> (귀무)가설 틀렸을 확률 ↑
-. ex)
* A=B 라는 가설을 세웠다고 가정하자
* p-value가 0.05를 넘는다면 귀무가설이 참일 가능성에 대한 확률이 높다고 추측함
* 그래서 A = B일 수도 있다고 함 ( 확률이기 때문에 이렇게 표현함 )
* 만약 p-value가 0.00005이라면 A ≠ B일 확률이 높다고 추측함
* 그래서 A ≠ B일 수도 있다고 함 ( 확률이기 때문에 이렇게 표현함 )
4) confidence(신뢰도)
-. 정의 : p-value에 속하지 않을 확률
* 일반적인 신로도 기준 : 0.95 or 0.99 ( 95% or 99% )
-. 의미 : 귀무가설이 맞을 확률
그렇다면 이걸 코드로는 어떻게 작성을 할까요?
우리가 주목해야할 값은 p-value입니다.
실제 코드에서 p-value를 구하는 건 무척 간단하지만, 값을 해석하는게 처음에는 어려울 수 있습니다.
나무들에 대한 각 마을별 데이터가 있습니다.
반대의 경우라면, 즉, p-value가 0.0002라면 저희가 가설이 틀렸을 수도 있을 확률이 매우 높다는 걸 의미합니다.
이처럼 말장난이 매우 심한 것처럼 느껴지실텐데요.
꼭 많은 문제를 푸셔서 익숙해지시길 바랄게요~ 뒤에서 엄청 많이 쓰이거든요!
'Code > 머신러닝(ML)' 카테고리의 다른 글
[Datascience] 프로그래밍을 위한 기초통계2(feat. Univariate analysis, skewness) (0) | 2021.01.10 |
---|---|
[Datascience] 프로그래밍을 위한 기초통계1(feat. pandas, ttest) (0) | 2021.01.10 |
[Datascience] 프로그래밍을 위한 기초통계(feat. pandas, 베이즈정리) (0) | 2021.01.09 |
코알못을 위한 pandas 뽀개기5(Feat. NaN, Na, None 차이) (0) | 2021.01.04 |
코알못을 위한 pandas 뽀개기1(Feat. pandas doc) (0) | 2020.12.31 |