pandas 기초통계(hypothesis, t-test, p-value, confidence)

250x250

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

코딩일기

pandas 기초통계(hypothesis, t-test, p-value, confidence) 본문

Code/머신러닝(ML)

pandas 기초통계(hypothesis, t-test, p-value, confidence)

daje 2021. 1. 5. 13:14

728x90

안녕하세요. 다제입니다.

오늘 pandas 기초통계에 대해서 알아보도록 하겠습니다.

오늘 글의 흐름은

①가설검정 흐름, ②용어별 개념에 대해서 알아보도록 하겠습니다.

<가설검정 흐름도>

1) 가설 설정

2) t-test값 구하기

3) t-test값, p-value 구하기

4) 95%의 신뢰도(confidence = 1 - p-value)에 드는지 확인

<용어의 개념>

1) hypothesis : 테스트할 수 있는 아이디어

2) t-test

-. 정의 : a와 b그룹 사이의 차이를 나타내는 지표

-. 의미 : t-test ↑ -> 그룹 간의 차이 ↑ -> 두 그룹 간의 유사성 ↓

-. 종류

* 독립된 두 그룹 간의 비교

* 동일한 그룹인데 시간대를 다르게 하는 비교

* 이미 알려진 평균(또는 내가 임의로 설정한 평균)으로 단일 그룹의 평균 비교

3) p-value

-. 정의

* (귀무)가설이 참일 (우연한)가능성에 대한 확률

* 일반적인 p-value 기준 : 0.05 ( 5% )

※ 귀무가설 : 모든 노력이 허무하게 돌아가게하는 가설

-. 의미 : p-value ↓ -> (귀무)가설 틀렸을 확률 ↑

-. ex)

* A=B 라는 가설을 세웠다고 가정하자

* p-value가 0.05를 넘는다면 귀무가설이 참일 가능성에 대한 확률이 높다고 추측함

* 그래서 A = B일 수도 있다고 함 ( 확률이기 때문에 이렇게 표현함 )

* 만약 p-value가 0.00005이라면 A ≠ B일 확률이 높다고 추측함

* 그래서 A ≠ B일 수도 있다고 함 ( 확률이기 때문에 이렇게 표현함 )

4) confidence(신뢰도)

-. 정의 : p-value에 속하지 않을 확률

* 일반적인 신로도 기준 : 0.95 or 0.99 ( 95% or 99% )

-. 의미 : 귀무가설이 맞을 확률

그렇다면 이걸 코드로는 어떻게 작성을 할까요?

우리가 주목해야할 값은 p-value입니다.

실제 코드에서 p-value를 구하는 건 무척 간단하지만, 값을 해석하는게 처음에는 어려울 수 있습니다.

나무들에 대한 각 마을별 데이터가 있습니다.

반대의 경우라면, 즉, p-value가 0.0002라면 저희가 가설이 틀렸을 수도 있을 확률이 매우 높다는 걸 의미합니다.

이처럼 말장난이 매우 심한 것처럼 느껴지실텐데요.

꼭 많은 문제를 푸셔서 익숙해지시길 바랄게요~ 뒤에서 엄청 많이 쓰이거든요!

728x90

저작자표시

'Code > 머신러닝(ML)' 카테고리의 다른 글

[Datascience] 프로그래밍을 위한 기초통계2(feat. Univariate analysis, skewness) (0)	2021.01.10
[Datascience] 프로그래밍을 위한 기초통계1(feat. pandas, ttest) (0)	2021.01.10
[Datascience] 프로그래밍을 위한 기초통계(feat. pandas, 베이즈정리) (0)	2021.01.09
코알못을 위한 pandas 뽀개기5(Feat. NaN, Na, None 차이) (0)	2021.01.04
코알못을 위한 pandas 뽀개기1(Feat. pandas doc) (0)	2020.12.31

'Code/머신러닝(ML)' Related Articles

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

코딩일기

코딩일기

pandas 기초통계(hypothesis, t-test, p-value, confidence) 본문

pandas 기초통계(hypothesis, t-test, p-value, confidence)

<가설검정 흐름도>

<용어의 개념>

1) hypothesis : 테스트할 수 있는 아이디어

2) t-test

3) p-value

4) confidence(신뢰도)

'Code > 머신러닝(ML)' 카테고리의 다른 글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역