Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Selenium
- re.compile
- GPT-4
- Python
- 병렬처리
- 깃헙 블로그 오류
- re
- chirpy
- 정규표현식 조건문
- reverse_lazy
- de
- beatuifulsoup4
- LinkedLists
- 지연평가
- githubblog
- 벌크업데이트
- ruby error
- 2023운전면허
- 통계학
- AWS
- ChatGPT
- 파이썬
- 중복성검사
- 다중 선형 회귀
- 정규표현식
- 비용이슈
- list
- simple-regression model
- 평가지표
- 넓이 우선 순회
Archives
- Today
- Total
용사냥꾼69
파이썬 신뢰구간 구하기, Python confidence Interval 본문
728x90
import numpy as np
import math
def confidence_95(i):
upper_cut = i.mean() + (1.96 * (np.std(inp) / math.sqrt(len(inp))))
lower_cut = inp.mean() - (1.96 * (np.std(inp) / math.sqrt(len(inp))))
return lower_cut, upper_cut
함수를 정의해서 직접 신뢰구간 95% 구간 공식을 통해 출력
numpy의 np.std()는 표준편차를 구하는 함수.
math.sqrt()는 받은 인자의 제곱근을 리턴한다.
import numpy as np
import scipy.stats
def mean_confidence_interval(data, confidence=0.95):
a = 1.0 * np.array(data)
n = len(a)
m, se = np.mean(a), scipy.stats.sem(a)
h = se * scipy.stats.t.ppf((1 + confidence) / 2., n-1)
return m, m-h, m+h
직접 함수를 정의해서 신뢰구간을 리턴하는 방식2
scipy.stats.sem 함수는 평균의 표준 오차를 구해준다.
scipy.stats.t.ppf 함수는 퍼센트 포인트 함수로, 누적분포함수의 역함수이다.
0.975%에 해당하는 위치의 Z값(1.96)을 구해준다.
import numpy as np, scipy.stats as st
st.t.interval(0.95, len(a)-1, loc=np.mean(a), scale=st.sem(a))
scipy.stats.t.interval을 사용하는 조금 더 간단한 방식
scipy.stats.t.interval() 의 경우 매개변수로
신뢰구간 비율, 자유도(샘플사이즈 -1), 평균, 평균의 표준오차 를 받는다.
import statsmodels.stats.api as sms
sms.DescrStatsW(a).tconfint_mean()
가장 간단하다.
sms.DescrStatsW(Data).tconfint_mean()를 사용하는데
매개변수로 confidence를 받는데, 기본값으로는 0.05가 들어있다.
'파이썬 > 파이썬-AI 기본' 카테고리의 다른 글
List 내의 자료를 검색하고 지우기 (0) | 2023.02.15 |
---|---|
파이썬 pandas 데이터 프레임으로 데이터 불러오기 (0) | 2023.02.14 |
파이썬에서 소수점 아래를 버리는 방법(내림)에 대해서 (1) | 2022.10.15 |
파이썬 Lambda 함수의 가변인자(*x, *매개변수) 사용법 (0) | 2022.10.15 |
List와 Numpy array의 차이점 (1) | 2022.10.15 |
Comments