일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 넓이 우선 순회
- 벌크업데이트
- 중복성검사
- simple-regression model
- ChatGPT
- 파이썬
- chirpy
- list
- re.compile
- Python
- de
- ruby error
- 다중 선형 회귀
- Selenium
- 정규표현식 조건문
- 깃헙 블로그 오류
- 정규표현식
- 평가지표
- beatuifulsoup4
- 통계학
- 비용이슈
- 병렬처리
- AWS
- 지연평가
- re
- LinkedLists
- GPT-4
- githubblog
- reverse_lazy
- 2023운전면허
- Today
- Total
용사냥꾼69
파이썬 pandas 데이터 프레임으로 데이터 불러오기 본문
read_csv()로 데이터 불러오기
import pandas as pd
df = pd.read_csv('불러올 데이터셋.csv')
read_csv()의 매개인자로는 https와 같은 URL을 보낼 수도 있다.
CSV는 Comma Separated Value의 약자로 ,(콤마) 로 분리된 데이터를 말한다.
17;60;0.998;3.16;0.58 와 같이 만약 데이터가 ' ; ' 으로 분리되어 있을 경우
df = pd.read_csv('불러올 데이터셋.csv', sep=';')
sep=';' 를 추가해주면 된다.
sep의 경우엔 정규 표현식이 적용되며 다양하게 활용될 수 있다.
read_excel()으로 엑셀 데이터 불러오기
read_excel(filename,
sheet_name = '서울',
header = None,
names = ['일시','평균','최저','최고'],
index_col = None,
usecols = "C:F",
dtype = {'일시':str, '평균':float, '최저':float, '최고':float},
skiprows = 32,
nrows = 28,
na_values = 'nan',
thousands = ',')
sheet_name: 기본값 0. 시트의 인덱스 번호(int) 또는 시트의 이름(문자열)이 들어감. 리스트 값을 넣을 수 있음. None 설정 시 모든 시트 선택
header: 어느 행(row)에 열(column)의 이름이 있는지 지정. 기본 값은 0으로 첫 번째 줄. None 설정 시 헤더가 없는 것으로 설정되어 첫 번째 줄부터 바로 데이터로 받아옴
names: header가 None일 경우 열(column)의 이름을 지정해줌
index_col: 각 행(row)의 이름이 위치한 열(column)을 지정. 기본값은 None
usecols: 기본값은 None으로 모든 열을 다 불러옴. “A:E”, “A,C,F:H” 와 같이 원하는 열을 선택해 불러올 수 있음
dtype: 각 열의 데이터 타입을 지정 가능
skiprows: 엑셀을 읽을 때 첫줄(0)으로 부터 몇 줄을 건너뛸 지 지정
nrow: 몇 줄을 읽을 지 지정
na_values: 값이 없는 경우 어떤 str 등으로 넣을 지 지정
thousands: 돈과 같이 천단위로 쉼표(,)로 구분된 문자를 변환하기 위해 천단위의 구분자가 무엇인지 지정
# python 3.9
import pandas as pd
# 읽어올 엑셀 파일 지정
filename = 'testdata.xlsx'
# 엑셀 파일 읽어 오기
df = pd.read_excel(filename, engine='openpyxl')
print(df)
'파이썬 > 파이썬-AI 기본' 카테고리의 다른 글
파이썬으로 문자열 치환하기, 문자 하나만 바꾸는 경우 (0) | 2023.02.15 |
---|---|
List 내의 자료를 검색하고 지우기 (0) | 2023.02.15 |
파이썬 신뢰구간 구하기, Python confidence Interval (0) | 2023.02.14 |
파이썬에서 소수점 아래를 버리는 방법(내림)에 대해서 (1) | 2022.10.15 |
파이썬 Lambda 함수의 가변인자(*x, *매개변수) 사용법 (0) | 2022.10.15 |