파일이 여러개로 나누어져있는 경우 파일을 한번에 불러오는 방법
## 해당 경로에 있는 .csv 파일명 리스트 가져오기
import os
path = './경로/'
file_list = os.listdir(path)
file_list_py = [file for file in file_list if file.endswith('.csv')] ## 파일명 끝이 .csv인 경우
위의 예시는 .csv 파일만 불러올 때
파일명이 xx로 시작하는 파일들을 불러올 때는 if문에 file.startswith('xx')
파일명에 xx가 포함된 파일들을 불러올때는 if문에 "xx" in file
파일명에 xx가 포함되지 않은 파일들을 불러올때는 if문에 "xx" not in file
해당 경로에 있는 모든 파일 리스트가 필요하면 마지막 줄 file_list_py 필요없이 file_list를 사용하면 됨
그리고 나서 for문을 이용하여 필요한 파일들을 하나씩 읽어 DataFrame으로 불러오면 됨
## csv 파일들을 DataFrame으로 불러와서 concat
df = pd.DataFrame()
for i in file_list_py:
data = pd.read_csv(path + i)
df = pd.concat([df,data])
df = df.reset_index(drop = True)
## json 파일들을 DataFrame으로 불러오기
import json
dict_list = []
for i in file_list_py:
for line in open((path+i),"r"):
dict_list.append(json.loads(line))
df = pd.DataFrame(dict_list)
반응형
'Study > Python' 카테고리의 다른 글
[Python] 반복문에서 변수 선언하는 법 (0) | 2021.11.17 |
---|---|
[Python] Jupyter notebook 셀 가로 폭 늘리기 (0) | 2021.02.18 |
[Python] 숫자 천 단위 구분 기호 (콤마) 출력하기 (0) | 2021.01.26 |
[PYTHON] 숫자 (문자열) 앞에 0 채우기 (0) | 2020.11.25 |