리스트의리스트를 만들려고합니다. 빈리스트로 시작해야합니다
list_of_lists = []
다음으로 파일 내용을 한 줄씩 읽습니다.
with open('data') as f:
for line in f:
inner_list = [elt.strip() for elt in line.split(',')]
# in alternative, if you need to use the file content as numbers
# inner_list = [int(elt.strip()) for elt in line.split(',')]
list_of_lists.append(inner_list)
일반적인 사용 사례는 원주 데이터이지만, 스토리지 우리의 단위는 당신이 할 수 있도록 우리는 하나 하나를 읽고 그 파일의 행입니다 전치
목록의 목록을. 이것은 다음 관용구로 수행 할 수 있습니다
by_cols = zip(*list_of_lists)
다른 일반적인 용도는 각 열에 이름을 지정하는 것입니다
col_names = ('apples sold', 'pears sold', 'apples revenue', 'pears revenue')
by_names = {}
for i, col_name in enumerate(col_names):
by_names[col_name] = by_cols[i]
동종 데이터 항목에서 작업 할 수 있도록
mean_apple_prices = [money/fruits for money, fruits in
zip(by_names['apples revenue'], by_names['apples_sold'])]
내가 작성한 대부분의 내용 csv
은 표준 라이브러리에서 모듈 을 사용하여 속도를 높일 수 있습니다 . 또 다른 타사 모듈은 pandas
일반적인 데이터 분석의 여러 측면을 자동화 할 수 있지만 여러 가지 종속성이 있습니다.
업데이트 Python 2 zip(*list_of_lists)
에서는 다른 (전치 된) 목록의 목록이 반환 되지만 Python 3에서는 상황이 변경되어 아래 첨자가 불가능한 zip 객체 가 zip(*list_of_lists)
반환 됩니다.
인덱스 액세스 가 필요한 경우 사용할 수 있습니다
by_cols = list(zip(*list_of_lists))
두 버전의 Python에서 목록 목록을 제공합니다.
반면에 인덱스 액세스 가 필요하지 않고 열 이름으로 인덱싱 된 사전을 작성하는 것이라면 zip 객체는 괜찮습니다 ...
file = open('some_data.csv')
names = get_names(next(file))
columns = zip(*((x.strip() for x in line.split(',')) for line in file)))
d = {}
for name, column in zip(names, columns): d[name] = column