파이썬에서 생성 날짜별로 정렬 된 디렉토리 목록을 어떻게 얻습니까?


129

디렉토리에있는 모든 파일 목록을 날짜별로 정렬하는 가장 좋은 방법은 무엇입니까? 수정 됨], Windows 컴퓨터에서 Python을 사용합니까?

답변:


79

업데이트 : dirpathPython 3에서 수정 날짜별로 항목 을 정렬 합니다.

import os
from pathlib import Path

paths = sorted(Path(dirpath).iterdir(), key=os.path.getmtime)

( 더 큰 가시성을 위해 @Pygirl의 대답을 여기에 넣으 십시오)

filenames 목록이 이미있는 경우 filesWindows에서 작성 시간을 기준 으로 해당 파일 을 제자리에 정렬하려면 다음을 수행하십시오.

files.sort(key=os.path.getctime)

예를 들어 @ Jay 's answer에glob 표시된대로 사용하여 얻을 수있는 파일 목록입니다 .


오래된 대답은 다음 버전의 자세한 더의 @Greg Hewgill의 대답 . 질문 요구 사항에 가장 적합합니다. 생성 날짜와 수정 날짜를 구분합니다 (적어도 Windows에서는).

#!/usr/bin/env python
from stat import S_ISREG, ST_CTIME, ST_MODE
import os, sys, time

# path to the directory (relative or absolute)
dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'

# get all entries in the directory w/ stats
entries = (os.path.join(dirpath, fn) for fn in os.listdir(dirpath))
entries = ((os.stat(path), path) for path in entries)

# leave only regular files, insert creation date
entries = ((stat[ST_CTIME], path)
           for stat, path in entries if S_ISREG(stat[ST_MODE]))
#NOTE: on Windows `ST_CTIME` is a creation date 
#  but on Unix it could be something else
#NOTE: use `ST_MTIME` to sort by a modification date

for cdate, path in sorted(entries):
    print time.ctime(cdate), os.path.basename(path)

예:

$ python stat_creation_date.py
Thu Feb 11 13:31:07 2009 stat_creation_date.py

1
이것은 완벽하게 작동했습니다. 두 디렉토리가 서로 cdate 비교하려고합니다. 두 상자 사이의 초를 비교할 수있는 방법이 있습니까?
Federer

@malcmcmul : cdate는 Epoch 이후의 초 수 부동 소수점 수입니다.
jfs

4
이것은 작동하지만 가장 간결한 솔루션은 stackoverflow.com/a/4500607/68534
jmoz

@jmoz : 당신은 같은 뜻 . 연결 한 솔루션이 잘못되었습니다. 일반 파일을 필터링하지 않습니다. 참고 : 내 솔루션 stat은 dir.entry 당 한 번 호출합니다 .
jfs

용서하십시오, Sabastian이 제공하는 링크는 훨씬 간결합니다! 감사합니다.
jmoz

148

디렉토리에서 마지막으로 업데이트 된 파일을 확인하기 위해 Python 스크립트에 대해 과거 에이 작업을 수행했습니다.

import glob
import os

search_dir = "/mydir/"
# remove anything from the list that is not a file (directories, symlinks)
# thanks to J.F. Sebastion for pointing out that the requirement was a list 
# of files (presumably not including directories)  
files = list(filter(os.path.isfile, glob.glob(search_dir + "*")))
files.sort(key=lambda x: os.path.getmtime(x))

파일 mtime을 기반으로 원하는 것을 수행해야합니다.

편집 : 원한다면 glob.glob () 대신 os.listdir ()을 사용할 수도 있습니다. 원래 코드에서 glob을 사용한 이유는 glob을 사용하여 특정 세트가있는 파일 만 검색하려고했기 때문입니다. glob ()가 더 적합한 파일 확장자입니다. listdir을 사용하는 방법은 다음과 같습니다.

import os

search_dir = "/mydir/"
os.chdir(search_dir)
files = filter(os.path.isfile, os.listdir(search_dir))
files = [os.path.join(search_dir, f) for f in files] # add path to each file
files.sort(key=lambda x: os.path.getmtime(x))

glob ()는 좋지만 마침표로 시작하는 파일을 건너 뜁니다. * nix 시스템은 이러한 파일을 숨김으로 처리하므로 (목록에서 생략) Windows에서는 일반 파일입니다.
efotinis

이 솔루션은 목록에서 dirs를 제외하지 않습니다.
Constantin

os.listdir 솔루션에 os.path.join이 누락되었습니다. files.sort (lambda x, y : cmp (os.path.getmtime (os.path.join (search_dir, x)), os.path.getmtime (os .path.join (search_dir, y))))
Peter Hoffmann

files.sort(key=lambda fn: os.path.getmtime(os.path.join(search_dir, fn)))
jfs

22
단순한는 files.sort(key=os.path.getmtime)(없이 작동 lambda).
jfs

31

os.path.getmtime에포크 이후의 시간 (초)을 제공 하는 기능이 있으며보다 빠릅니다 os.stat.

import os 

os.chdir(directory)
sorted(filter(os.path.isfile, os.listdir('.')), key=os.path.getmtime)

23

내 버전은 다음과 같습니다.

def getfiles(dirpath):
    a = [s for s in os.listdir(dirpath)
         if os.path.isfile(os.path.join(dirpath, s))]
    a.sort(key=lambda s: os.path.getmtime(os.path.join(dirpath, s)))
    return a

먼저 파일 이름 목록을 작성합니다. isfile ()은 디렉토리를 건너 뛰는 데 사용됩니다. 디렉토리를 포함해야하는 경우 생략 할 수 있습니다. 그런 다음 수정 날짜를 키로 사용하여 목록을 적절하게 정렬합니다.


가장 오래된 것부터 가장 오래된 것까지 정렬했습니다. 5 개의 최신 파일을 원할 때 다음을 수행해야했습니다.a[-5:]
Daniel Butler

20

하나의 라이너가 있습니다.

import os
import time
from pprint import pprint

pprint([(x[0], time.ctime(x[1].st_ctime)) for x in sorted([(fn, os.stat(fn)) for fn in os.listdir(".")], key = lambda x: x[1].st_ctime)])

그러면 os.listdir ()을 호출하여 파일 이름 목록을 가져온 다음 각 파일마다 os.stat ()를 호출하여 작성 시간을 얻은 다음 작성 시간을 기준으로 정렬합니다.

이 메소드는 각 파일에 대해 os.stat ()를 한 번만 호출하므로 정렬에서 각 비교에 대해 호출하는 것보다 효율적입니다.


그것은 작업을 해결하지는 않지만 거의 파이썬이 아닙니다 (면책 조항 : 코드를 테스트하지 않았습니다).
Adriano Varoli Piazza

이 솔루션은 목록에서 dirs를 제외하지 않습니다.
Constantin

@Constantin : 그것은 사실이지만, 만약 stat.S_ISREG (x)]가 그것을 처리 할 수 ​​있다면 빠르다.
Greg Hewgill

16

디렉토리를 변경하지 않고 :

import os    

path = '/path/to/files/'
name_list = os.listdir(path)
full_list = [os.path.join(path,i) for i in name_list]
time_sorted_list = sorted(full_list, key=os.path.getmtime)

print time_sorted_list

# if you want just the filenames sorted, simply remove the dir from each
sorted_filename_list = [ os.path.basename(i) for i in time_sorted_list]
print sorted_filename_list

12

파이썬 3.5 이상

from pathlib import Path
sorted(Path('.').iterdir(), key=lambda f: f.stat().st_mtime)

3
작성 날짜는 f.stat().st_ctime대신 사용하십시오.
alanjds

11

날짜 순서대로 특정 확장자를 가진 파일을 읽으려면 필터없이 glob를 사용하는 대답이 있습니다 (Python 3).

dataset_path='/mydir/'   
files = glob.glob(dataset_path+"/morepath/*.extension")   
files.sort(key=os.path.getmtime)

5
# *** the shortest and best way ***
# getmtime --> sort by modified time
# getctime --> sort by created time

import glob,os

lst_files = glob.glob("*.txt")
lst_files.sort(key=os.path.getmtime)
print("\n".join(lst_files))

상황을 알려주십시오
Claire

"최고"는 주관적입니다. 왜 그것이 최선의 방법이라고 생각하는지 설명하면 답이 더 나을 것입니다.
Bryan Oakley

"최고"를 원한다면 확실히 속도가 느리므로 글로브를 사용하지 마십시오.
user136036

4
sorted(filter(os.path.isfile, os.listdir('.')), 
    key=lambda p: os.stat(p).st_mtime)

os.walk('.').next()[-1]로 필터링 하는 대신 사용할 수 os.path.isfile있지만 목록에 죽은 심볼릭 링크가 남아 os.stat실패합니다.


4
from pathlib import Path
import os

sorted(Path('./').iterdir(), key=lambda t: t.stat().st_mtime)

또는

sorted(Path('./').iterdir(), key=os.path.getmtime)

또는

sorted(os.scandir('./'), key=lambda t: t.stat().st_mtime)

여기서 m 시간은 수정 된 시간입니다.


1

이것은 배우기위한 기본 단계입니다.

import os, stat, sys
import time

dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'

listdir = os.listdir(dirpath)

for i in listdir:
    os.chdir(dirpath)
    data_001 = os.path.realpath(i)
    listdir_stat1 = os.stat(data_001)
    listdir_stat2 = ((os.stat(data_001), data_001))
    print time.ctime(listdir_stat1.st_ctime), data_001

1

파일이 존재하지 않는 파일에 대한 심볼릭 링크 인 경우 Alex Coventry의 답변에서 예외가 발생합니다. 다음 코드는 해당 답변을 수정합니다.

import time
import datetime
sorted(filter(os.path.isfile, os.listdir('.')), 
    key=lambda p: os.path.exists(p) and os.stat(p).st_mtime or time.mktime(datetime.now().timetuple())

파일이 존재하지 않으면 now ()가 사용되고 심볼릭 링크는 목록의 맨 끝에갑니다.


0

다음은 확장을 찾고 정렬 옵션을 제공하는 간단한 몇 줄입니다.

def get_sorted_files(src_dir, regex_ext='*', sort_reverse=False): 
    files_to_evaluate = [os.path.join(src_dir, f) for f in os.listdir(src_dir) if re.search(r'.*\.({})$'.format(regex_ext), f)]
    files_to_evaluate.sort(key=os.path.getmtime, reverse=sort_reverse)
    return files_to_evaluate

0

완전성 os.scandir(2 배 이상 빠름 pathlib) :

import os
sorted(os.scandir('/tmp/test'), key=lambda d: d.stat().st_mtime)

0

이것은 내 버전이었다 :

import os

folder_path = r'D:\Movies\extra\new\dramas' # your path
os.chdir(folder_path) # make the path active
x = sorted(os.listdir(), key=os.path.getctime)  # sorted using creation time

folder = 0

for folder in range(len(x)):
    print(x[folder]) # print all the foldername inside the folder_path
    folder = +1

내 코드에서 파일은 가장 오래된 것부터 가장 오래된 것으로 정렬됩니다. 최신 파일 이름 또는 폴더를 먼저 얻으려면 파일 목록에 reverse = True를 추가해야합니다 (필자의 경우 x). 따라서 x = sorted (os.listdir (), key = os.path.getctime, reverse = True)
haqrafiul

-6

셸 명령을 사용해야 할 수도 있습니다. 유닉스 / 리눅스에서 정렬 된 파이프 찾기는 아마도 당신이 원하는 것을 할 수있을 것입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.