파이썬에서 파일 크기를 어떻게 확인할 수 있습니까?


757

Windows에서 Python 스크립트를 작성 중입니다. 파일 크기를 기준으로 무언가를하고 싶습니다. 예를 들어, 크기가 0보다 큰 경우 누군가에게 이메일을 보내거나 그렇지 않으면 계속해서 보냅니다.

파일 크기는 어떻게 확인합니까?


2
Path('./doc.txt').stat().st_size
보리스

현대 Python (v3.4 +) 답변에 감사합니다 @Boris :)
mab

답변:


734

에서 반환 한 객체st_size속성이 필요합니다 . (Python 3.4+)를 사용하여 얻을 수 있습니다 .os.statpathlib

>>> from pathlib import Path
>>> Path('somefile.txt').stat()
os.stat_result(st_mode=33188, st_ino=6419862, st_dev=16777220, st_nlink=1, st_uid=501, st_gid=20, st_size=1564, st_atime=1584299303, st_mtime=1584299400, st_ctime=1584299400)
>>> Path('somefile.txt').stat().st_size
1564

또는 사용 os.stat:

>>> import os
>>> os.stat('somefile.txt')
os.stat_result(st_mode=33188, st_ino=6419862, st_dev=16777220, st_nlink=1, st_uid=501, st_gid=20, st_size=1564, st_atime=1584299303, st_mtime=1584299400, st_ctime=1584299400)
>>> os.stat('somefile.txt').st_size
1564

출력은 바이트 단위입니다.


2
어떤 경우 든 값은 파일 시스템 블록 크기의 배수 (예 : 4096 바이트)로 전달 될 수 있습니다. 다행스럽게도 대신 바이트로 제공됩니다.
josch

1
@josch - 예, 이것은 당신이 곱 수있는 "디스크의 크기"에 대한, 좋은 stat_result.st_blocks블록 크기,하지만, 난 여전히 프로그래밍을 얻을 크로스 플랫폼하는 방법을 찾고 있어요 (하지 경유 tune2fs등)
토마스 Gandor

1097

사용 os.path.getsize:

>>> import os
>>> b = os.path.getsize("/path/isa_005.mp3")
>>> b
2071611

출력은 바이트 단위입니다.


124
참고 : 구현 os.path.getsize은 간단합니다return os.stat(filename).st_size
wim

따라서 os.stat (file) .st_size와 반대로 os.path.getsize를 사용하면 약간의 성능 손실이 있습니까?
wordsforthewise

5
@wordsforthewise 그것을 측정! 내 컴퓨터에서 ~ 150ns
Davidmh

@words 그래서 파일에 대한 다른 것들 (예 : 수정 시간, 파일 유형 등)을 얻으려면 이것이 더 큰 문제 os.stat입니다. 그렇다면 그 차이는 상당한 수의 마이크로 초로
이어질

파일이 생성 된 직후에 호출되면 0 @danben
alper

131

다른 답변은 실제 파일에 대해서는 작동하지만 "파일과 유사한 객체"에 작동하는 것이 필요한 경우 다음을 시도하십시오.

# f is a file-like object. 
f.seek(0, os.SEEK_END)
size = f.tell()

제한된 테스트에서 실제 파일과 StringIO에서 작동합니다. (Python 2.7.3.) "file-like object"API는 물론 엄격한 인터페이스는 아니지만 API 문서 는 파일과 같은 오브젝트가 seek()및 을 지원해야한다고 제안합니다 tell().

편집하다

이것의 또 다른 차이점은 파일을 읽을 권한이 없어도 파일 os.stat()을 작성할 수 있다는 stat()것입니다. 읽기 권한이 없으면 찾기 / tell 접근 방식이 작동하지 않습니다.

편집 2

Jonathon의 제안에서 편집증 버전이 있습니다. (위의 버전은 파일 끝에 파일 포인터를 남깁니다. 따라서 파일에서 읽으려고하면 0 바이트가 반환됩니다!)

# f is a file-like object. 
old_file_position = f.tell()
f.seek(0, os.SEEK_END)
size = f.tell()
f.seek(old_file_position, os.SEEK_SET)

8
import하지 않아도됩니다 os. 대신 f.seek(0, 2)0 바이트를 찾기 위해 쓰십시오 .
cdosborn

2
그리고 마지막 줄을 os사용하지 않으면 :f.seek(old_file_position, 0)
luckydonald

48
명명 된 변수 대신 정수 리터럴을 사용하면 코드를 유지 관리해야하는 사람을 괴롭 힙니다. import하지 않는 강력한 이유는 없습니다 os.
Mark E. Haase

솔루션 주셔서 감사합니다, 나는 구현하고 잘 작동합니다. 확인하기 위해 size출력이 바이트입니까?
Kedar.Aitawdekar

3
분명히 파이썬이 구현하는 방법에 따라 약간 위험합니다 #seek(). wiki.sei.cmu.edu/confluence/display/c/…
Autumnsault

72
import os


def convert_bytes(num):
    """
    this function will convert bytes to MB.... GB... etc
    """
    for x in ['bytes', 'KB', 'MB', 'GB', 'TB']:
        if num < 1024.0:
            return "%3.1f %s" % (num, x)
        num /= 1024.0


def file_size(file_path):
    """
    this function will return the file size
    """
    if os.path.isfile(file_path):
        file_info = os.stat(file_path)
        return convert_bytes(file_info.st_size)


# Lets check the file size of MS Paint exe 
# or you can use any file path
file_path = r"C:\Windows\System32\mspaint.exe"
print file_size(file_path)

결과:

6.1 MB

5
this function will convert bytes to MB.... GB... etc잘못된. 이 함수는 바이트를 MiB, GiB 등으로 변환합니다 . 이 게시물을 참조하십시오 .
moi

2
10 행 return f'{num:.1f} {x}'은 Python> = 3.5 로 변경할 수 있습니다 .
Matt M.

53

사용 pathlib( PyPI에서 사용 가능한 백 포트 또는 Python 3.4에 추가 ) :

from pathlib import Path
file = Path() / 'doc.txt'  # or Path('./doc.txt')
size = file.stat().st_size

이것은 실제로는 인터페이스 일뿐 os.stat이지만 사용 pathlib하면 다른 파일 관련 작업에 쉽게 액세스 할 수 있습니다.


18

다른 단위 bitshift로 변환하려는 경우 사용 하는 트릭 이 있습니다 bytes. 당신이 오른쪽 10으로 이동하면 기본적으로 순서대로 (다중) 이동합니다.

예: 5GB are 5368709120 bytes

print (5368709120 >> 10)  # 5242880 kilobytes (kB)
print (5368709120 >> 20 ) # 5120 megabytes (MB)
print (5368709120 >> 30 ) # 5 gigabytes (GB)

9
이것은 질문에 대답하지 않습니다. 문제는 사람이 소비 한 결과의 형식을 지정하는 것이 아니라 파일 크기를 찾는 것입니다.
Will Manley

1
이 숫자는 잘못되어 혼동됩니다. 5GB는 5e9 바이트입니다. 이것은 일종의 인간이 읽을 수있는 근사치입니까? 이런 식으로 어디를 사용하겠습니까?
Dre

1 비트 => 2 ... 2 비트 => 4 ... 3 비트 => 8 ... 4 비트 => 16 ... 5 비트 => 32 ... 6 비트 => 64 ... 7 비트 => 128 ... 8 비트 => 256 ... 9 비트 => 512 ... 10 비트 => 1024 ... 1024 바이트는 1kB ... => 20 -비트 => 1024 * 1024 = 1,048,576 바이트 (1024kB, 1MB ... => 30 비트 => 1024 * 1024 * 1024 = 1,073,741,824 바이트, 1,048,576kB 및 1024MB 및 1GB… 혼동했습니다. 계산에 사용되는 이진 / 기수 -2 표현의 과학적 표기법 및 소수 자릿수. 5x9 = 5 x 10 ^ 9 = 5,000,000,000
James '

3
얘들 아, 그는 아무것도 혼동하지 않았습니다 ... 그는 근사치를 얻었습니다. 그는 "기본적으로"라고 말할 때 분명합니다. 2 ^ 10은 (는) 10 ^ 3. 사실,이 근사는 너무 일반적이다 는 이름이있다 : Mebi , Gibi을 하고 Tebi는 각각 메가, 기가, 테라입니다. @WillManley라는 질문에 대답하지 않으면 이에 대한 적절한 지적이 있습니다! ;-p
Mike Williamson

9

엄격하게 질문에 충실하면 Python 코드 (+ 의사 코드)는 다음과 같습니다.

import os
file_path = r"<path to your file>"
if os.stat(file_path).st_size > 0:
    <send an email to somebody>
else:
    <continue to other things>

-1
#Get file size , print it , process it...
#Os.stat will provide the file size in (.st_size) property. 
#The file size will be shown in bytes.

import os

fsize=os.stat('filepath')
print('size:' + fsize.st_size.__str__())

#check if the file size is less than 10 MB

if fsize.st_size < 10000000:
    process it ....

-1

우리는 두 가지 옵션이 있습니다. 둘 다 os 모듈 가져 오기를 포함합니다.

1) import os as os.stat () 함수는 파일 생성 시간 및 마지막 수정 시간 등을 포함하여 너무 많은 헤더를 포함하는 객체를 반환합니다. st_size ()는 파일의 정확한 크기를 제공합니다.

os.stat ( "filename"). st_size ()

2) import os 여기에서는 상대 경로가 아닌 정확한 파일 경로 (절대 경로)를 제공해야합니다.

os.path.getsize ( "파일 경로")

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.