Python을 사용하고 있으며 파일을 삭제하거나 복사하지 않고 텍스트 파일에 문자열을 삽입하고 싶습니다. 어떻게해야합니까?
Python을 사용하고 있으며 파일을 삭제하거나 복사하지 않고 텍스트 파일에 문자열을 삽입하고 싶습니다. 어떻게해야합니까?
답변:
불행히도 파일을 다시 쓰지 않고 파일 중간에 삽입하는 방법은 없습니다. 이전 포스터에서 알 수 있듯이, 파일을 추가하거나 찾기를 사용하여 파일의 일부를 덮어 쓸 수 있지만 처음이나 중간에 물건을 추가하려면 다시 써야합니다.
이것은 파이썬이 아닌 운영 체제입니다. 모든 언어에서 동일합니다.
내가 일반적으로하는 일은 파일에서 읽고 수정하고 myfile.txt.tmp라는 새 파일 또는 이와 비슷한 파일에 쓰는 것입니다. 파일이 너무 커서 전체 파일을 메모리로 읽는 것보다 낫습니다. 임시 파일이 완성되면 원본 파일과 동일하게 이름을 바꿉니다.
파일 쓰기가 중단되거나 어떤 이유로 든 중단 된 경우에도 원본 파일은 그대로 유지되므로이 방법을 사용하는 것이 안전합니다.
당신이하고 싶은 일에 달려 있습니다. 추가하려면 "a"로 열 수 있습니다.
with open("foo.txt", "a") as f:
f.write("new line\n")
무언가를 미리 표현하려면 먼저 파일에서 읽어야합니다.
with open("foo.txt", "r+") as f:
old = f.read() # read everything in the file
f.seek(0) # rewind
f.write("new line\n" + old) # write the new line before
with
당신이 "에서 추가 할 필요가 파이썬 2.5에서 문 미래 가져 오기는 with_statement을". 그 외에는 with
명령문으로 파일을 여는 것이 수동 닫기보다 읽기 쉽고 오류가 덜 발생합니다.
fileinput
사용할 때 더티 open / read / modify / write / replace 루틴을 처리 하는 helper lib를 고려할 수 있습니다 inline=True
. 예를 들면 다음과 같습니다. stackoverflow.com/a/2363893/47390
f.Close()
fileinput
inplace = 1 매개 변수를 사용하면 Python 표준 라이브러리 의 모듈이 파일을 그대로 다시 작성합니다.
import sys
import fileinput
# replace all occurrences of 'sit' with 'SIT' and insert a line after the 5th
for i, line in enumerate(fileinput.input('lorem_ipsum.txt', inplace=1)):
sys.stdout.write(line.replace('sit', 'SIT')) # replace 'sit' and write
if i == 4: sys.stdout.write('\n') # write a blank line after the 5th line
파일을 제자리에 다시 쓰려면 종종 기존 사본을 수정 된 이름으로 저장해야합니다. 유닉스 사람들 ~
은 오래된 것을 표시하기 위해를 추가합니다 . Windows 사용자는 .bak 또는 .old를 추가하거나 파일 이름을 바꾸거나 이름 앞에 ~를 두는 모든 종류의 작업을 수행합니다.
import shutil
shutil.move( afile, afile+"~" )
destination= open( aFile, "w" )
source= open( aFile+"~", "r" )
for line in source:
destination.write( line )
if <some condition>:
destination.write( >some additional line> + "\n" )
source.close()
destination.close()
대신 shutil
다음을 사용할 수 있습니다.
import os
os.rename( aFile, aFile+"~" )
os.rename(aFile, aFile + "~")
사본을 만들지 않고 소스 파일의 이름을 수정합니다.
파이썬의 mmap 모듈을 사용하면 파일에 삽입 할 수 있습니다. 다음 샘플은 Unix에서 수행 할 수있는 방법을 보여줍니다 (Windows mmap은 다를 수 있음). 모든 오류 조건을 처리하는 것은 아니며 원본 파일이 손상되거나 손실 될 수 있습니다. 또한 유니 코드 문자열을 처리하지 않습니다.
import os
from mmap import mmap
def insert(filename, str, pos):
if len(str) < 1:
# nothing to insert
return
f = open(filename, 'r+')
m = mmap(f.fileno(), os.path.getsize(filename))
origSize = m.size()
# or this could be an error
if pos > origSize:
pos = origSize
elif pos < 0:
pos = 0
m.resize(origSize + len(str))
m[pos+len(str):] = m[pos:origSize]
m[pos:pos+len(str)] = str
m.close()
f.close()
'r +'모드에서 열린 파일을 사용하여 mmap없이이 작업을 수행 할 수도 있지만 삽입 위치에서 EOF에 이르기까지 파일의 내용을 읽고 임시 저장해야하므로 덜 편리하고 덜 효율적입니다. 거대하다.
Adam이 언급했듯이 시스템 메모리의 일부를 교체하고 다시 쓸 수있는 충분한 메모리가 있는지에 대한 접근 방식을 결정하기 전에 시스템 제한을 고려해야합니다.
작은 파일을 다루거나 메모리 문제가없는 경우 다음과 같은 도움이 될 수 있습니다.
옵션 1) 전체 파일을 메모리로 읽고 행의 전체 또는 일부에 정규식 대체를 수행하고 해당 행에 추가 행을 추가하십시오. '중간 라인'이 파일에서 고유한지 확인해야하거나 각 라인에 타임 스탬프가있는 경우 이는 매우 안정적이어야합니다.
# open file with r+b (allow write and binary mode)
f = open("file.log", 'r+b')
# read entire content of file into memory
f_content = f.read()
# basically match middle line and replace it with itself and the extra line
f_content = re.sub(r'(middle line)', r'\1\nnew line', f_content)
# return pointer to top of file so we can re-write the content with replaced string
f.seek(0)
# clear file content
f.truncate()
# re-write the content with the updated content
f.write(f_content)
# close file
f.close()
옵션 2) 가운데 줄을 찾아 해당 줄과 추가 줄로 바꿉니다.
# open file with r+b (allow write and binary mode)
f = open("file.log" , 'r+b')
# get array of lines
f_content = f.readlines()
# get middle line
middle_line = len(f_content)/2
# overwrite middle line
f_content[middle_line] += "\nnew line"
# return pointer to top of file so we can re-write the content with replaced string
f.seek(0)
# clear file content
f.truncate()
# re-write the content with the updated content
f.write(''.join(f_content))
# close file
f.close()
이것을 깨끗하게하기 위해 작은 수업을 썼습니다.
import tempfile
class FileModifierError(Exception):
pass
class FileModifier(object):
def __init__(self, fname):
self.__write_dict = {}
self.__filename = fname
self.__tempfile = tempfile.TemporaryFile()
with open(fname, 'rb') as fp:
for line in fp:
self.__tempfile.write(line)
self.__tempfile.seek(0)
def write(self, s, line_number = 'END'):
if line_number != 'END' and not isinstance(line_number, (int, float)):
raise FileModifierError("Line number %s is not a valid number" % line_number)
try:
self.__write_dict[line_number].append(s)
except KeyError:
self.__write_dict[line_number] = [s]
def writeline(self, s, line_number = 'END'):
self.write('%s\n' % s, line_number)
def writelines(self, s, line_number = 'END'):
for ln in s:
self.writeline(s, line_number)
def __popline(self, index, fp):
try:
ilines = self.__write_dict.pop(index)
for line in ilines:
fp.write(line)
except KeyError:
pass
def close(self):
self.__exit__(None, None, None)
def __enter__(self):
return self
def __exit__(self, type, value, traceback):
with open(self.__filename,'w') as fp:
for index, line in enumerate(self.__tempfile.readlines()):
self.__popline(index, fp)
fp.write(line)
for index in sorted(self.__write_dict):
for line in self.__write_dict[index]:
fp.write(line)
self.__tempfile.close()
그런 다음 다음과 같이 사용할 수 있습니다.
with FileModifier(filename) as fp:
fp.writeline("String 1", 0)
fp.writeline("String 2", 20)
fp.writeline("String 3") # To write at the end of the file
유닉스를 알고 있다면 다음을 시도해보십시오.
참고 : $는 명령 프롬프트를 의미합니다.
다음과 같은 내용의 my_data.txt 파일이 있다고 가정하십시오.
$ cat my_data.txt
This is a data file
with all of my data in it.
그런 다음 os
모듈을 사용하여 일반적인 sed
명령을 사용할 수 있습니다
import os
# Identifiers used are:
my_data_file = "my_data.txt"
command = "sed -i 's/all/none/' my_data.txt"
# Execute the command
os.system(command)
sed를 모르면 확인하십시오. 매우 유용합니다.