다음 코드는 정규식을 사용하여 urlsort 파일로 파일 (urlfile에 약 1000 개의 링크가 포함되어 있음)에서 /support/security/*.html 링크를 추출하는 것입니다.
#!/usr/bin/env python
import re,sys
fileHandle = open('urlfile', 'r')
f1 = open('urlsort', 'w')
for line in fileHandle.readlines():
links = re.findall(r"(\/support\/security\/*.html.*?)", line)
for link in links:
sys.stdout = f1
print ('%s' % (link[0]))
sys.stdout = sys.__stdout__
f1.close()
fileHandle.close()
이것은 stackoverflow.com에 있어야합니다.
—
Ramchandra Apte