답변:
정규식이 필요하지 않습니다. 파이썬에는 필요한 것을 수행하는 내장 문자열 메소드가 있습니다.
mystring.replace(" ", "_")
공백을 바꾸는 것은 좋지만 물음표, 아포스트로피, 느낌표 등과 같은 다른 URL 적대적 문자를 처리하는 것이 좋습니다.
또한 SEO 전문가들 사이의 일반적인 합의 는 URL에서 밑줄보다 대시가 선호된다는 것입니다.
import re
def urlify(s):
# Remove all non-word characters (everything except numbers and letters)
s = re.sub(r"[^\w\s]", '', s)
# Replace all runs of whitespace with a single dash
s = re.sub(r"\s+", '-', s)
return s
# Prints: I-cant-get-no-satisfaction"
print(urlify("I can't get no satisfaction!"))
Django는이를 수행하는 'slugify'기능과 다른 URL 친화적 인 최적화 기능을 가지고 있습니다. 기본 필터 모듈에 숨겨져 있습니다.
>>> from django.template.defaultfilters import slugify
>>> slugify("This should be connected")
this-should-be-connected
이것은 정확히 요청한 결과는 아니지만 IMO는 URL에 사용하는 것이 좋습니다.
이것은 공백 이외의 공백 문자를 고려하며 re
모듈을 사용하는 것보다 빠릅니다 .
url = "_".join( title.split() )
\x8f
)
re
모듈 사용 :
import re
re.sub('\s+', '_', "This should be connected") # This_should_be_connected
re.sub('\s+', '_', 'And so\tshould this') # And_so_should_this
위와 같이 여러 공간이나 다른 여백 가능성이 없다면 string.replace
다른 사람들이 제안한대로 사용 하는 것이 좋습니다.
놀랍게도이 라이브러리는 아직 언급되지 않았습니다
python-slugify라는 python 패키지는 꽤 훌륭하게 처리합니다.
pip install python-slugify
다음과 같이 작동합니다.
from slugify import slugify
txt = "This is a test ---"
r = slugify(txt)
self.assertEquals(r, "this-is-a-test")
txt = "This -- is a ## test ---"
r = slugify(txt)
self.assertEquals(r, "this-is-a-test")
txt = 'C\'est déjà l\'été.'
r = slugify(txt)
self.assertEquals(r, "cest-deja-lete")
txt = 'Nín hǎo. Wǒ shì zhōng guó rén'
r = slugify(txt)
self.assertEquals(r, "nin-hao-wo-shi-zhong-guo-ren")
txt = 'Компьютер'
r = slugify(txt)
self.assertEquals(r, "kompiuter")
txt = 'jaja---lol-méméméoo--a'
r = slugify(txt)
self.assertEquals(r, "jaja-lol-mememeoo-a")
친숙한 URL에 다음 코드를 사용하고 있습니다.
from unicodedata import normalize
from re import sub
def slugify(title):
name = normalize('NFKD', title).encode('ascii', 'ignore').replace(' ', '-').lower()
#remove `other` characters
name = sub('[^a-zA-Z0-9_-]', '', name)
#nomalize dashes
name = sub('-+', '-', name)
return name
유니 코드 문자에서도 잘 작동합니다.
파이썬에는 replace라는 문자열에 내장 메소드가 있습니다.
string.replace(old, new)
따라서 다음을 사용합니다.
string.replace(" ", "_")
나는이 문제를 얼마 전에 가지고 있었고 문자열의 문자를 대체하는 코드를 작성했습니다. 파이썬 문서는 모든 기능을 내장하고 있기 때문에 파이썬 문서를 확인하는 것을 기억해야합니다.
perl -e 'map { $on=$_; s/ /_/; rename($on, $_) or warn $!; } <*>;'
일치 및 대체 공간> 현재 디렉토리에있는 모든 파일의 밑줄
slugify
원하는 출력을 제공하지 않습니다.