답변:
str.count (sub [, start [, end]])
sub
범위에서 겹치지 않는 부분 문자열 수를 리턴합니다[start, end]
. 선택적 인수start
이며end
슬라이스 표기법으로 해석됩니다.
>>> sentence = 'Mary had a little lamb'
>>> sentence.count('a')
4
다른 답변에서 말했듯이 count () 문자열 메서드를 사용하는 것이 가장 간단하지만 자주 수행하는 경우 컬렉션을 확인하십시오 .
from collections import Counter
my_str = "Mary had a little lamb"
counter = Counter(my_str)
print counter['a']
정규 표현식일까요?
import re
my_string = "Mary had a little lamb"
len(re.findall("a", my_string))
len(re.findall('1',bin(10)))
파이썬 -3.x :
"aabc".count("a")
str.count (sub [, start [, end]])
[start, end] 범위에서 하위 문자열 하위의 겹치지 않는 횟수를 반환합니다. 선택적 인수 start 및 end는 슬라이스 표기법으로 해석됩니다.
str.count(a)
문자열에서 단일 문자를 계산하는 가장 좋은 솔루션입니다. 그러나 더 많은 문자를 계산해야하는 경우 계산하려는 문자 수만큼 문자열 전체를 읽어야합니다.
이 작업에 대한 더 나은 접근 방식은 다음과 같습니다.
from collections import defaultdict
text = 'Mary had a little lamb'
chars = defaultdict(int)
for char in text:
chars[char] += 1
따라서 문자열에있는 모든 문자의 발생 횟수와 0
존재하지 않는 경우 를 반환하는 dict이 있습니다.
>>>chars['a']
4
>>>chars['x']
0
대소 문자를 구분하지 않는 카운터의 경우 서브 클래 싱을 통해 뮤 테이터 및 접근 자 메서드를 재정의 할 수 있습니다 defaultdict
(기본 클래스의 메서드 는 읽기 전용 임).
class CICounter(defaultdict):
def __getitem__(self, k):
return super().__getitem__(k.lower())
def __setitem__(self, k, v):
super().__setitem__(k.lower(), v)
chars = CICounter(int)
for char in text:
chars[char] += 1
>>>chars['a']
4
>>>chars['M']
2
>>>chars['x']
0
Counter
클래스를 다시 구현 하고 collections
있습니다.
Counter
더 비 대한 순수 파이썬 클래스 인 defaultdict
'들__missing__
되어 C로 작성 . 이와 같은 간단한 작업 ( int
C에서도 구현 됨)의 경우이 접근법은 엄청나게 빠릅니다.
이 쉽고 간단한 기능은 다음에 도움이 될 수 있습니다.
def check_freq(x):
freq = {}
for c in x:
freq[c] = str.count(c)
return freq
check_freq("abbabcbdbabdbdbabababcbcbab")
{'a': 7, 'b': 14, 'c': 3, 'd': 3}
str
입니다. 변수에 이름을 지정하면 str
더 이상 내장 유형이 아닙니다. 또한 당신은 14시 14 분을 세고 있습니다. 로 변경 for c in text
하여 간단히 피할 수 있습니다 for c in set(text)
.
정규 표현식은 대소 문자를 구분하지 않고 정규 표현식의 모든 힘을 원할 경우 매우 유용합니다.
my_string = "Mary had a little lamb"
# simplest solution, using count, is case-sensitive
my_string.count("m") # yields 1
import re
# case-sensitive with regex
len(re.findall("m", my_string))
# three ways to get case insensitivity - all yield 2
len(re.findall("(?i)m", my_string))
len(re.findall("m|M", my_string))
len(re.findall(re.compile("m",re.IGNORECASE), my_string))
정규식 버전은 실행 시간이 10 배 정도 걸리므로 my_string이 엄청나게 길거나 코드가 딥 루프 안에있는 경우에만 문제가 될 수 있습니다.
대안없이 모든 문자 수를 얻을 수있는 방법 Counter()
, count
그리고 정규 표현식
counts_dict = {}
for c in list(sentence):
if c not in counts_dict:
counts_dict[c] = 0
counts_dict[c] += 1
for key, value in counts_dict.items():
print(key, value)
count
문자열에서 문자의 발생을 계산하는 가장 간결하고 효율적인 방법이지만 분명히 lambda
다음과 같은 솔루션을 사용하려고 했습니다.
sentence = 'Mary had a little lamb'
sum(map(lambda x : 1 if 'a' in x else 0, sentence))
결과는 다음과 같습니다.
4
또한 문장이 위와 동일한 문자를 포함하는 하위 문자열 목록 인 경우을 사용하면 올바른 결과를 얻을 수 있다는 이점도 있습니다 in
. 보세요 :
sentence = ['M', 'ar', 'y', 'had', 'a', 'little', 'l', 'am', 'b']
sum(map(lambda x : 1 if 'a' in x else 0, sentence))
또한 결과는 다음과 같습니다.
4
그러나 물론 'a'
이것은이 특별한 경우 와 같은 단일 문자의 발생을 확인할 때만 작동합니다 .
"문자열에서 문자를 찾기 위해 count를 사용하지 않고"메소드.
import re
def count(s, ch):
pass
def main():
s = raw_input ("Enter strings what you like, for example, 'welcome': ")
ch = raw_input ("Enter you want count characters, but best result to find one character: " )
print ( len (re.findall ( ch, s ) ) )
main()
나는 팬더 라이브러리의 팬, 특히 value_counts()
방법입니다. 문자열에서 각 문자의 발생 횟수를 계산하는 데 사용할 수 있습니다.
>>> import pandas as pd
>>> phrase = "I love the pandas library and its `value_counts()` method"
>>> pd.Series(list(phrase)).value_counts()
8
a 5
e 4
t 4
o 3
n 3
s 3
d 3
l 3
u 2
i 2
r 2
v 2
` 2
h 2
p 1
b 1
I 1
m 1
( 1
y 1
_ 1
) 1
c 1
dtype: int64