목록 내에서 고유 한 값을 계산하는 방법


127

그래서 사용자에게 입력을 요청하고 값을 배열 / 목록에 저장하는이 프로그램을 만들려고합니다.
그런 다음 빈 줄을 입력하면 해당 값 중 몇 개가 고유한지 사용자에게 알려줍니다.
나는 이것을 문제 세트가 아닌 실제 삶의 이유로 구축하고 있습니다.

enter: happy
enter: rofl
enter: happy
enter: mpg8
enter: Cpp
enter: Cpp
enter:
There are 4 unique words!

내 코드는 다음과 같습니다.

# ask for input
ipta = raw_input("Word: ")

# create list 
uniquewords = [] 
counter = 0
uniquewords.append(ipta)

a = 0   # loop thingy
# while loop to ask for input and append in list
while ipta: 
  ipta = raw_input("Word: ")
  new_words.append(input1)
  counter = counter + 1

for p in uniquewords:

.. 그게 내가 지금까지 얻은 전부입니다.
목록에서 고유 한 단어 수를 계산하는 방법을 잘 모르겠습니까?
누군가가 해결책을 게시하여 내가 배울 수 있거나 적어도 그것이 얼마나 좋을지 보여줄 수 있다면 감사합니다!


4
Python에서 중요한 코드 샘플의 들여 쓰기를 수정할 수 있습니까?
codebox

1
코드를 읽을 수 있도록 편집하는 대신 제거했습니다! 코드가 많은이 도움이 될 것입니다 데 ...
hcarver

1
@codebox 죄송합니다 지금 할 것입니다
Joel Aqu.

답변:


246

또한 collections.Counter 를 사용 하여 코드를 리팩터링하십시오.

from collections import Counter

words = ['a', 'b', 'c', 'a']

Counter(words).keys() # equals to list(set(words))
Counter(words).values() # counts the elements' frequency

산출:

['a', 'c', 'b']
[2, 1, 1]

46
Joel의 질문에 대한 답은 아니지만 정확히 제가 찾던 것입니다. 감사합니다!
Huw Walters 2015 년

완전한. 그리고 황소 눈. 감사합니다 @Vidul
파락 티 야기

Counter(words).values()좋다. 카운트가 단어 목록의 첫 등장 순서라고 가정하고 있습니까? 내 말은, 카운트가 우리에게 a, b, c, d의 카운트를 줄 것이라고 가정하고 있습니다.
Monica Heddneck

2
당신이 count_dict = {'a': 2, 'b': 1, 'c': 1}할 수있는 것과 같은 딕셔너리로 ​​이것을 표현하고 싶다면 참고 하세요count_dict = dict(Counter(words).items())
Peter



16

세트 사용 :

words = ['a', 'b', 'c', 'a']
unique_words = set(words)             # == set(['a', 'b', 'c'])
unique_word_count = len(unique_words) # == 3

이것으로 무장하면 솔루션은 다음과 같이 간단 할 수 있습니다.

words = []
ipta = raw_input("Word: ")

while ipta:
  words.append(ipta)
  ipta = raw_input("Word: ")

unique_word_count = len(set(words))

print "There are %d unique words!" % unique_word_count

6
aa="XXYYYSBAA"
bb=dict(zip(list(aa),[list(aa).count(i) for i in list(aa)]))
print(bb)
# output:
# {'X': 2, 'Y': 3, 'S': 1, 'B': 1, 'A': 2}

1
이것이 다른 답변과 어떻게 다른지 설명하십시오
Akaisteph7

4

ndarray에는 unique 라는 numpy 메서드가 있습니다 .

np.unique(array_name)

예 :

>>> np.unique([1, 1, 2, 2, 3, 3])
array([1, 2, 3])
>>> a = np.array([[1, 1], [2, 3]])
>>> np.unique(a)
array([1, 2, 3])

시리즈의 경우 value_counts () 함수 호출이 있습니다 .

Series_name.value_counts()

1
ipta = raw_input("Word: ") ## asks for input
words = [] ## creates list
unique_words = set(words)

1

집합이 가장 쉬운 방법이지만 사전을 사용 some_dict.has(key)하여 고유 한 키와 값으로 만 사전을 채우는 데 사용할 수도 있습니다 .

words[]사용자의 입력을 이미 입력했다고 가정 하고 목록의 고유 한 단어를 숫자에 매핑하는 사전을 만듭니다.

word_map = {}
i = 1
for j in range(len(words)):
    if not word_map.has_key(words[j]):
        word_map[words[j]] = i
        i += 1                                                             
num_unique_words = len(new_map) # or num_unique_words = i, however you prefer

1

판다를 사용하는 다른 방법

import pandas as pd

LIST = ["a","a","c","a","a","v","d"]
counts,values = pd.Series(LIST).value_counts().values, pd.Series(LIST).value_counts().index
df_results = pd.DataFrame(list(zip(values,counts)),columns=["value","count"])

그런 다음 원하는 형식으로 결과를 내보낼 수 있습니다.


1

어때 :

import pandas as pd
#List with all words
words=[]

#Code for adding words
words.append('test')


#When Input equals blank:
pd.Series(words).nunique()

목록에있는 고유 값 수를 반환합니다.


StackOverflow에 오신 것을 환영합니다! 이 솔루션은 pandas프레임 워크를 사용한다고 가정 한 것 같습니다 . 다른 사용자에게는 명확하지 않을 수 있으므로 답변에 언급하는 것이 좋습니다.
Sergey Shubin

0

다음이 작동합니다. 람다 함수는 중복 된 단어를 필터링합니다.

inputs=[]
input = raw_input("Word: ").strip()
while input:
    inputs.append(input)
    input = raw_input("Word: ").strip()
uniques=reduce(lambda x,y: ((y in x) and x) or x+[y], inputs, [])
print 'There are', len(uniques), 'unique words'

0

나는 세트를 직접 사용하지만 여기에 또 다른 방법이 있습니다.

uniquewords = []
while True:
    ipta = raw_input("Word: ")
    if ipta == "":
        break
    if not ipta in uniquewords:
        uniquewords.append(ipta)
print "There are", len(uniquewords), "unique words!"

0
ipta = raw_input("Word: ") ## asks for input
words = [] ## creates list

while ipta: ## while loop to ask for input and append in list
  words.append(ipta)
  ipta = raw_input("Word: ")
  words.append(ipta)
#Create a set, sets do not have repeats
unique_words = set(words)

print "There are " +  str(len(unique_words)) + " unique words!"
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.