목록 또는 튜플에서 명시 적으로 항목 선택


120

다음 Python 목록이 있습니다 (튜플 일 수도 있음).

myList = ['foo', 'bar', 'baz', 'quux']

나는 말할 수있다

>>> myList[0:3]
['foo', 'bar', 'baz']
>>> myList[::2]
['foo', 'baz']
>>> myList[1::2]
['bar', 'quux']

인덱스에 특정 패턴이없는 항목을 명시 적으로 선택하려면 어떻게해야합니까? 예를 들어를 선택하고 싶습니다 [0,2,3]. 또는 1000 개 항목의 매우 큰 목록에서을 선택하고 싶습니다 [87, 342, 217, 998, 500]. 이를 수행하는 Python 구문이 있습니까? 다음과 같은 것 :

>>> myBigList[87, 342, 217, 998, 500]

1
중복 된 것으로 보인다. 다른 질문에는 더 많은 찬성표가 있지만 타이밍에 따라 더 나은 답변이있는 것 같습니다.
AnnanFay

답변:


149
list( myBigList[i] for i in [87, 342, 217, 998, 500] )

나는 대답을 파이썬 2.5.2와 비교했습니다.

  • 19.7 usec : [ myBigList[i] for i in [87, 342, 217, 998, 500] ]

  • 20.6 usec : map(myBigList.__getitem__, (87, 342, 217, 998, 500))

  • 22.7 usec : itemgetter(87, 342, 217, 998, 500)(myBigList)

  • 24.6 usec : list( myBigList[i] for i in [87, 342, 217, 998, 500] )

Python 3에서는 1st가 4th와 동일하게 변경되었습니다.


또 다른 옵션은 numpy.array목록 또는 a를 통해 인덱싱을 허용 하는로 시작하는 것입니다 numpy.array.

>>> import numpy
>>> myBigList = numpy.array(range(1000))
>>> myBigList[(87, 342, 217, 998, 500)]
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
IndexError: invalid index
>>> myBigList[[87, 342, 217, 998, 500]]
array([ 87, 342, 217, 998, 500])
>>> myBigList[numpy.array([87, 342, 217, 998, 500])]
array([ 87, 342, 217, 998, 500])

tuple사람들은 조각이 같은 방식으로 작동하지 않습니다.


2
바람직하게는 목록 구성 요소로 사용 [myBigList[i] for i in [87, 342, 217, 998, 500]]되지만이 방법이 가장 좋습니다.
zeekay

@MedhatHelmy 이미 답변에 있습니다. 의 from operator import itemgetter초기화 부분에서 사용되는 세 번째 옵션 입니다 python -mtimeit.
Dan D.

언어 디자인 관점에서 볼 myBigList[(87, 342, 217, 998, 500)]때 왜 myBigList일반 파이썬이 작동하지 않는지 궁금합니다 list. 내가 그것을 시도 할 때 나는 얻는다 TypeError: list indices must be integers or slices, not tuple. 이해력을 입력하는 것보다 훨씬 쉬울 것입니다. 언어 설계 / 구현 문제가 관련되어 있습니까?
sparc_spread

@sparc_spread, 이것은 listsPython에서 정수 또는 슬라이스 만 허용 하기 때문 입니다. 정수를 전달하면 기존 목록에서 하나의 항목 만 검색됩니다. 슬라이스를 전달하면 일부가 검색되지만 튜플을 전달 하는 것은 구문 적으로 잘못된 tuple다른 data-type ( list)에 대한 인수로 data-type ( )을 전달하는 것과 같습니다 .
amanb

48

이것에 대해 :

from operator import itemgetter
itemgetter(0,2,3)(myList)
('foo', 'baz', 'quux')

2
이것은 지금까지 가장 섹시합니다. 그 operator모듈을 사랑해 !
jathanism

10

기본 제공되지는 않지만 원하는 경우 튜플을 "인덱스"로 사용하는 목록의 하위 클래스를 만들 수 있습니다.

class MyList(list):

    def __getitem__(self, index):
        if isinstance(index, tuple):
            return [self[i] for i in index]
        return super(MyList, self).__getitem__(index)


seq = MyList("foo bar baaz quux mumble".split())
print seq[0]
print seq[2,4]
print seq[1::2]

인쇄

foo
['baaz', 'mumble']
['bar', 'quux']

2
(+1) 깔끔한 솔루션! 이 확장을 사용하면 Python에서 배열 처리가 R 또는 Matlab처럼 보이기 시작합니다.
Assad Ebrahim 2014

7

목록 이해가 순서대로있을 수 있습니다.

L = ['a', 'b', 'c', 'd', 'e', 'f']
print [ L[index] for index in [1,3,5] ]

생성 :

['b', 'd', 'f']

그게 당신이 찾고있는 것입니까?


6
>>> map(myList.__getitem__, (2,2,1,3))
('baz', 'baz', 'bar', 'quux')

당신이 할 수 있기를 원한다면 List튜플을 인수로 지원하는 자신의 클래스를 만들 수도 있습니다 .__getitem__myList[(2,2,1,3)]


이것이 작동하는 동안 매직 변수를 직접 호출하는 것은 일반적으로 좋은 생각이 아닙니다. 목록 이해력이나 .NET과 같은 도우미 모듈을 사용하는 것이 좋습니다 operator.
jathanism

@jathanism : 나는 정중하게 동의하지 않습니다. (공개 / 개인이 아닌) 포워드 호환성에 대해 우려한다면 어디에서 왔는지 확실히 알 수 있습니다.
ninjagecko 2011

그것이 내가 오는 곳입니다. :) 그 뒤에는 len(myList)over 를 사용 하는 것이 더 좋은 이유와 같습니다 myList.__len__().
jathanism

마법 변수를 호출하는 것은 나쁜 생각이라고 생각하지 않습니다. 프로그래머는 프로그래밍 환경에 따라 선호하는 방법을 선택합니다.
Jacob CUI

2

지적하고 싶은 것은 itemgetter의 구문조차도 정말 깔끔해 보이지만 큰 목록에서 수행 할 때는 다소 느립니다.

import timeit
from operator import itemgetter
start=timeit.default_timer()
for i in range(1000000):
    itemgetter(0,2,3)(myList)
print ("Itemgetter took ", (timeit.default_timer()-start))

Itemgetter가 1.065209062149279를 받았습니다.

start=timeit.default_timer()
for i in range(1000000):
    myList[0],myList[2],myList[3]
print ("Multiple slice took ", (timeit.default_timer()-start))

다중 슬라이스는 0.6225321444745759를 사용했습니다.


첫 번째 스 니펫, 추가 myList = np.array(range(1000000))하지 않으면 오류가 발생합니다.
클라우드 조

1

또 다른 가능한 해결책 :

sek=[]
L=[1,2,3,4,5,6,7,8,9,0]
for i in [2, 4, 7, 0, 3]:
   a=[L[i]]
   sek=sek+a
print (sek)

0

종종 부울 numpy 배열이있을 때 mask

[mylist[i] for i in np.arange(len(mask), dtype=int)[mask]]

모든 시퀀스 또는 np.array에서 작동하는 람다 :

subseq = lambda myseq, mask : [myseq[i] for i in np.arange(len(mask), dtype=int)[mask]]

newseq = subseq(myseq, mask)

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.