두 개의 중첩 된 목록의 교차점을 찾으십니까?


468

두 개의 평평한 목록을 교차시키는 방법을 알고 있습니다.

b1 = [1,2,3,4,5,9,11,15]
b2 = [4,5,6,7,8]
b3 = [val for val in b1 if val in b2]

또는

def intersect(a, b):
    return list(set(a) & set(b))

print intersect(b1, b2)

그러나 중첩 목록의 교차점을 찾아야 할 때 문제가 시작됩니다.

c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]

결국 나는 받고 싶다 :

c3 = [[13,32],[7,13,28],[1,6]]

이거 좀 도와 줄래?

관련


c1과 c2의 교차점은 무엇입니까? c1이 c2에 있는지 간단히 찾고 싶습니까? 아니면 c2의 어느 곳에 나 나타나는 c1의 모든 요소를 ​​찾고 싶습니까?
Brian R. Bondy

이것을 읽고 통역사에서 놀으십시오.
Pithikos

답변:


177

네가 원한다면:

c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]
c3 = [[13, 32], [7, 13, 28], [1,6]]

다음은 Python 2에 대한 솔루션입니다.

c3 = [filter(lambda x: x in c1, sublist) for sublist in c2]

파이썬 3에서는 filter대신 iterable을 반환 list하므로 다음 filterlist()같이 호출 을 래핑해야합니다 .

c3 = [list(filter(lambda x: x in c1, sublist)) for sublist in c2]

설명:

필터 부분은 각 하위 목록의 항목을 가져 와서 소스 목록 c1에 있는지 확인합니다. c2의 각 하위 목록에 대해 목록 이해가 실행됩니다.


35
filter(set(c1).__contains__, sublist)효율성을 위해 사용할 수 있습니다 . btw 에서이 솔루션의 장점은 filter()문자열과 튜플 유형 을 유지 한다는 것 입니다.
jfs

3
이 방법이 마음에 들지만 결과 목록에 빈
Jonathan Ong

나는 이것을 파이썬 3 질문의 속임수에 대한 속임수 목표로 사용하고 있기 때문에 여기에 파이썬 3 compat을 추가했습니다
Antti Haapala

9
이것은 중첩 된 이해로 더 나은 IMO를 읽습니다 :c3 = [[x for x in sublist if x in c1] for sublist in c2]
Eric

894

교차점을 정의 할 필요가 없습니다. 이미 세트의 일류 부분입니다.

>>> b1 = [1,2,3,4,5,9,11,15]
>>> b2 = [4,5,6,7,8]
>>> set(b1).intersection(b2)
set([4, 5])

3
설정 변환으로 인해 람다보다 속도가 느려 집니까?
Ciro Santilli 郝海东 冠状 病 六四 事件 法轮功

32
@ S.Lott, 문제가 set(b1) & set(b2)있습니까? 운영자를 사용하기 위해 청소기 IMO.
gwg

4
또한 사용 set하면 수십 배 더 빠른 코드가 생성됩니다. 다음은 샘플 benchmark®는 다음과 같습니다 gist.github.com/andersonvom/4d7e551b4c0418de3160
andersonvom

5
결과를 주문할 필요가없는 경우에만 작동합니다.
Borbag

7
그래서 ...이 대답은 결코 질문에 대답하지 않습니다. 이것은 이제 중첩 목록에서 작동하기 때문입니다 .
Mayou36

60

Asker는 두 목록의 교차점을 찾고자하는 사람들에게 두 가지 방법을 제공했습니다.

b1 = [1,2,3,4,5,9,11,15]
b2 = [4,5,6,7,8]
b3 = [val for val in b1 if val in b2]

def intersect(a, b):
     return list(set(a) & set(b))

print intersect(b1, b2)

그러나 세 가지가 아닌 목록 / 세트간에 한 번만 변환하면되므로보다 효율적인 하이브리드 방법이 있습니다.

b1 = [1,2,3,4,5]
b2 = [3,4,5,6]
s2 = set(b2)
b3 = [val for val in b1 if val in s2]

이것은 목록 이해를 포함하는 그의 원래 방법이 O (n ^ 2)에서 실행되는 반면, O (n)에서 실행됩니다.


"s2의 val 인 경우"가 O (N)에서 실행됨에 따라 제안 된 코드 스 니펫 복잡도는 O (n ^ 2)
Romeno

8
wiki.python.org/moin/TimeComplexity#set 에 따르면 "s2의 Val"의 평균 사례는 O (1)입니다. 따라서 n 개 작업에서 예상 시간은 O (n)입니다 (최악의 경우는 O ( n) 또는 O (n ^ 2)는이 평균 사례가 상각 된 시간을 나타내는 지 여부에 따라 다르지만 실제로는 그다지 중요하지 않습니다.
D Coetzee 2013

2
런타임은 상각되기 때문에가 아니라 설정된 멤버쉽이 평균 O (1)이기 때문에 (예 : 해시 테이블을 사용할 때) O (N)입니다. 예를 들어, 상각 시간이 보장되기 때문에 큰 차이가 있습니다.
miroB

28

기능적 접근 방식 :

input_list = [[1, 2, 3, 4, 5], [2, 3, 4, 5, 6], [3, 4, 5, 6, 7]]

result = reduce(set.intersection, map(set, input_list))

더 일반적인 1+ 목록에 적용될 수 있습니다.


빈 입력 목록을 허용하려면 : set(*input_list[:1]).intersection(*input_list[1:]). 반복기 버전 ( it = iter(input_list)) : reduce(set.intersection, it, set(next(it, []))). 두 버전 모두 모든 입력 목록을 설정으로 변환 할 필요는 없습니다. 후자는 더 메모리 효율적입니다.
jfs

from functools import reduce파이썬 3에서 사용하십시오. 또는 더 나은 방법으로는 명시 적 for루프를 사용하십시오.
TrigonaMinima

27

순수한 목록 이해 버전

>>> c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
>>> c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]
>>> c1set = frozenset(c1)

변형 변형 :

>>> [n for lst in c2 for n in lst if n in c1set]
[13, 32, 7, 13, 28, 1, 6]

중첩 변형 :

>>> [[n for n in lst if n in c1set] for lst in c2]
[[13, 32], [7, 13, 28], [1, 6]]

20

& 연산자는 두 세트의 교차점을 사용합니다.

{1, 2, 3} & {2, 3, 4}
Out[1]: {2, 3}

좋습니다,하지만이 주제는 목록입니다!
Rafa0809

3
두 목록의 교차 결과는이 답변이 완벽하게 유효합니다.
shrewmouse

목록에는 중복 값이 ​​포함될 수 있지만 세트에는 포함되지 않습니다.
diewland

13

두 목록의 교차점을 취하는 pythonic 방법은 다음과 같습니다.

[x for x in list1 if x in list2]

2
이 질문은 중첩 목록에 관한 것입니다. 귀하의 답변이 질문에 답변하지 않습니다.
Thomas

8

이 코드 ( http://kogs-www.informatik.uni-hamburg.de/~meine/python_tricks 에서 가져옴 )를 사용하여 병합해야 합니다. 코드는 테스트되지 않았지만 작동합니다.


def flatten(x):
    """flatten(sequence) -> list

    Returns a single, flat list which contains all elements retrieved
    from the sequence and all recursively contained sub-sequences
    (iterables).

    Examples:
    >>> [1, 2, [3,4], (5,6)]
    [1, 2, [3, 4], (5, 6)]
    >>> flatten([[[1,2,3], (42,None)], [4,5], [6], 7, MyVector(8,9,10)])
    [1, 2, 3, 42, None, 4, 5, 6, 7, 8, 9, 10]"""

    result = []
    for el in x:
        #if isinstance(el, (list, tuple)):
        if hasattr(el, "__iter__") and not isinstance(el, basestring):
            result.extend(flatten(el))
        else:
            result.append(el)
    return result

리스트를 평탄화 한 후 일반적인 방법으로 교차를 수행합니다.


c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]

def intersect(a, b):
     return list(set(a) & set(b))

print intersect(flatten(c1), flatten(c2))

2
그것은 평평한 코드 Geo의 좋은 부분이지만 질문에 대답하지는 않습니다. 질문자는 구체적으로 [[13,32], [7,13,28], [1,6]] 형식의 결과를 기대합니다.
Rob Young

8

이후 intersect정의, 기본리스트 이해는 충분하다 :

>>> c3 = [intersect(c1, i) for i in c2]
>>> c3
[[32, 13], [28, 13, 7], [1, 6]]

S. Lott의 발언 및 TM. 관련 발언 덕분에 개선 :

>>> c3 = [list(set(c1).intersection(i)) for i in c2]
>>> c3
[[32, 13], [28, 13, 7], [1, 6]]

5

주어진:

> c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]

> c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]

다음 코드가 잘 작동하고 set 연산을 사용하면 더 간결해질 수 있습니다.

> c3 = [list(set(f)&set(c1)) for f in c2] 

그것은 얻었다 :

> [[32, 13], [28, 13, 7], [1, 6]]

주문이 필요한 경우 :

> c3 = [sorted(list(set(f)&set(c1))) for f in c2] 

우리는 얻었다 :

> [[13, 32], [7, 13, 28], [1, 6]]

그건 그렇고, 더 파이썬 스타일의 경우 이것도 좋습니다.

> c3 = [ [i for i in set(f) if i in c1] for f in c2]

3

귀하의 질문에 답변이 늦었는지 모르겠습니다. 귀하의 질문을 읽은 후 목록과 중첩 목록 모두에서 작동 할 수있는 intersect () 함수가 나타났습니다. 이 함수를 정의하기 위해 재귀를 사용했는데 매우 직관적입니다. 그것이 당신이 찾고있는 것이기를 바랍니다.

def intersect(a, b):
    result=[]
    for i in b:
        if isinstance(i,list):
            result.append(intersect(a,i))
        else:
            if i in a:
                 result.append(i)
    return result

예:

>>> c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
>>> c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]
>>> print intersect(c1,c2)
[[13, 32], [7, 13, 28], [1, 6]]

>>> b1 = [1,2,3,4,5,9,11,15]
>>> b2 = [4,5,6,7,8]
>>> print intersect(b1,b2)
[4, 5]

2

[1,2]와 교차하는 것을 고려하십니까 [1, [2]]? 즉, 관심있는 숫자입니까, 목록 구조입니까?

숫자 만있는 경우 목록을 "평평하게"하는 방법을 조사한 다음 set()방법 을 사용하십시오 .


목록의 구조를 그대로 유지하고 싶습니다.
elfuego1

1

나는 또한 그것을 할 수있는 방법을 찾고 있었고 결국 다음과 같이 끝났습니다.

def compareLists(a,b):
    removed = [x for x in a if x not in b]
    added = [x for x in b if x not in a]
    overlap = [x for x in a if x in b]
    return [removed,added,overlap]

set.intersection을 사용하지 않으면이 간단한 라이너 하나도 내가 할 것입니다.
slaughter98

0
c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]

c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]

c3 = [list(set(c2[i]).intersection(set(c1))) for i in xrange(len(c2))]

c3
->[[32, 13], [28, 13, 7], [1, 6]]

0

이를 위해 set 메소드를 사용할 수 있습니다.

c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]

   result = [] 
   for li in c2:
       res = set(li) & set(c1)
       result.append(list(res))

   print result

0

요소의 카디널리티를 올바르게 고려한 교차점을 정의하려면 다음을 사용하십시오 Counter.

from collections import Counter

>>> c1 = [1, 2, 2, 3, 4, 4, 4]
>>> c2 = [1, 2, 4, 4, 4, 4, 5]
>>> list((Counter(c1) & Counter(c2)).elements())
[1, 2, 4, 4, 4]

0
# Problem:  Given c1 and c2:
c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]
# how do you get c3 to be [[13, 32], [7, 13, 28], [1, 6]] ?

세트 c3를 포함하지 않는 설정 방법은 다음과 같습니다 .

c3 = []
for sublist in c2:
    c3.append([val for val in c1 if val in sublist])

그러나 한 줄만 사용하려면 다음을 수행하십시오.

c3 = [[val for val in c1 if val in sublist]  for sublist in c2]

목록 이해의 목록 이해입니다. 이것은 조금 드문 일이지만, 당신이 그것을 따르는 데 너무 많은 문제가 없어야한다고 생각합니다.


0
c1 = [1, 6, 7, 10, 13, 28, 32, 41, 58, 63]
c2 = [[13, 17, 18, 21, 32], [7, 11, 13, 14, 28], [1, 5, 6, 8, 15, 16]]
c3 = [list(set(i) & set(c1)) for i in c2]
c3
[[32, 13], [28, 13, 7], [1, 6]]

나에게 이것은 매우 우아하고 빠른 방법입니다. :)


0

reduce쉽게 목록을 만들 수 있습니다.

모든 당신이 사용할 필요가 초기화 에서 세 번째 인수 - reduce기능.

reduce(
   lambda result, _list: result.append(
       list(set(_list)&set(c1)) 
     ) or result, 
   c2, 
   [])

위의 코드는 python2와 python3 모두에서 작동하지만 reduce 모듈을로 가져와야합니다 from functools import reduce. 자세한 내용은 아래 링크를 참조하십시오.


-1

이터 러블 사이의 차이점과 교차점을 찾는 간단한 방법

반복이 중요한 경우이 방법을 사용하십시오.

from collections import Counter

def intersection(a, b):
    """
    Find the intersection of two iterables

    >>> intersection((1,2,3), (2,3,4))
    (2, 3)

    >>> intersection((1,2,3,3), (2,3,3,4))
    (2, 3, 3)

    >>> intersection((1,2,3,3), (2,3,4,4))
    (2, 3)

    >>> intersection((1,2,3,3), (2,3,4,4))
    (2, 3)
    """
    return tuple(n for n, count in (Counter(a) & Counter(b)).items() for _ in range(count))

def difference(a, b):
    """
    Find the symmetric difference of two iterables

    >>> difference((1,2,3), (2,3,4))
    (1, 4)

    >>> difference((1,2,3,3), (2,3,4))
    (1, 3, 4)

    >>> difference((1,2,3,3), (2,3,4,4))
    (1, 3, 4, 4)
    """
    diff = lambda x, y: tuple(n for n, count in (Counter(x) - Counter(y)).items() for _ in range(count))
    return diff(a, b) + diff(b, a)
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.