정식 cartesian_product
(거의)
다른 속성을 가진이 문제에 대한 많은 접근 방식이 있습니다. 일부는 다른 것보다 빠르며 일부는 더 일반적인 용도입니다. 많은 테스트와 조정 후, n- 차원을 계산하는 다음 함수 cartesian_product
가 많은 입력에서 다른 함수 보다 빠르다 는 것을 알았습니다 . 약간 더 복잡하지만 많은 경우에 조금 더 빠른 접근법에 대해서는 Paul Panzer 의 답변을 참조하십시오 .
그 대답을 감안할 때 이것은 더 이상 내가 알고 있는 데카르트 제품 의 가장 빠른 구현 이 아닙니다 numpy
. 그러나 단순성으로 인해 향후 개선에 유용한 벤치 마크가 될 것입니다.
def cartesian_product(*arrays):
la = len(arrays)
dtype = numpy.result_type(*arrays)
arr = numpy.empty([len(a) for a in arrays] + [la], dtype=dtype)
for i, a in enumerate(numpy.ix_(*arrays)):
arr[...,i] = a
return arr.reshape(-1, la)
이 함수가 ix_
비정상적인 방식으로 사용된다는 것은 언급 할 가치가 있습니다 . 설명의 사용 반면 ix_
하는 인덱스를 생성 으로 배열 너무 동일한 형상으로 배열 방송 할당을 위해 사용될 수 있음을 발생한다. 많은 감사 mgilson 나에게 영감을 사용하려고하는 ix_
이 방법을, 그리고에 unutbu 사용에 대한 제안을 포함하여,이 답변에 대한 몇 가지 매우 유용한 피드백을 제공 numpy.result_type
.
주목할만한 대안
연속적인 메모리 블록을 포트란 순서로 쓰는 것이 더 빠릅니다. 이것이이 대안의 기초이며 cartesian_product_transpose
일부 하드웨어에서보다 빠른 것으로 입증되었습니다 cartesian_product
(아래 참조). 그러나 동일한 원칙을 사용하는 Paul Panzer의 답변은 훨씬 빠릅니다. 여전히 관심있는 독자들을 위해 여기에 포함시킵니다.
def cartesian_product_transpose(*arrays):
broadcastable = numpy.ix_(*arrays)
broadcasted = numpy.broadcast_arrays(*broadcastable)
rows, cols = numpy.prod(broadcasted[0].shape), len(broadcasted)
dtype = numpy.result_type(*arrays)
out = numpy.empty(rows * cols, dtype=dtype)
start, end = 0, rows
for a in broadcasted:
out[start:end] = a.reshape(-1)
start, end = end, end + rows
return out.reshape(cols, rows).T
Panzer의 접근 방식을 이해 한 후, 나는 그의 것만 큼 빠르며 거의 간단한 새 버전을 작성했습니다 cartesian_product
.
def cartesian_product_simple_transpose(arrays):
la = len(arrays)
dtype = numpy.result_type(*arrays)
arr = numpy.empty([la] + [len(a) for a in arrays], dtype=dtype)
for i, a in enumerate(numpy.ix_(*arrays)):
arr[i, ...] = a
return arr.reshape(la, -1).T
작은 입력의 경우 Panzer보다 느리게 실행되는 일정한 시간 오버 헤드가있는 것으로 보입니다. 그러나 더 큰 입력의 경우, 내가 실행 한 모든 테스트에서 가장 빠른 구현뿐만 아니라 성능도 수행합니다 cartesian_product_transpose_pp
.
다음 섹션에서는 다른 대안에 대한 테스트를 포함합니다. 이것들은 현재 다소 오래된 것이지만, 중복 된 노력이 아니라, 여기서 역사적 관심에서 벗어나기로 결정했습니다. 최신 테스트는 Panzer의 답변과 Nico Schlömer를 참조하십시오 .
대안에 대한 테스트
다음은 이러한 기능 중 일부가 여러 대안에 비해 성능이 향상되었음을 보여주는 테스트 배터리입니다. 여기에 표시된 모든 테스트는 Mac OS 10.12.5, Python 3.6.1 및 numpy
1.12.1을 실행하는 쿼드 코어 시스템에서 수행되었습니다 . 하드웨어와 소프트웨어의 변형은 다른 결과를 생성하는 것으로 알려져 있으므로 YMMV. 이 테스트를 스스로 실행하십시오!
정의 :
import numpy
import itertools
from functools import reduce
### Two-dimensional products ###
def repeat_product(x, y):
return numpy.transpose([numpy.tile(x, len(y)),
numpy.repeat(y, len(x))])
def dstack_product(x, y):
return numpy.dstack(numpy.meshgrid(x, y)).reshape(-1, 2)
### Generalized N-dimensional products ###
def cartesian_product(*arrays):
la = len(arrays)
dtype = numpy.result_type(*arrays)
arr = numpy.empty([len(a) for a in arrays] + [la], dtype=dtype)
for i, a in enumerate(numpy.ix_(*arrays)):
arr[...,i] = a
return arr.reshape(-1, la)
def cartesian_product_transpose(*arrays):
broadcastable = numpy.ix_(*arrays)
broadcasted = numpy.broadcast_arrays(*broadcastable)
rows, cols = numpy.prod(broadcasted[0].shape), len(broadcasted)
dtype = numpy.result_type(*arrays)
out = numpy.empty(rows * cols, dtype=dtype)
start, end = 0, rows
for a in broadcasted:
out[start:end] = a.reshape(-1)
start, end = end, end + rows
return out.reshape(cols, rows).T
# from https://stackoverflow.com/a/1235363/577088
def cartesian_product_recursive(*arrays, out=None):
arrays = [numpy.asarray(x) for x in arrays]
dtype = arrays[0].dtype
n = numpy.prod([x.size for x in arrays])
if out is None:
out = numpy.zeros([n, len(arrays)], dtype=dtype)
m = n // arrays[0].size
out[:,0] = numpy.repeat(arrays[0], m)
if arrays[1:]:
cartesian_product_recursive(arrays[1:], out=out[0:m,1:])
for j in range(1, arrays[0].size):
out[j*m:(j+1)*m,1:] = out[0:m,1:]
return out
def cartesian_product_itertools(*arrays):
return numpy.array(list(itertools.product(*arrays)))
### Test code ###
name_func = [('repeat_product',
repeat_product),
('dstack_product',
dstack_product),
('cartesian_product',
cartesian_product),
('cartesian_product_transpose',
cartesian_product_transpose),
('cartesian_product_recursive',
cartesian_product_recursive),
('cartesian_product_itertools',
cartesian_product_itertools)]
def test(in_arrays, test_funcs):
global func
global arrays
arrays = in_arrays
for name, func in test_funcs:
print('{}:'.format(name))
%timeit func(*arrays)
def test_all(*in_arrays):
test(in_arrays, name_func)
# `cartesian_product_recursive` throws an
# unexpected error when used on more than
# two input arrays, so for now I've removed
# it from these tests.
def test_cartesian(*in_arrays):
test(in_arrays, name_func[2:4] + name_func[-1:])
x10 = [numpy.arange(10)]
x50 = [numpy.arange(50)]
x100 = [numpy.arange(100)]
x500 = [numpy.arange(500)]
x1000 = [numpy.arange(1000)]
시험 결과:
In [2]: test_all(*(x100 * 2))
repeat_product:
67.5 µs ± 633 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
dstack_product:
67.7 µs ± 1.09 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
cartesian_product:
33.4 µs ± 558 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
cartesian_product_transpose:
67.7 µs ± 932 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
cartesian_product_recursive:
215 µs ± 6.01 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
cartesian_product_itertools:
3.65 ms ± 38.7 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
In [3]: test_all(*(x500 * 2))
repeat_product:
1.31 ms ± 9.28 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
dstack_product:
1.27 ms ± 7.5 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
cartesian_product:
375 µs ± 4.5 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
cartesian_product_transpose:
488 µs ± 8.88 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
cartesian_product_recursive:
2.21 ms ± 38.4 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
cartesian_product_itertools:
105 ms ± 1.17 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)
In [4]: test_all(*(x1000 * 2))
repeat_product:
10.2 ms ± 132 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
dstack_product:
12 ms ± 120 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
cartesian_product:
4.75 ms ± 57.1 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
cartesian_product_transpose:
7.76 ms ± 52.7 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
cartesian_product_recursive:
13 ms ± 209 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
cartesian_product_itertools:
422 ms ± 7.77 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
모든 경우 cartesian_product
에이 답변의 시작 부분에 정의 된대로 가장 빠릅니다.
임의의 수의 입력 배열을 받아들이는 함수의 경우 성능을 확인할 가치가 len(arrays) > 2
있습니다. ( cartesian_product_recursive
이 경우 오류가 발생 하는 이유를 확인할 수있을 때까지이 테스트에서 오류를 제거했습니다.)
In [5]: test_cartesian(*(x100 * 3))
cartesian_product:
8.8 ms ± 138 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
cartesian_product_transpose:
7.87 ms ± 91.5 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
cartesian_product_itertools:
518 ms ± 5.5 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
In [6]: test_cartesian(*(x50 * 4))
cartesian_product:
169 ms ± 5.1 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)
cartesian_product_transpose:
184 ms ± 4.32 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)
cartesian_product_itertools:
3.69 s ± 73.5 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
In [7]: test_cartesian(*(x10 * 6))
cartesian_product:
26.5 ms ± 449 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)
cartesian_product_transpose:
16 ms ± 133 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
cartesian_product_itertools:
728 ms ± 16 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
In [8]: test_cartesian(*(x10 * 7))
cartesian_product:
650 ms ± 8.14 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
cartesian_product_transpose:
518 ms ± 7.09 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
cartesian_product_itertools:
8.13 s ± 122 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
이러한 테스트에서 알 수 있듯이 cartesian_product
입력 배열 수가 4 개 이상으로 증가 할 때까지 경쟁력을 유지합니다. 그 후, cartesian_product_transpose
약간의 가장자리가 있습니다.
다른 하드웨어 및 운영 체제를 사용하는 사용자는 다른 결과를 볼 수 있습니다. 예를 들어, unutbu 보고서는 Ubuntu 14.04, Python 3.4.3 및 numpy
1.14.0.dev0 + b7050a9를 사용한 이러한 테스트에 대해 다음 결과를보고합니다 .
>>> %timeit cartesian_product_transpose(x500, y500)
1000 loops, best of 3: 682 µs per loop
>>> %timeit cartesian_product(x500, y500)
1000 loops, best of 3: 1.55 ms per loop
아래에서는 이러한 라인을 따라 실행 한 초기 테스트에 대해 자세히 설명합니다. 이러한 접근 방식의 상대적 성능은 시간이 지남에 따라 하드웨어 및 버전이 다른 Python 및에 따라 변경되었습니다 numpy
. 최신 버전의을 사용하는 사람들에게는 즉시 유용하지는 않지만 numpy
이 답변의 첫 번째 버전 이후 변경된 사항을 보여줍니다.
간단한 대안 : meshgrid
+dstack
현재 응답 사용을 허용 tile
하고 repeat
두 배열 함께 방송한다. 그러나 meshgrid
기능은 실질적으로 동일합니다. 다음의 출력의 tile
와 repeat
전치에 전달되기 전에는 :
In [1]: import numpy
In [2]: x = numpy.array([1,2,3])
...: y = numpy.array([4,5])
...:
In [3]: [numpy.tile(x, len(y)), numpy.repeat(y, len(x))]
Out[3]: [array([1, 2, 3, 1, 2, 3]), array([4, 4, 4, 5, 5, 5])]
그리고 여기에 출력이 있습니다 meshgrid
:
In [4]: numpy.meshgrid(x, y)
Out[4]:
[array([[1, 2, 3],
[1, 2, 3]]), array([[4, 4, 4],
[5, 5, 5]])]
보시다시피 거의 동일합니다. 정확히 같은 결과를 얻으려면 결과의 형태 만 변경하면됩니다.
In [5]: xt, xr = numpy.meshgrid(x, y)
...: [xt.ravel(), xr.ravel()]
Out[5]: [array([1, 2, 3, 1, 2, 3]), array([4, 4, 4, 5, 5, 5])]
오히려이 시점에서 재편보다하지만, 우리의 출력을 전달할 수 meshgrid
에 대한 dstack
몇 가지 작업을 저장하고 나중에 모양 변경을 :
In [6]: numpy.dstack(numpy.meshgrid(x, y)).reshape(-1, 2)
Out[6]:
array([[1, 4],
[2, 4],
[3, 4],
[1, 5],
[2, 5],
[3, 5]])
이 의견 의 주장과 달리 나는 다른 입력이 다른 모양의 출력을 생성한다는 증거를 보지 못했습니다. 위에서 알 수 있듯이 매우 유사한 일을하므로 그렇게하면 상당히 이상합니다. 반례를 찾으면 알려주십시오.
테스팅 meshgrid
+ dstack
vs. repeat
+transpose
이 두 가지 접근 방식의 상대적 성능은 시간이 지남에 따라 변경되었습니다. 이전 버전의 Python (2.7)에서 작은 입력 의 경우 meshgrid
+ dstack
를 사용한 결과 가 눈에 띄게 빨라졌습니다. (이 테스트는이 답변의 이전 버전에서 작성된 것입니다.) 정의 :
>>> def repeat_product(x, y):
... return numpy.transpose([numpy.tile(x, len(y)),
numpy.repeat(y, len(x))])
...
>>> def dstack_product(x, y):
... return numpy.dstack(numpy.meshgrid(x, y)).reshape(-1, 2)
...
적당한 크기의 입력의 경우 속도가 크게 향상되었습니다. 그러나 numpy
최신 컴퓨터에서 최신 버전의 Python (3.6.1) 및 (1.12.1)을 사용하여 이러한 테스트를 다시 시도했습니다 . 두 가지 접근 방식은 이제 거의 동일합니다.
오래된 테스트
>>> x, y = numpy.arange(500), numpy.arange(500)
>>> %timeit repeat_product(x, y)
10 loops, best of 3: 62 ms per loop
>>> %timeit dstack_product(x, y)
100 loops, best of 3: 12.2 ms per loop
새로운 테스트
In [7]: x, y = numpy.arange(500), numpy.arange(500)
In [8]: %timeit repeat_product(x, y)
1.32 ms ± 24.7 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
In [9]: %timeit dstack_product(x, y)
1.26 ms ± 8.47 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
항상 그렇듯이 YMMV는 최신 버전의 Python과 numpy에서 서로 호환 가능하다는 것을 나타냅니다.
일반화 된 제품 기능
일반적으로 내장 입력 기능을 사용하면 작은 입력의 경우 더 빠르지 만 입력이 큰 경우 특수 목적 기능이 더 빠를 수 있습니다. 또한 일반화 된 N 차원 제품에 대한, tile
그리고 repeat
그들은 분명 더 높은 차원의 유사 물질이 없기 때문에, 도움이되지 않습니다. 따라서 목적에 맞는 기능의 동작도 조사 할 가치가 있습니다.
대부분의 관련 테스트는이 답변의 시작 부분에 나타나지만 다음은 이전 버전의 Python 및 numpy
비교를 위해 수행 된 몇 가지 테스트 입니다.
cartesian
에 정의 된 함수를 다른 대답은 더 큰 입력에 대해 꽤 잘 수행하는 데 사용됩니다. (이 호출 한 함수와 동일합니다 cartesian_product_recursive
위.) 비교하기 위해 cartesian
에 dstack_prodct
우리가 두 가지 차원을 사용합니다.
여기서도 이전 테스트에는 큰 차이가 있었지만 새 테스트에는 거의 차이가 없었습니다.
오래된 테스트
>>> x, y = numpy.arange(1000), numpy.arange(1000)
>>> %timeit cartesian([x, y])
10 loops, best of 3: 25.4 ms per loop
>>> %timeit dstack_product(x, y)
10 loops, best of 3: 66.6 ms per loop
새로운 테스트
In [10]: x, y = numpy.arange(1000), numpy.arange(1000)
In [11]: %timeit cartesian([x, y])
12.1 ms ± 199 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
In [12]: %timeit dstack_product(x, y)
12.7 ms ± 334 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
이전과 마찬가지로 dstack_product
여전히 cartesian
작은 규모로 뛰고 있습니다.
새 테스트 ( 이전의 중복 테스트는 표시되지 않음 )
In [13]: x, y = numpy.arange(100), numpy.arange(100)
In [14]: %timeit cartesian([x, y])
215 µs ± 4.75 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
In [15]: %timeit dstack_product(x, y)
65.7 µs ± 1.15 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
이 구별은 흥미롭고 기록할만한 가치가 있다고 생각합니다. 그러나 그들은 결국 학문적입니다. 이 답변의 시작 부분에있는 테스트에서 알 수 있듯이이 모든 버전은 거의 항상 cartesian_product
이 답변의 맨 처음에 정의 된 것보다 느립니다.이 질문에 대한 답변 중 가장 빠른 구현보다 약간 느립니다.