행렬의 각 행에 numpy.linalg.norm을 적용하는 방법은 무엇입니까?


82

2D 행렬이 있고 각 행의 표준을 취하고 싶습니다. 그러나 내가 numpy.linalg.norm(X)직접 사용할 때는 전체 매트릭스의 표준을 취합니다.

for 루프를 사용하여 각 행의 norm을 취한 다음 each의 norm을 취할 수 X[i]있지만 30k 행이 있기 때문에 시간이 많이 걸립니다.

더 빠른 방법을 찾기위한 제안 사항이 있습니까? 아니면 np.linalg.norm행렬의 각 행에 적용 할 수 있습니까?

답변:


87

같은 것을 유의 perimosocordiae 쇼 NumPy와 버전 1.9로, np.linalg.norm(x, axis=1)2 계층 놈을 계산하는 가장 빠른 방법이다.


L2-norm을 계산하는 경우 직접 계산할 수 있습니다 ( axis=-1인수를 사용하여 행을 합산).

np.sum(np.abs(x)**2,axis=-1)**(1./2)

물론 Lp-norms도 비슷하게 계산할 수 있습니다.

np.apply_along_axis편리하지는 않지만 보다 상당히 빠릅니다 .

In [48]: %timeit np.apply_along_axis(np.linalg.norm, 1, x)
1000 loops, best of 3: 208 us per loop

In [49]: %timeit np.sum(np.abs(x)**2,axis=-1)**(1./2)
100000 loops, best of 3: 18.3 us per loop

다른 ord형태 norm도 직접 계산할 수 있습니다 (비슷한 속도 향상) :

In [55]: %timeit np.apply_along_axis(lambda row:np.linalg.norm(row,ord=1), 1, x)
1000 loops, best of 3: 203 us per loop

In [54]: %timeit np.sum(abs(x), axis=-1)
100000 loops, best of 3: 10.9 us per loop

8
어쨌든 x를 제곱하면 왜 np.abs (x)를 수행합니까?
Patrick

10
@Patrick : dtype x이 복잡하면 차이가 있습니다. 예를 들어, if x = np.array([(1+1j,2+1j)])then np.sum(np.abs(x)**2,axis=-1)**(1./2)is array([ 2.64575131]), while np.sum(x**2,axis=-1)**(1./2)is array([ 2.20320266+1.36165413j]).
unutbu 2013 년

3
@perimosocordiae는 게시 업데이 numpy.linalg.norm그와 함께 새로운 axis 인수, 현재 가장 빠른 방법입니다.
Ioannis Filippidis 2013

행렬에 열 단위의 규범을 적용하려면 어떻게해야합니까?
Gunjan Naik는

@ user3515225 : np.linalg.norm(x, axis=0). 는 axis축이 합산되고 지칭한다. 그래서 2 차원 배열의 경우, 0 축은 행 지칭 axis=0원인 norm각 고정 열의 행을 합계.
unutbu

54

numpy 업데이트로 인해 오래된 질문을 부활시킵니다. 1.9 릴리스부터 numpy.linalg.norm이제 axis인수를 허용합니다 . [ 코드 , 문서 ]

이것은 마을에서 새로운 가장 빠른 방법입니다.

In [10]: x = np.random.random((500,500))

In [11]: %timeit np.apply_along_axis(np.linalg.norm, 1, x)
10 loops, best of 3: 21 ms per loop

In [12]: %timeit np.sum(np.abs(x)**2,axis=-1)**(1./2)
100 loops, best of 3: 2.6 ms per loop

In [13]: %timeit np.linalg.norm(x, axis=1)
1000 loops, best of 3: 1.4 ms per loop

그리고 그것이 같은 것을 계산한다는 것을 증명하기 위해 :

In [14]: np.allclose(np.linalg.norm(x, axis=1), np.sum(np.abs(x)**2,axis=-1)**(1./2))
Out[14]: True

16

받아 들여지는 대답보다 훨씬 빨리 NumPy의 einsum을 사용하는 것입니다 .

numpy.sqrt(numpy.einsum('ij,ij->i', a, a))

로그 스케일에 유의하십시오.

여기에 이미지 설명 입력


플롯을 재현하는 코드 :

import numpy
import perfplot


def sum_sqrt(a):
    return numpy.sqrt(numpy.sum(numpy.abs(a) ** 2, axis=-1))


def apply_norm_along_axis(a):
    return numpy.apply_along_axis(numpy.linalg.norm, 1, a)


def norm_axis(a):
    return numpy.linalg.norm(a, axis=1)


def einsum_sqrt(a):
    return numpy.sqrt(numpy.einsum("ij,ij->i", a, a))


perfplot.show(
    setup=lambda n: numpy.random.rand(n, 3),
    kernels=[sum_sqrt, apply_norm_along_axis, norm_axis, einsum_sqrt],
    n_range=[2 ** k for k in range(20)],
    xlabel="len(a)",
)

2
그게 무엇인지 설명 하시겠습니까?
jhin

6

다음을 시도하십시오.

In [16]: numpy.apply_along_axis(numpy.linalg.norm, 1, a)
Out[16]: array([ 5.38516481,  1.41421356,  5.38516481])

a2D 배열은 어디에 있습니까 ?

위는 L2 표준을 계산합니다. 다른 표준의 경우 다음과 같이 사용할 수 있습니다.

In [22]: numpy.apply_along_axis(lambda row:numpy.linalg.norm(row,ord=1), 1, a)
Out[22]: array([9, 2, 9])
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.