빈 numpy 배열에 새 행을 추가하는 방법


158

표준 파이썬 배열을 사용하여 다음을 수행 할 수 있습니다.

arr = []
arr.append([1,2,3])
arr.append([4,5,6])
# arr is now [[1,2,3],[4,5,6]]

그러나 나는 numpy에서 같은 일을 할 수 없습니다. 예를 들면 다음과 같습니다.

arr = np.array([])
arr = np.append(arr, np.array([1,2,3]))
arr = np.append(arr, np.array([4,5,6]))
# arr is now [1,2,3,4,5,6]

나는 또한 조사 vstack했지만 vstack빈 배열에서 사용할 때 나는 얻는다 :

ValueError: all the input array dimensions except for the concatenation axis must match exactly

그렇다면 numpy의 빈 배열에 새 행을 어떻게 추가합니까?


1
비어 있다면 왜 귀찮게합니까? 첫 번째 행만 보유한 배열에서 시작하십시오.
jonrsharpe

10
빈 numpy 배열에 추가 할 수 있는지 알고 싶습니다. 추가 작업이 루프에 있기 때문에 이와 같은 코드를 작성하는 것이 더 깨끗한 경우가 있습니다.
Tony Stark

5
numpy 배열이 작동하는 방식을 고려할 때 빈 배열을 만든 다음 데이터를 넣는 것이 훨씬 좋습니다. 예 : stackoverflow.com/questions/568962/…
jonrsharpe

답변:


227

원하는 배열을 "시작"하는 방법은 다음과 같습니다.

arr = np.empty((0,3), int)

빈 배열이지만 적절한 차원이 있습니다.

>>> arr
array([], shape=(0, 3), dtype=int64)

그런 다음 축 0을 따라 추가하십시오.

arr = np.append(arr, np.array([[1,2,3]]), axis=0)
arr = np.append(arr, np.array([[4,5,6]]), axis=0)

그러나 @jonrsharpe가 옳습니다. 실제로 루프에 추가하려는 경우 첫 번째 예제와 같이 목록에 추가 한 다음 끝에 numpy 배열로 변환하는 것이 훨씬 빠릅니다. 루프 중에 의도 된 것 :

In [210]: %%timeit
   .....: l = []
   .....: for i in xrange(1000):
   .....:     l.append([3*i+1,3*i+2,3*i+3])
   .....: l = np.asarray(l)
   .....: 
1000 loops, best of 3: 1.18 ms per loop

In [211]: %%timeit
   .....: a = np.empty((0,3), int)
   .....: for i in xrange(1000):
   .....:     a = np.append(a, 3*i+np.array([[1,2,3]]), 0)
   .....: 
100 loops, best of 3: 18.5 ms per loop

In [214]: np.allclose(a, l)
Out[214]: True

numpythonic 방법은 응용 프로그램에 따라 다르지만 다음과 같습니다.

In [220]: timeit n = np.arange(1,3001).reshape(1000,3)
100000 loops, best of 3: 5.93 µs per loop

In [221]: np.allclose(a, n)
Out[221]: True

이 10 ^ 5 또는 10 ^ 6 번을해야한다면 어떻게해야합니까? 이러한 방법 중 어느 것도 보유하지 않는 것 같습니다. 어떠한 제안?
Rho Phi

@Roberto, 일반적으로 사전에 배열의 크기 또는 모양을 결정하는 방법이 있습니다 (적어도 값이 바람직합니다). 그렇게 할 수 있다고 생각하십니까? 추가 작업은 실제로 한두 번의 작업이어야합니다.
askewchan

때로는 치수를 추측 할 수 없으면 인생입니다. 그러나 충분히 큰 배열을 할당하고 해당 뷰에 값을 제공 할 수 있습니다. "마스크"하는 방법을 찾아야하는 원하지 않는 값이 있기 때문에 마음에 들지 않습니다. 마스킹이라는 아이디어는 실제로 내 취향에 맞지 않습니다.
Rho Phi

마스크 할 필요가 없으며 슬라이스하십시오! a = a[:N] 나는 당신이 그것을 벡터화하는 방법을 찾거나 (도움이 필요하면 당신의 세부 사항에 새로운 질문을 게시) 루프가 끝날 때까지 목록을 사용해야한다고 강력하게 생각합니다.
askewchan

29

내 해결책은 다음과 같습니다.

arr = []
arr.append([1,2,3])
arr.append([4,5,6])
np_arr = np.array(arr)

결과 배열은 dtype 객체를 가지고 있는데, 어떤 경우에는 허용되지 않습니다
zer0fool

26

이 경우 np.hstack 및 np.vstack 함수를 사용할 수 있습니다.

arr = np.array([])
arr = np.hstack((arr, np.array([1,2,3])))
# arr is now [1,2,3]

arr = np.vstack((arr, np.array([4,5,6])))
# arr is now [[1,2,3],[4,5,6]]

np.concatenate 함수를 사용할 수도 있습니다.

건배


7
두 번째 배열의 치수가 1보다 크거나 같거나 ((2, 2)) 작동하지 않습니다. 연결로 빈 배열을 작성하는 경우 경계 사례를 피할 수있는 방법이 없습니다.
Taozi

매번 치수를 확인해야하므로 좋은 해결책이 아닙니다.
SKR

1

커스텀 dtype 정의를 사용하면 나를 위해 일한 것은 다음과 같습니다.

import numpy

# define custom dtype
type1 = numpy.dtype([('freq', numpy.float64, 1), ('amplitude', numpy.float64, 1)])
# declare empty array, zero rows but one column
arr = numpy.empty([0,1],dtype=type1)
# store row data, maybe inside a loop
row = numpy.array([(0.0001, 0.002)], dtype=type1)
# append row to the main array
arr = numpy.row_stack((arr, row))
# print values stored in the row 0
print float(arr[0]['freq'])
print float(arr[0]['amplitude'])

1

루프에서 배열에 새 행을 추가하는 경우 빈 배열을 초기화하는 대신 루프에서 처음으로 배열을 직접 할당하십시오.

for i in range(0,len(0,100)):
    SOMECALCULATEDARRAY = .......
    if(i==0):
        finalArrayCollection = SOMECALCULATEDARRAY
    else:
        finalArrayCollection = np.vstack(finalArrayCollection,SOMECALCULATEDARRAY)

이것은 주로 배열의 모양을 알 수 없을 때 유용합니다


0

for 루프를하고 싶지만 askewchan의 방법으로는 잘 작동하지 않으므로 수정했습니다.

x=np.empty((0,3))
y=np.array([1 2 3])
for i in ...
x = vstack((x,y))
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.