내 numpy 배열은 np.nan
누락 된 값을 지정 하는 데 사용 합니다. 데이터 세트를 반복하면서 이러한 누락 된 값을 감지하고 특수한 방식으로 처리해야합니다.
에서 지원하는 유형의 하위 집합이 아닌 numpy.isnan(val)
한 잘 작동 val
하는 numpy.isnan()
. 예를 들어 문자열 필드에서 누락 된 데이터가 발생할 수 있으며이 경우 다음과 같은 결과가 발생합니다.
>>> np.isnan('some_string')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: Not implemented for this type
예외를 잡아서 반환하는 값 비싼 래퍼를 작성하는 것 외에 False
이것을 우아하고 효율적으로 처리하는 방법이 있습니까?
@Marius :
—
Dun Peal 2013 년
pandas.isnull()
완벽하게 작동하는 것 같습니다. 내가 현재 다루는 유일한 데이터 유형 numpy.isnan()
은 문자열이며 pandas.isnull()
잘 처리합니다. 사실, 내가 던진 모든 임의의 객체를 잘 처리하는 것 같습니다. 우려했던 특정 문제가 있었습니까? 그렇지 않으면 최소한 pandas 사용자에게는 정식 답변처럼 보이기 때문에 완전한 답변으로 의견을 제출할 수 있습니다.
pandas
haspandas.isnull()
: 그것이 귀하의 요구를 충족하는지 확실하지 않으므로 일부 예제 데이터가 좋을 수 있습니다.