None
행 값 이있는 PySpark 데이터 프레임을 필터링하려고 합니다.
df.select('dt_mvmt').distinct().collect()
[Row(dt_mvmt=u'2016-03-27'),
Row(dt_mvmt=u'2016-03-28'),
Row(dt_mvmt=u'2016-03-29'),
Row(dt_mvmt=None),
Row(dt_mvmt=u'2016-03-30'),
Row(dt_mvmt=u'2016-03-31')]
문자열 값으로 올바르게 필터링 할 수 있습니다.
df[df.dt_mvmt == '2016-03-31']
# some results here
그러나 이것은 실패합니다.
df[df.dt_mvmt == None].count()
0
df[df.dt_mvmt != None].count()
0
그러나 각 카테고리에는 확실히 가치가 있습니다. 무슨 일이야?