はじめに
DataFrameにおける欠損値(NaN, None)の性質について説明する。
解説
pandasのDataframeでの欠損値(NaN, None)は、np.arrayとは多少異なる点がある。
モジュールのインポート
NaN, Noneを要素として持つDataFrameの生成
DataFrameでは、NoneがNaNに変換される。データ型もfloat64となる。
NaNの影響によるデータ型の変化
int型のDataFrameの場合
要素の一部をNaNに変化させた場合、データ型がint64からfloat64に変化する。これは、NaNが浮動小数点値として扱われているためである。
bool型のDataFrameの場合
同様にbool型の配列もNaNによる影響で、float64型となる。
NumpyにおけるNan
numpyにおけるNanについては下記記事で説明している。
[NumPy] 11. NumPy配列のNaNに関するいろいろな処理
np.arrayにおけるNaNに関する処理について、いろいろと説明する。
コメント