[pandas] 7. DatarFrameの欠損値(NaN, None)について

Pandas

はじめに

DataFrameにおける欠損値(NaN, None)の性質について説明する。

解説

pandasのDataframeでの欠損値(NaN, None)は、np.arrayとは多少異なる点がある。

モジュールのインポート

NaN, Noneを要素として持つDataFrameの生成

DataFrameでは、NoneがNaNに変換される。データ型もfloat64となる。

NaNの影響によるデータ型の変化

int型のDataFrameの場合

要素の一部をNaNに変化させた場合、データ型がint64からfloat64に変化する。これは、NaNが浮動小数点値として扱われているためである。

bool型のDataFrameの場合

同様にbool型の配列もNaNによる影響で、float64型となる。

NumpyにおけるNan

numpyにおけるNanについては下記記事で説明している。

[NumPy] 11. NumPy配列のNaNに関するいろいろな処理
np.arrayにおけるNaNに関する処理について、いろいろと説明する。

参考

コードをダウンロード(.pyファイル)

コードをダウンロード(.ipynbファイル)

コメント