[pandasの使い方] 6. データの操作

Pandas
スポンサーリンク
スポンサーリンク

Series, DataFrameにおけるデータの操作

pandasのSeries, DataFrameでデータを操作するには?

pandasのDataframeでのデータの操作は、基本的にnp.arrayと同じだが、欠損値がある場合は異なる点があるので注意が必要。

Seriesにおけるデータの操作

計算結果は別のオブジェクトとなる。

DataFrameにおけるデータの操作

DataFrameのインデクス、カラム名はそのまま同じものが適用される。

欠損値を含む計算

Aにはインデクス[4]がなく、Bにはインデクス[1]がないため、それぞれのインデクスの計算結果がNaNになっている。

fill_valueで欠損値を穴埋

fill_value=1とすることで、Aのインデクス[4]、Bのインデクス[1]がを1とした場合の計算ができる。

計算によるインデクスの整列

Xのカラム名はB,A,C,Dの順となっている。

ここでX+Yの計算をすると、カラム名が同じカラムで計算が行われ、カラム名の順がA,B,C,Dとなる。

fill_valueで欠損値を穴埋(DataFrame)

X.stack()とすることでXのDataFrame全体に対する計算ができる。
ここでは、.median()とすることでXの中央値をfill_valueの値とする。

X.multiply(Y, fill_value=fill)により、Yにないカラム(C,D)にfill_valueである4.0があるとして計算が行われる。
multiplyなのでX ✕ Yが各要素ごとに計算されて、その結果が出力される。

スポンサーリンク

参考

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

スポンサーリンク
Pandaspython
スポンサーリンク
この記事をシェアする
sabopy.comをフォローする
スポンサーリンク
サボテンパイソン

コメント