[pandas] 15. 異なるインデックスをもつDataFrameの連結(concat(), append())

Pandas

はじめに

pandasで複数のDataFrameを連結してひとつにするには、concat(), append()が用いられる。ここでは、concat()におけるjoinの使い方、append()について説明する。

解説

モジュールのインポート

データの生成

index=[1,2], columns=[‘a’,’b’,’c’]のDataFrame (df_a)と、index=[3,4], columns=[‘b’,’c’,’d’]のDataFrame(df_b)を作成する。

.concat()による連結

DataFrame中の要素がない部分はNaNとなる。

sortをTrueにすると、カラム名が昇順にソートされる。

インデックスをソートしたい場合は、sort_indexを用いる。

共通するインデクスの部分だけ結合

join=’inner’とすることで、共通するカラム名の部分のみが結合したDataFrameが得られる。

.append()による連結

appendにより、pd.concat([df_a, df_b])としたときと同じ結果が得られる。appendの順を変えることで結果も変わってくる。

appendでもignore_indexを用いてインデックスを振り直すことができる。

参考

pandas.concat — pandas 1.0.5 documentation
pandas.DataFrame.append — pandas 1.0.5 documentation
コードをダウンロード(.pyファイル)コードをダウンロード(.ipynbファイル)

コメント