はじめに
pandasで複数のDataFrameを連結してひとつにするには、concat(), append()が用いられる。ここでは、concat()におけるjoinの使い方、append()について説明する。
解説
モジュールのインポート
データの生成
index=[1,2], columns=[‘a’,’b’,’c’]のDataFrame (df_a)と、index=[3,4], columns=[‘b’,’c’,’d’]のDataFrame(df_b)を作成する。
.concat()による連結
DataFrame中の要素がない部分はNaNとなる。
sortをTrueにすると、カラム名が昇順にソートされる。
インデックスをソートしたい場合は、sort_index
を用いる。
共通するインデクスの部分だけ結合
join=’inner’とすることで、共通するカラム名の部分のみが結合したDataFrameが得られる。
.append()による連結
appendにより、pd.concat([df_a, df_b])としたときと同じ結果が得られる。appendの順を変えることで結果も変わってくる。
appendでもignore_indexを用いてインデックスを振り直すことができる。
参考
pandas.concat — pandas 2.2.3 documentation
404 Not Found
コメント