[pandas] 3. DataFrameにおけるインデックスについて

Pandas

はじめに

pandasのDataFrameにおけるインデックスについて、Indexオブジェクトの性質、reset_indexによるインデックスの振りなおし、DataFrameのインデックスの変更方法について説明する。

解説

Indexオブジェクトとは?

pandasのSeriesとDataFrameには、データを参照するためにインデックスがある。これらは通常の方法で変更できない配列であり、可能な操作を把握しておく必要がある。

モジュールのインポート

インデックスの作成

pd.index()にリストをいれることでインデックスを作成できる。

indexオブジェクトは、リストオブジェクトのような値の変更はできない。インデックスを変更しようとすると、#TypeError: Index does not support mutable operationsというエラーが返ってくる。

インデックスのスライス

標準的な手法でスライスが可能となっている。

インデックスに加算

インデックスに値を加えることができる。

インデックスオブジェクトを用いたDataFrameの作成

reset_indexによるインデックスの振りなおし

reset_indexにより、インデックスがリセットされる。前のインデックスは一列目のデータに組み込まれる。

reset_indexでdrop=Trueとすると、前のインデックスを削除したDataFrameが得られる。

.indexによるインデックスの変更

DataFrame.indexで配列を指定すれば、インデックスを変更することができる。

np.arrayもインデックスにすることができる。

renameによるインデックスの一部の変更

renameを使うことでインデックス、カラム名の一部を変えられる。
index={1: ‘A’}のように{今のインデックス:新しいインデックス}のように指定する。

参考

pandas.DataFrame.reset_index — pandas 2.2.2 documentation
pandas.DataFrame.rename — pandas 2.2.2 documentation
コードをダウンロード(.pyファイル) コードをダウンロード(.ipynbファイル)

コメント