[pandasの使い方] 3.pandasのIndex

Pandas
スポンサーリンク

pandasのインデクス(Index)について

Indexオブジェクトとは?

pandasのSeriesとDataframeは、データを参照するために必要なインデクスを明示的にもつ。これらは通常の方法で変更できない配列であり、可能な操作を把握しておく必要がある。

インデクスの作成

pd.index()に配列をいれることで容易にインデクスを作成できる。

インデクスのスライス

pythonの標準的な手法でスライスが可能。

インデクスオブジェクトが持つ属性

.sizeや.shape, .dtypeといったnumpy配列と同様の属性をもつ。

インデクスは変更できない配列

インデクスを変更しようとすると、#TypeError: Index does not support mutable operations
というエラーが返ってくる。意図しないインデクスの変更を防ぐため、インデクスは変更できない仕様となっている。

インデクスの集合演算

和集合

indAとindBを以上のようにすると、和集合により、indAまたはindBに少なくとも1つ存在するインデクスが返ってくる。

積集合

indA & indBにより、積集合となり、indAとindBの両方共に含まれるインデクスが返ってくる。

対称差

indA ^ indBで、対称差となり、indAに含まれてindBに含まれないインデクスと、indBに含まれてindAに含まれないインデクスを得ることができる。

参考

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

コメント