[pandasの使い方] 4. Seriesにおけるデータの選択(loc, iloc)

Pandas
スポンサーリンク

loc, ilocを用いたSeriesにおけるデータの選択

pandasのSeriesで要素にアクセスするには?

pandasのSeriesの要素へのアクセス方法は、np.arrayとは異なる点があるため注意が必要。

明示的なインデクスによるスライス

インデクスが文字列の場合、明示的なインデクスによるスライスができる。[‘A’:’C’]とした場合、Cも含まれる。

間接的なインデクスによるスライス

間接的なインデクスである整数でスライスする場合、pythonの標準的な手法でのスライスとなるため、[0:2]としてもCは含まれない。

マスキングによる選択

マスクにより、データの選択ができる。

ファンシーインデックスによる選択

np.arrayと同様にファンシーインデックスが適用できる。

loc, ilocの使い方

loc, ilocを使わない場合

DATA[3]とした場合、明示的なインデクスである3のときの要素が得られるが、DATA[1:3]とスライスした場合、間接的なインデクスが適用され、B,Cだけが得られる。

locを使用した場合

locを使用することで明示的なインデクスで要素にアクセスできる。

ilocを使用した場合

ilocによる間接的なインデクスにより、要素にアクセスできる。そのため、DATA.iloc[3]では3番目の要素である’D’が得られる。

参考

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

コメント