[pandas] 1.1次元データ構造 Seriesについて

Pandas

はじめに

pandasの1次元データ構造であるSeriesについて、Seriesの作成、文字列インデックスの設定や数字インデックスの設定について説明する。

解説

モジュールのインポート

pandasはas pdとするのが一般的となっている。

Seriesの生成

Seriesにしたいリストをpd.Series()で囲めば、↑のような形式のSeriesが得られる。インデックスはindex=['a','b','c']のように設定する。

NumPy配列への変換

Seriesに.valuesとすることでnp.arrayに変換することができる。

インデックスの取得

Seriesに.indexとすることで、インデクスを得ることができる。

要素の参照

スライス表記で要素を選択できる。
[0]で0番目の要素、[1]で1番目の要素を参照できる。
インデックスを直接指定することでも要素を参照できる。

.valuesで得たnp.arrayと.indexで得たインデックスも同様にスライスで値を参照できる。

インデックスに数字を用いる

index=[10,20,30]のようにインデックスに任意の数字を使うことができる。

要素の参照はインデックスの値を使うことでできるが、暗黙的なインデックスによる参照はできない。

辞書からSeriesの作成

辞書形式のデータをSeriesとして読み込むと、キーがインデクスとなり、値が要素となったSeriesが得られる。

要素の参照も上記と同様にできる。

値がすべて等しいSeriesの作成

要素が一つでインデックスが複数ある場合は、すべての要素の値が等しいSeriesが得られる。

参考

コードをダウンロード(.pyファイル) コードをダウンロード(.ipynbファイル)

コメント