[pandasの使い方] 1.pandasのSeries

Pandas
スポンサーリンク

pandasの1次元配列(Series)について

モジュールのインポート

pandasはas pdとするのが一般的。

Seriesの生成

Seriesにしたい配列をpd.Series()で囲めば、↑のような形式のSeriesとなる。

NumPy配列への変換

pandasのSeriesに.valuesとすることでnp.arrayに変換することができる。

インデクスの参照

data.indexとすることで、インデクスに関する情報を得ることができる。

要素の参照

pythonで同じみの[]表記で要素を選択できる。

[0]で0番目の要素、[1:]で1番目から最後までの要素を参照できる。

インデクスに文字列

index=[‘A’,’B’,’C’,’D’]のようにすることで、インデクスを文字列にすることができる。

[]内にインデクス名を入れることで要素を参照できる。

順不同な数字によるインデクス

インデクスは自由度が高く、順不同な数字でも作成できる。

DATA[3]とすると、インデクスが3の部分の要素が参照される。3番目の要素ではないことに注意が必要。

辞書からSeriesの作成

辞書形式のデータをSeriesとして読み込むと、キーがインデクスとなり、値が要素となったSeriesが得られる。

辞書のようにして、要素にアクセスできる。さらにSeries形式なので、スライス表記でも要素を参照できる。

Seriesオブジェクトの作成

Seriesの作成方法について紹介する。

pd.Series()でリストを囲むことで作成できる。

要素が一個でインデクスが複数ある場合は、すべての要素が等しいSeriesが得られる。

インデクスを指定すると、それが優先され、インデクスにない要素は無視される。
ここでは、index=[3, 2]としているので、インデクスの1は反映されていない。

参考

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

コメント