[NumPyの使い方] 5. np.sum, np.std などの集約関数

NumPy
スポンサーリンク

NumPyによる配列の集約

合計 

pythonの組み込み関数(sum)

pythonの標準ライブラリにリスト内の数値の合計を求めるsumがある。

np.sum()

np.sum()も同様にarray内の数値の合計を求める。

実行時間の違い

この場合、np.sum()のほうが210倍はやい。

最大、最小

np.min(), np.max()

np.min(), np.max()でarray内の最小値と最大値を求めることができる。

配列オブジェクトのメソッド

配列Bに対して、B.min()のようにすることで、np.min(B)と同じ意味になる。

多次元配列の集約

多次元配列に対しても同様の処理を行うことができて、C.sum()で配列のすべての要素の合計値が得られる。

集約する行、列の選択

axis=0とすることで、列方向の計算、
axis=1とすることで、行方向の計算ができる。

その他の集約関数

最大値のindex(np.argmax)

argmaxで最大値のindexが取得できる。多次元配列の場合は1次元配列のしたときのindexが得られる。

値の確認は、ravel()で1次元にしてからindexを指定することで可能。

最小値のindex(np.argmin)

最小値のindexが得られる。

平均値 (np.mean)

np.meanで配列の平均値が得られる。

中央値 (np.median)

np.medianで配列の中央値が得られる。

標準偏差 (np.std)

np.stdで配列の標準偏差が得られる。

分散 (np.var)

np.varにより配列の分散が得られる。

積 (np.prod)

np.prodで配列の積が得られる。

参考

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

コメント