NumPyによる配列の集約
合計
pythonの組み込み関数(sum)
pythonの標準ライブラリにリスト内の数値の合計を求めるsumがある。
np.sum()
np.sum()も同様にarray内の数値の合計を求める。
実行時間の違い
この場合、np.sum()のほうが210倍はやい。
最大、最小
np.min(), np.max()
np.min(), np.max()でarray内の最小値と最大値を求めることができる。
配列オブジェクトのメソッド
配列Bに対して、B.min()のようにすることで、np.min(B)と同じ意味になる。
多次元配列の集約
多次元配列に対しても同様の処理を行うことができて、C.sum()で配列のすべての要素の合計値が得られる。
集約する行、列の選択
axis=0とすることで、列方向の計算、
axis=1とすることで、行方向の計算ができる。
その他の集約関数
最大値のindex(np.argmax)
argmaxで最大値のindexが取得できる。多次元配列の場合は1次元配列のしたときのindexが得られる。
値の確認は、ravel()で1次元にしてからindexを指定することで可能。
最小値のindex(np.argmin)
最小値のindexが得られる。
平均値 (np.mean)
np.meanで配列の平均値が得られる。
中央値 (np.median)
np.medianで配列の中央値が得られる。
標準偏差 (np.std)
np.stdで配列の標準偏差が得られる。
分散 (np.var)
np.varにより配列の分散が得られる。
積 (np.prod)
np.prodで配列の積が得られる。
参考
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
コメント