はじめに
sklearnのdatasets.make_gaussian_quantiles
で等方性なガウス分布に従う分類用のデータを作成することができる。ここでは各種パラメータが生成するデータに及ぼす影響について説明する。
解説
モジュールのインポートなど
バージョン
n_samples
n_samplesを変化させることでサンプル数を変えることができる。
![](https://sabopy.com/wp/wp-content/uploads/2021/01/n_samples-2-1.png)
mean
分布の平均値を設定できる。(2,2)のようにタプルで指定する。Noneの場合、(0,0)となる。
![](https://sabopy.com/wp/wp-content/uploads/2021/01/mean-1.png)
cov
共分散行列はこの値に単位行列をかけたものになる。
![](https://sabopy.com/wp/wp-content/uploads/2021/01/cov-1.png)
n_features
データの列数を変えることができる。
n_classes
n_classesを変えることでクラス数を変えることができる。
![](https://sabopy.com/wp/wp-content/uploads/2021/01/n_classes-1-1.png)
random_state
random_stateを変えることで再現可能な乱数を生成することができる。
![](https://sabopy.com/wp/wp-content/uploads/2021/01/random_state-2-1.png)
shuffle
shuffleをFalseとすることでラベルがソートされたデータを得ることができる。デフォルトはTrue.
コードをダウンロード(.pyファイル) コードをダウンロード(.ipynbファイル)参考
![](https://scikit-learn/stable/_images/sphx_glr_plot_random_dataset_thumb.png)
make_gaussian_quantiles
Gallery examples: Plot randomly generated classification dataset Multi-class AdaBoosted Decision Trees Two-class AdaBoos...
コメント