はじめに
sklearnのdatasets.make_gaussian_quantiles
で等方性なガウス分布に従う分類用のデータを作成することができる。ここでは各種パラメータが生成するデータに及ぼす影響について説明する。
解説
モジュールのインポートなど
バージョン
n_samples
n_samplesを変化させることでサンプル数を変えることができる。
mean
分布の平均値を設定できる。(2,2)のようにタプルで指定する。Noneの場合、(0,0)となる。
cov
共分散行列はこの値に単位行列をかけたものになる。
n_features
データの列数を変えることができる。
n_classes
n_classesを変えることでクラス数を変えることができる。
random_state
random_stateを変えることで再現可能な乱数を生成することができる。
shuffle
shuffleをFalseとすることでラベルがソートされたデータを得ることができる。デフォルトはTrue.
コードをダウンロード(.pyファイル) コードをダウンロード(.ipynbファイル)参考
make_gaussian_quantiles
Gallery examples: Plot randomly generated classification dataset Multi-class AdaBoosted Decision Trees Two-class AdaBoos...
コメント