はじめに
sklearnのdatasets.make_moons
で三日月状の分布を示すクラスタリング、分類用のデータを作成することができる。ここでは各種パラメータが生成データに及ぼす影響について説明する。
解説
モジュールのインポートなど
バージョン
n_samples
n_samplesを変化させることでサンプル数を変えることができる。
noise
noiseでばらつきを付与できる。
random_state
random_stateを変えることで再現可能な乱数を生成することができる。
shuffle
shuffleをFalseとすることでラベルがソートされたデータを得ることができる。デフォルトはTrue.
コードをダウンロード(.pyファイル) コードをダウンロード(.ipynbファイル)参考
make_moons
Gallery examples: Classifier comparison Comparing different clustering algorithms on toy datasets Comparing different hi...
コメント