はじめに
sklearnのdatasets.make_circles
で円状に分布したクラスタリング、分類用のデータを作成することができる。ここでは各種パラメータが生成データに及ぼす影響について説明する。
解説
モジュールのインポートなど
バージョン
n_samples
n_samplesを変化させることでサンプル数を変えることができる。
noise
noiseでばらつきを付与できる。
random_state
random_stateを変えることで再現可能な乱数を生成することができる。
factor
factorを変えることで外円と内円の距離を変えることができる。
shuffle
shuffleをFalseとすることでラベルがソートされたデータを得ることができる。デフォルトはTrue.
コードをダウンロード(.pyファイル) コードをダウンロード(.ipynbファイル)参考
make_circles
Gallery examples: Classifier comparison Comparing different clustering algorithms on toy datasets Comparing different hi...
コメント