はじめに
scikit-learnのmake_circles関数を使用して円状に分布したデータを生成する方法とそのパラメータが出力に与える影響について解説します。機械学習のクラスタリングや分類問題のテストデータとして活用できます。
解説
モジュールのインポートなど
バージョン
n_samples
n_samplesを変化させることでサンプル数を変えることができます。

noise
noiseでばらつきを付与できます。

random_state
random_stateを変えることで再現可能な乱数を生成することができます。

factor
factorを変えることで外円と内円の距離を変えることができます。

shuffle
shuffleパラメータをFalseに設定すると、ラベルがソートされた状態のデータを取得できます。デフォルト値はTrueです。
コードをダウンロード(.pyファイル) コードをダウンロード(.ipynbファイル)まとめ
make_circles関数は、機械学習アルゴリズムのテストや評価に便利な円状データを簡単に生成できるツールです。noise、factor、random_stateなどのパラメータを調整することで、さまざまな分布パターンを作成でき、クラスタリングや分類アルゴリズムの性能評価に役立ちます。
参考

make_circles
Gallery examples: Classifier comparison Comparing different clustering algorithms on toy datasets Comparing different hi...
コメント