k-means法も、多変量データをもとに、値が近い行をグループにまとめる手法です。k-means法は、200~100,000行ほどある大きなデータテーブルに適しています。
k-means法は、事前に指定されたクラスター数(クラスターの個数)に対して、反復アルゴリズムを用います。k-meansは、クラスターの重心からの距離が最小になるように、各データ行をクラスターに分類します。反復計算を行う前に、クラスター数(k)を指定しておく必要があります。ただし、さまざまなkの結果を比べて、データに最もふさわしいだろうクラスター数を後から選択することはできます。
図12.1 三次元バイプロット
目次