Defining a k-means cluster analysis(定义k-means聚类分析)

Contents

k-means聚类分析在FCS Express 中通过Transformation(转换)按钮，位于Tools(工具)标签→ Transformations来展示。下面的步骤概述了在您的数据上创建一个新的k-聚类分析的过程。

1.	打开Transformation(转换)窗口通过选择Tools(工具)标签→ Transformations→Transformations命令(如下图, Step 1).

2.	点击与蓝色加号按钮相邻的下拉箭头(图下面的步骤2)。

3.	点击Kmeans在下拉菜单中(图29.21, Step 3)。

(Figure 29.27) - A Kmeans transformation can be created via the Transformations navigator.

此Kmeans对话框现在会出现，在Transformation(转换)窗口中，如图29所示22。

Figure 29.28 -The Kmeans dialog opens when a new k-means transformation is created.

这新的Kmeans transformation 被命名为默认的New Kmeans它也能简单的通过如下两种方法重命名:

•	在Kmeans transformation 上右击，需要重命名→选择Rename(重命名)。

•	选择Kmeans transformation，重命名可以通过左键和按键盘上的F2键。

•	选择Kmeans transformation，重命名可以通过左键和点击Transformations工具栏的按钮。

4.	为k-means聚类选择一个模板文件通过点击Template File编辑框右侧的省略号。

一旦你感兴趣的文件被选择，将使用可用参数的列表填充对话框，以便根据模板文件中的可用参数执行k-means聚类(图2923)。

Figure 29.29 - A template file has been loaded into the New Kmeans dialog.

5.	通过选中参数名称旁边的框，选择参数以定义Kmeans聚类(图 29.24, Step 1)。

6.	如果需要，请选择或更改每个所选参数的相应参数缩放选项(Parameter Scaling Options)(如下图第2步)。

Figure 29.30 - Choosing the parameters to perform k-means cluster analysis.

此时可以设置多个选项：

6.	(选择的)从Gate 菜单中选择一个门如果您有兴趣仅对属于它的事件进行聚类。

7.	设置该Number of Clusters这些事件应该被聚集。这相当于重心的数量。

8.	设置Maximum Iterations(最多迭代次数)的数量此值表示FCS Express在退出聚集过程之前应执行的最大迭代次数。

9.	设置Minimum Percent of Cells Per Cluster(每个聚集细胞数的最小百分比)该值表示聚集的最小大小(以百分比表示)。

10.	设置Kmeans 聚集的输出类型。

可用的选择是Clustering Assignments(聚类分配)和Clustering Statistics(聚类统计)。请参阅下面的详细清单说明每个选项：

•	Clustering Assignments(聚类分配)通过选择此输出样式，可以为群集执行的每个事件分配以下统计信息：

o	Cluster Assignment:指示群集成员的内部标签将自动分配给每个事件。该标签由FCS Express用于集群的热图表示，但也可以通过数据网格。

o	Distance to Cluster Centroid:给定事件与其聚集的质心的距离。值作为唯一直方图绘制。

o	Distance to centroid Histograms:与聚集中心距离相同，但在这种情况下，值分组，因此为每个聚集分别绘制。聚集的编号从1到Number of Clusters(聚集数)。

o	Gaussian CV SSE Scaled:在该表示中，每个事件根据其聚集成员进行绘制，因此集群显示为分离的直方图。由于聚集成员身份是从1到Number of Clusters(聚集数)的整数值，引入了人为噪音来分散数据。Gaussian SSE scaled意味着用于表示每个聚集的高斯(正态分布)的标准偏差与簇的平方误差之和成比例。

o	Gaussian CV Unscaled:在该表示中，每个事件根据其聚集成员进行绘制，因此集群显示为分离的直方图。由于聚集成员身份是从1到Number of Clusters(聚集数)的整数值，引入了人为噪音来分散数据。Gaussian CV Unscaled:意味着用于表示每个聚集的高斯(正态分布)的标准偏差在簇之间是相同的。

o	Gaussian Y Data:事件按照高斯(正态分布)绘制。

•	Clustering Statistics(聚类统计)。通过选择此输出样式，可以通过绘图和数据网格访问以下统计信息数据网格：

o	Kmeans Cluster ID:一个整数值，从0到Clusters-1的数量。

o	Centroid coordinates:给出了为聚集的考虑的每个参数的每个质心的坐标。

o	Sum Of Square (WCSS):针对每个聚集报告了群内平方和。

下表列出了适合显示每个输出样式的对象：

		能被展示作为
		Heatmap	1D 或 2D 点图	数据网格
Clustering Assignments(聚类分配)	Cluster Assignment:	Y		Y
	聚集中心距离:		Y	Y
	重心直方图的距离:		Y	Y
	Gaussian CV SSE Scaled:		Y	Y
	Gaussian CV Unscaled:		Y	Y
	Gaussian Y Data:		Y	Y
Clustering Statistics(聚类统计)。			Y	Y

11.	此k-means聚类现在已经被定义并自动计算。k-means 聚类现在可以将它们于显示和分析的点图。(请参见Applying a k-means Cluster Analysis应用 k-means聚类分析)。