句子聚类
代码说明:
与硬聚类方法,在其中一种模式属于单个群集中,比较模糊聚类算法允许模式属于所有群集有不同程度的会员资格。因为一个句子很可能会涉及多个主题或本文档或一组文档中的主题,这很重要如聚类分析句子,域中。然而,因为大多数句子相似度不代表共同的度量空间中的句子,基于原型或混合物的 Gaussians 的常规模糊聚类方法,一般不适用于句聚类。本文提出了一种新型模糊聚类算法,运行对关系的输入数据 ;即,对方阵的表单中的数据明智的数据对象之间的相似之处。该算法使用的数据的图形表示形式和运作,在图形中的对象的图形中心地位将被解释为可能性期望最大化框架中。句子聚类的任务应用该算法的结果表明该算法是能够识别重叠集群的语义相关的句子,和它因此的潜力在中使用的各种文本挖掘任务。我们还包括应用的算法基准的几个其他域中的数据集的结果。
下载说明:请别用迅雷下载,失败请重下,重下不扣分!