package weka.clusterers;
import weka.core.Capabilities;
import weka.core.Instance;
import weka.core.Instances;
/**
* Interface for clusterers. Clients will typically extend either
* AbstractClusterer or AbstractDensityBasedClusterer.
*
* @author Mark Hall (mhall@cs.waikato.ac.nz)
* @revision $Revision: 1.18 $
*/
public interface Clusterer {
/**
* Generates a clusterer. Has to initialize all fields of the clusterer
* that are not being set via options.
*
* @param data set of instances serving as training data
* @exception Exception if the clusterer has not been
* generated successfully
*/
void buildClusterer(Instances data) throws Exception;
/**
* Classifies a given instance. Either this or distributionForInstance()
* needs to be implemented by subclasses.
*
* @param instance the instance to be assigned to a cluster
* @return the number of the assigned cluster as an integer
* @exception Exception if instance could not be clustered
* successfully
*/
int clusterInstance(Instance instance) throws Exception;
/**
* Predicts the cluster memberships for a given instance. Either
* this or clusterInstance() needs to be implemented by subclasses.
*
* @param instance the instance to be assigned a cluster.
* @return an array containing the estimated membership
* probabilities of the test instance in each cluster (this
* should sum to at most 1)
* @exception Exception if distribution could not be
* computed successfully
*/
public double[] distributionForInstance(Instance instance) throws Exception;
/**
* Returns the number of clusters.
*
* @return the number of clusters generated for a training dataset.
* @exception Exception if number of clusters could not be returned
* successfully
*/
int numberOfClusters() throws Exception;
/**
* Returns the Capabilities of this clusterer. Derived classifiers have to
* override this method to enable capabilities.
*
* @return the capabilities of this object
* @see Capabilities
*/
public Capabilities getCapabilities();
}
分享到:
相关推荐
基于WEKA软件实现金融领域数据挖掘分析案例,分别使用随机森林,支持向量机等算法对大数据进行聚类分析,得出结论
非常实用的数据挖掘工具包
基于weka的数据聚类分析实验
基于WEKA 平台的文本聚类研究与实现.
仿照weka自带的简单K均值聚类算法,实现的一个简单的模糊C均值聚类算法。
Java 编写的多种数据挖掘算法 包括聚类、分类、预处理等
本工具包集成了Weka中最新的分类和聚类算法,将其打包成jar包,方便java开发者调用
一个我本人写的关天Weka.jar工具包中各种聚类算法的调用的java源程序
cluster.pdf是一篇关于在weka中实现聚类的论文 对于了解weka聚类 写数据挖掘方面的论文 有帮助,开发聚类设计也可以参考
weka智能分析示例代码,主要实现了聚类分析功能。
WEKA聚类算法wine数据集分析研究报告.docx
使用IK_Analyzer中文分词,使用weka的KMeans算法进行聚类。好东西。
该算法是对weka算法包功能的拓展,是聚类算法中的随机聚类分析。需要weka算法包支持。
详细讲述了weka中EM算法解析,清晰,值得学习
NULL 博文链接:https://irwenqiang.iteye.com/blog/1308834
聚类算法在数据挖掘里面被称之为无监督学习(unsupervised learning),这是与分类算法(supervised learning)相对的。在它们两者之间还一种叫做半监督学习(semi-supervised learning)这个我会在后面的文章中重点...
基于Weka4WS和网格环境,尝试了一种新的分布式聚类方法,并成功地将其嵌入到Weka4WS框架中,借助Weka Library实现分布式数据挖掘算法,同时引入了距离代价和混合概率的概念,将网格与Web服务技术融合,以分布式问题求解...
程序利用中科院的软件,分词、词性标注以后聚类,利用tf-idf值求出30个特征性,生成特征向量,可放在weka中聚类!
科院基于Weka的典型数据挖掘应用教程课件 weka入门实验 有分类 聚类 关联。。。的实验指导书 很详细 非喜勿喷,谢谢