DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一种很典型的聚类算法,该算法是基于簇是可以通过样本分布的紧密程度决定的这样的假设,将簇定义为密度相连的样本点的最大集合。该算法能够把具有足够高密度的区域划分为簇,可在有噪声样本的样本集中发现任意形状的簇。
机器学习之聚类算法(K-means)
聚类(Clustering)是一种无监督的学习方法。主要是对大量未标注的数据集,按照内在相似性将数据集划分为多个类别,使得类别内的数据相似度较大而类别间的数据的相似度较小。
机器学习之支持向量机
支持向量机(Support vector machines,SVM)是一种二分类模型,其基本模型是定义在特征空间上的间隔最大的线性分类器。学习策略是间隔最大化,最终转化为一个凸二次规划问题求解。