Fork me on GitHub
Michelle

千里之行,始于足下。


  • 首页

  • 标签

  • 分类

  • 归档

机器学习之聚类(密度聚类-DBSCAN)

发表于 2018-06-06 | 分类于 机器学习 |
字数统计: 1,163 | 阅读时长 ≈ 4

    DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一种很典型的聚类算法,该算法是基于簇是可以通过样本分布的紧密程度决定的这样的假设,将簇定义为密度相连的样本点的最大集合。该算法能够把具有足够高密度的区域划分为簇,可在有噪声样本的样本集中发现任意形状的簇。

阅读全文 »

机器学习之聚类(层次聚类)

发表于 2018-06-03 | 分类于 机器学习 |
字数统计: 555 | 阅读时长 ≈ 2

    层次聚类(Hierarchical Clustering)是聚类算法的一种,通过对给定的数据集进行层次的分解,直到某种条件满足为止,最终构建出一颗嵌套的树。

阅读全文 »

机器学习之聚类算法(K-means)

发表于 2018-05-27 | 分类于 机器学习 |
字数统计: 1,888 | 阅读时长 ≈ 7

    聚类(Clustering)是一种无监督的学习方法。主要是对大量未标注的数据集,按照内在相似性将数据集划分为多个类别,使得类别内的数据相似度较大而类别间的数据的相似度较小。

阅读全文 »

机器学习之支持向量机

发表于 2018-05-19 | 分类于 机器学习 |
字数统计: 1,975 | 阅读时长 ≈ 7

    支持向量机(Support vector machines,SVM)是一种二分类模型,其基本模型是定义在特征空间上的间隔最大的线性分类器。学习策略是间隔最大化,最终转化为一个凸二次规划问题求解。

阅读全文 »

机器学习之提升方法

发表于 2018-05-17 | 分类于 机器学习 |
字数统计: 3,386 | 阅读时长 ≈ 13

    提升(Boosting)是一种常用的统计学习方法,是一族将弱学习器提升为强学习器的算法,属于集成学习(ensemble)。

阅读全文 »

机器学习之随机森林

发表于 2018-05-16 | 分类于 机器学习 |
字数统计: 933 | 阅读时长 ≈ 3

    随机森林(Random Forest)就是通过集成学习的思想将多棵决策树集成的一种算法。基本单元是决策树。随机森林算法的提出也是为了改善决策树容易存在过拟合的情况。

阅读全文 »

机器学习之决策树

发表于 2018-05-13 | 分类于 机器学习 |
字数统计: 2,792 | 阅读时长 ≈ 11

    决策树(Decision Tree)是一种树形结构,是基本的分类和回归方法,是一种监督学习算法。决策树学习通常包含3个步骤:特征选择、决策树的生成和决策树的剪枝。

阅读全文 »

机器学习之logistic回归

发表于 2018-05-10 | 分类于 机器学习 |
字数统计: 1,247 | 阅读时长 ≈ 5

    在机器学习中,逻辑斯谛回归(Logistic regression)是经典的用线性回归做二分类的模型。通过样本数据建立模型,对新样本发生的概率进行预测。

阅读全文 »

机器学习之线性回归

发表于 2018-05-06 | 分类于 机器学习 |
字数统计: 2,733 | 阅读时长 ≈ 11

    在机器学习中,线性回归(Linear regression)是指利用最小二乘法对一个或多个自变量和因变量之间关系进行建模的一种回归分析方法。

阅读全文 »

机器学习之评价指标

发表于 2018-05-01 | 分类于 机器学习 |
字数统计: 1,895 | 阅读时长 ≈ 7

    今天主要来总结一下机器学习的评价指标。在使用数据来训练一个或多个机器学习模型的时候,一般是通过评价指标来对构建的模型有一个数字化的度量。

阅读全文 »
12
Michelle Yang

Michelle Yang

向内认知,向外行走。

13 日志
2 分类
16 标签
GitHub E-Mail Twitter
© 2018 Michelle Yang
本站访客数:
博客全站共23.3k字