数据挖掘 - Tags 列表

Python数据挖掘与机器学习，快速掌握聚类算法和关联分析 2018-07-18 10:54:51

显示 : 2822
|
回复 : 0
|
收藏 0
|
点赞 0
|
Tags : 关联分析数据挖掘聚类算法机器学习

　　在本文中将为大家介绍聚类算法和关联分析问题。分类算法与聚类到底有何区别？聚类方法应在怎样的场景下使用？如何使用关联分析算法解决个性化推荐问题？本文就为大家揭晓答案。本文将围绕一下几个方面进行介绍

Python数据挖掘实践—KNN分类 2018-07-18 10:22:54

显示 : 2987
|
回复 : 0
|
收藏 0
|
点赞 0
|
Tags : kNN 数据挖掘

　　1、最邻近算法 KNN方法的简单描述：KNN方法用于分类，其基本思想如下。我们已经有一些已知类型的数据，暂称其为训练集。当一个新数据（暂称其为测试集）进入的时候，开始跟训练集数据中的每个数据点求距离，

十大经典数据挖掘算法——EM 2018-07-17 15:29:45

显示 : 2917
|
回复 : 0
|
收藏 0
|
点赞 0
|
Tags : EM 数据挖掘机器学习

　　1. 极大似然极大似然（Maximum Likelihood）估计为用于已知模型的参数估计的统计学方法。比如，我们想了解抛硬币是正面（head）的概率分布θ；那么可以通过最大似然估计方法求得。假如我

十大经典数据挖掘算法——Apriori 2018-07-17 15:19:03

显示 : 2945
|
回复 : 0
|
收藏 0
|
点赞 0
|
Tags : Apriori 数据挖掘机器学习

　　1. 关联分析关联分析是一类非常有用的数据挖掘方法，能从数据中挖掘出潜在的关联关系。比如，在著名的购物篮事务（market basket transactions）问题中，关联分析则被用来找出

十大经典数据挖掘算法——SVM 2018-07-17 14:56:16

显示 : 2829
|
回复 : 0
|
收藏 0
|
点赞 0
|
Tags : SVM 数据挖掘机器学习

　　SVM（Support Vector Machines）是分类算法中应用广泛、效果不错的一类。《统计学习方法》对SVM的数学原理做了详细推导与论述，本文仅做整理。由简至繁SVM可分类为三类：线性可分（

十大经典数据挖掘算法——k-means 2018-07-17 14:31:50

显示 : 2787
|
回复 : 0
|
收藏 0
|
点赞 0
|
Tags : k-means 数据挖掘机器学习

　　1. 引言 k-means与kNN虽然都是以k打头，但却是两类算法——kNN为监督学习中的分类算法，而k-means则是非监督学习中的聚类算法；二者相同之处：均利用近邻信息来标注类别。聚类是数据挖掘

十大经典数据挖掘算法——PageRank 2018-07-17 14:10:34

显示 : 3589
|
回复 : 0
|
收藏 0
|
点赞 0
|
Tags : PageRank 数据挖掘矩阵节点

　　1. 引言 PageRank是Sergey Brin与Larry Page于1998年在WWW7会议上提出来的，用来解决链接分析中网页排名的问题。在衡量一个网页的排名，直觉告诉我们：当一个网页被更多

数据挖掘之八——朴素贝叶斯分类器 2018-05-15 18:25:48

显示 : 4615
|
回复 : 0
|
收藏 0
|
点赞 0
|
Tags : 数据挖掘朴素贝叶斯朴素贝叶斯分类器

　　贝叶斯定理在描述贝叶斯定理怎样应用于分类之前，我们先从统计学的角度对分类问题加以形式化。设X表示特征属性集，Y表示类变量。如果类变量和属性之间的关系不确定，那么我们可以把X和Y看作随机变量，用P(

数据挖掘之七——基于随机森林的分类实验 2018-05-15 18:22:13

显示 : 4749
|
回复 : 0
|
收藏 0
|
点赞 0
|
Tags : 数据挖掘随机森林训练数据建模模型预测

　　鸢尾花数据集鸢尾花数据集共收集了三类鸢尾花，即Setosa鸢尾花、Versicolour鸢尾花和Virginica鸢尾花，每一类鸢尾花收集了50条样本记录，共计150条。

数据挖掘之六——基于规则的分类器 2018-05-15 18:17:46

显示 : 8665
|
回复 : 0
|
收藏 0
|
点赞 0
|
Tags : 数据挖掘 RIPPER算法

　　基于规则的分类器基于规则的分类器是使用一组"if...then..."规则来对记录进行分类的技术。规则学习算法使用了一种称为**而治之的探索法。这个过程包括确定训练数据中覆盖一个案例子集的规则，然

数据挖掘之五—随机森林 2018-05-15 18:13:02

显示 : 5936
|
回复 : 0
|
收藏 0
|
点赞 0
|
Tags : 决策树数据挖掘 Bagging模型随机森林随机森林算法

　　集成学习（Ensemble Learning）随机森林就是通过集成学习的思想将多棵树集成的一种算法，它的基本单元是决策树，而它的本质属于机器学习的一大分支——集成学习（Ens

数据挖掘之四——评估方法 2018-05-15 18:07:08

显示 : 5962
|
回复 : 0
|
收藏 0
|
点赞 0
|
Tags : 数据挖掘 ZeroR分类器评估基本方法评估方法

　　问题一：以分类问题为例，如何评估不同分类器的优劣，如C4.5、SVM、逻辑回归、随机森林等，解决办法是找到一个参照物，或叫基线准确度Baseline accuracy，基线准确度通过ZeroR算法得到

数据挖掘之三——Logistic回归&LMT 2018-05-15 18:04:11

显示 : 5934
|
回复 : 0
|
收藏 0
|
点赞 0
|
Tags : 数据挖掘 LMT Logistic回归 logistic回归函数 logistic模型树

　　线性关系与非线性关系在数学上，线性函数关系是直线，而非线性函数关系是非直线，包括各种曲线、折线、不连续的线等；线性方程满足叠加原理，非线性方程不满足叠加原理；线性方程易于求出解析解，而非线性方程一

数据挖掘之二——DecisionStump&C4.5&LMT 2018-05-15 17:59:46

显示 : 5582
|
回复 : 0
|
收藏 0
|
点赞 0
|
Tags : C4.5 数据挖掘决策树桩决策树算法

　　decision stump决策树桩 decision stump，决策树桩（我称它为一刀切），也称单层决策树，单层也就意味着尽可能对每一列属性进行一次判断。如下图所示（仅对

数据挖掘之一——M5P树状回归演算法 2018-05-15 17:36:54

显示 : 7450
|
回复 : 0
|
收藏 0
|
点赞 0
|
Tags : 数据挖掘 M5P树状回归回归演算法

　　M5P树状回归演算法可根据资料的分布建立多种回归模型，依据输入资料的不同来决定适用的回归模型。比起传统的线性回归，M5P能够准确预测非线性的资料，而且规则与回归模型容易解读。相较于类神经网路和支