在第一章我们提到过最常用的监督学习任务是回归(用于预测某个值)和分类(预测某个类别)。在第二章我们探索了一个回归任务:预测房价。我们使用了多种算法,诸如线性回归,决策树,和随机森林(这个将会在后面的章
准确率与召回率 Scikit-Learn 提供了一些函数去计算分类器的指标,包括准确率和召回率。 >>> from sklearn.metrics import precision_score, re
同学们晚上好,我是斯坦福大学的教授,又是清华大学的教授。我平时讲的课都是关于物理,但我其实一直对区块链非常感兴趣。 今天讲的题目是 「 In Math We Trust 」,子标题是「 Foundat
多类分类 二分类器只能区分两个类,而多类分类器(也被叫做多项式分类器)可以区分多于两个类。 一些算法(比如随机森林分类器或者朴素贝叶斯分类器)可以直接处理多类分类问题。其他一些算法(比如 SVM
在之前的描述中,我们通常把机器学习模型和训练算法当作黑箱子来处理。如果你实践过前几章的一些示例,你惊奇的发现你可以优化回归系统,改进数字图像的分类器,你甚至可以零基础搭建一个垃圾邮件的分类器,但是你却
随机梯度下降 批量梯度下降的最要问题是计算每一步的梯度时都需要使用整个训练集,这导致在规模较大的数据集上,其会变得非常的慢。与其完全相反的随机梯度下降,在每一步的梯度计算上只随机选取训练集中的一个样本
弹性网络(ElasticNet) 弹性网络介于 Ridge 回归和 Lasso 回归之间。它的正则项是 Ridge 回归和 Lasso 回归正则项的简单混合,同时你可以控制它们的混合率 $r$,当 $
支持向量机(SVM)是个非常强大并且有多种功能的机器学习模型,能够做线性或者非线性的分类,回归,甚至异常值检测。机器学习领域中最为流行的模型之一,是任何学习机器学习的人必备的工具。SVM 特别适合复杂
多项式核 添加多项式特征很容易实现,不仅仅在 SVM,在各种机器学习算法都有不错的表现,但是低次数的多项式不能处理非常复杂的数据集,而高次数的多项式却产生了大量的特征,会使模型变得慢。 幸运的是,
我的浅见是,重仓交易和轻仓交易都是可以选择的路线,只是选择不同,策略也要有所不同。 如果选择重仓交易,以下的方式或许有用:重仓出击,一击必中,不中则退,盈利减仓。 既然选择重仓交易,就不能随随便下
交易是一项技能,如同开车、游泳一样。要想掌握这项技能,靠研究理论是行不通的,只有经过长期大量的练习才能掌握它。一个整天研究各种交易理论而缺乏交易实践的人,就如同一个整天阅读游泳书籍却不敢下水的人一样可
关于市场 关于市场金融市场若分析起来,铁定没完没了,经济大势、**影响、个股基本面、历史走势图、产业前景等等分析后,可研究来研究去最后很单纯,只是买或不买、卖或不卖的最终判断而已。 市场不是真实的世界
背后机制 这个章节从线性 SVM 分类器开始,将解释 SVM 是如何做预测的并且算法是如何工作的。如果你是刚接触机器学习,你可以跳过这个章节,直接进入本章末尾的练习。等到你想深入了解 SVM,再回头研
梯度提升 另一个非常著名的提升算法是梯度提升。与 Adaboost 一样,梯度提升也是通过向集成中逐步增加分类器运行的,每一个分类器都修正之前的分类结果。然而,它并不像 Adaboost 那样每一次迭
随机贴片与随机子空间 BaggingClassifier 也支持采样特征。它被两个超参数 max_features 和 bootstrap_features 控制。他们的工作方式和 max_sampl