Probability Density Function (pdf) of Sine Wave 首先给出概率分布函数及概率密度函数的定义及相关属性: 下面给出了正弦波的概率密度函数的推导过程,求得
In any analysis related to the share prices , the basic assumption is that the prices follow Gaussia
两极巴特沃斯低通滤波器属于信号处理中的内容,本文的应用成果来自国外,有许多细节受限于知识背景无法一下子理解清楚,也欢迎对这方面感兴趣的朋友留言交流,这次的推文也算是对前次有关二阶低通滤波器构造的进一步
摘要 为保证项目能够健康稳定进行,项目管理中的各项活动都是至关重要的。CMMI 4、5级强调对于项目的估计与决策不仅要依赖于项目经理的工作经验以及历史的度量数据,更要在此基础上通过建立统计模型使估计更
由于工作需要,小编需要掌握一元线性回归的算法细节,而不仅仅是简单的调用,这也再一次提醒小编,高等数学、线性代数等数学知识在量化投资领域是多么的重要,大学有棵树挂了好多人,那就是高数,哈哈,好好学习吧骚
James Le 在 KDnuggets 上发布了一篇文章,介绍了他是如何入门机器学习的。此外,他在其中摸索出十大常用的机器学习算法,并逐一进行介绍。 如果你想学机器学习,那怎么入门呢?对于我来说
我们通常所说的排序算法往往指的是内部排序算法,即数据记录在内存中进行排序。排序算法大体可分为两种: 一种是比较排序,时间复杂度O(nlogn) ~ O(n^2),主要有:冒泡排序,选择排序,插入排序,
本文分别从行业和上市公司两个维度,简要介绍相关基本面量化投资的逻辑要点、因子选择、数据处理、模型搭建等内容。 本篇将首先介绍行业基本面量化体系。 一、行业基本面量化体系 所谓行业基本面量化,顾名思
贝叶斯定理 在描述贝叶斯定理怎样应用于分类之前,我们先从统计学的角度对分类问题加以形式化。 设X表示特征属性集,Y表示类变量。如果类变量和属性之间的关系不确定,那么我们可以把X和Y看作随机变量,用P(
鸢尾花数据集 鸢尾花数据集共收集了三类鸢尾花,即Setosa鸢尾花、Versicolour鸢尾花和Virginica鸢尾花,每一类鸢尾花收集了50条样本记录,共计150条。
基于规则的分类器 基于规则的分类器是使用一组"if...then..."规则来对记录进行分类的技术。规则学习算法使用了一种称为**而治之的探索法。 这个过程包括确定训练数据中覆盖一个案例子集的规则,然
集成学习(Ensemble Learning) 随机森林就是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树,而它的本质属于机器学习的一大分支——集成学习(Ens
问题一:以分类问题为例,如何评估不同分类器的优劣,如C4.5、SVM、逻辑回归、随机森林等,解决办法是找到一个参照物,或叫基线准确度Baseline accuracy,基线准确度通过ZeroR算法得到
线性关系与非线性关系 在数学上,线性函数关系是直线,而非线性函数关系是非直线,包括各种曲线、折线、不连续的线等; 线性方程满足叠加原理,非线性方程不满足叠加原理;线性方程易于求出解析解,而非线性方程一
decision stump决策树桩 decision stump,决策树桩(我称它为一刀切),也称单层决策树,单层也就意味着尽可能对每一列属性进行一次判断。如下图所示(仅对