今天我们来详细解读一下什么是信息熵及其相关概念,以及如何进行信息增益的计算和它在decision tree中的运用。 信息熵与热力学熵 学过化学或热力学的同学可能了解热力学熵。 熵的概念由德国物理
决策树 决策树方法(decision tree)是一种代表因子值和预测值之间的一种映射关系。从决策树的“根部”往“枝叶”方向走,每路过一个节点,都会将预测值通过因子的值分类。决策树的结构如下所示: 如
特征提取步骤 1. 卡方检验 1.1 统计样本集中文档总数(N)。 1.2 统计每个词的正文档出现频率(A)、负文档出现频率(B)、正文档不出现频率)、负文档不出现频率。 1.3 计算每个词
引言 发现金融泡沫并预测到其何时破裂是很多从事金融行业的人的梦想。如今中国股市也成为了热门的话题,然而,资本狂欢之后是股灾,多少人因此从千万富翁炒股变成百万富翁,预测泡沫是所有人的梦想
在 系列 一 的教程中,我们想继续有关股票价格预测的主题,并赋予在系列1中建立的具有对多个股票做出响应能力的RNN。 为了区分不同价格序列之间相关的模式,我们使用股票信号嵌入向量作为输入的一部分。
K-means clustering To start out we're going to implement and apply K-means to a simple 2-dimensional
概述 我们将解释如何建立一个有LSTM单元的RNN模型来预测S&P500指数的价格。 数据集可以从Yahoo!下载。 在例子中,使用了从1950年1月3日(Yahoo! Finance可以追溯到的最大
In this exercise, we'll be using support vector machines (SVMs) to build a spam classifier. We'll st
交易成败在于理念之方向篇 何谓方向,方向从何而来又去向何处? 行情的方向,我片面地理解为在特定时间段价格运行的惯性。由于在某一特定时间 段,价格被市场参与资金压倒性地控制,形成了有持续
交易成败在于细节之开仓篇 如上图,假设绿圈中是我们等待的做多交易机会,形态符合我们需要做多的条件,怎么进场? 上图是一段15秒股指K线,就以该级别股指为例。 最佳介入点选择: 点位1
一、期权的本质和基本逻辑 朋友们都知道,期权实现了“在未来某个时段内(美式)或某个时点上(欧式,我国采用),以约定价买入或卖出标的物之权利”的交易。期权可谓交易品种之皇冠,有两点比较关键
请注意, 本文并非投资建议。本文数据是基于之前观察到的收益来模拟得来,和历史上的数据并非完全一致。本文提到的技术对了解如何更好地配置投资组合有帮助,但其不应该用作唯一的投资决策。 第一部分 数
揭秘统计软件如 R,Octave,Matlab 等使用的随机数发生器,然后做一些统计检验,再将其应用到**随机变量和的模拟中,最后与符号计算得到的精确结果比较。除特别说明外,文中涉及到的随机数都是指伪
大类资产轮动的特殊性 所谓大类资产,指的是具有相似收益特征和投资用途的资产类别。一般而言,大类资产轮动策略通常分为两类:一类是从宏观经济数据出发,依据对经济周期和相关品种基本面的判断,做
在提高区块链去中心化程度之前,我们必须先知道衡量的标准。 去中心化 被 普遍 认为 是比特币和以太坊胜过传统同类方案的主要优势。然而,尽管人们广泛认可去中心化的重要性,大多数关于这个话题的讨论并没有进