1、浅谈数据科学 数据科学(Data Science)这一概念自大数据崛起也随之成为数据领域的讨论热点,从去年开始,“数据科学家”便成为了一个工作职位出现在各种招聘信息上。那么究竟什么是数据科学?大数
大家都知道量化投资涉及了很多统计学、数学和计算机科学方面的知识和技术。想要设计一个量化投资模型就要掌握这些知识和一定的运用能力。今天我们就来一起具体看一下到底需要哪些知识技术。 一、数据挖掘 量化
本文探讨了量化投资新手在执行回测和建立量化模型时应时刻注意的七个“大坑”。其中,有些误区可能很常见,但其影响力却往往被人忽略,有些误区可能在学术界和实践者的研究中司空见惯,通常我们也把他们视为理所当然
尽管一些人认为区块链是一个等待问题的解决方案,但毫无疑问,这种新技术是计算机的奇迹。但是,区块链到底是什么呢? 区块链 它是比特币或其他加密货币进行交易的数字账本,账本按时间顺序记录并对外公开。
数据清理是数据科学和机器学习中的重要组成部分,本文介绍了如何在 Tensorflow.js(0.11.1)中处理 MNIST 图像数据,并逐行解释代码。 有人开玩笑说有 80% 的数据科学家在清理
根据New Vantage Partners(NPV)公司2017年大数据执行调查显示,在85%试图采用数据驱动的企业中,只有37%的企业获得了成功。看起来企业需要从大数据的初期阶段开始,但是,营销团
翻阅数百年来的投机历史,纵观奔腾不复的投机长河,绝大多数投机者都充当了悲剧的主角,成为这段历史铁蹄下的尘埃,变成这条长河浪打下的冤魂!即便很多天才的投机家,也在这个市场中几经沉浮,饱受沧桑!投机市场是
前言 Pandas基于两种数据类型:series与dataframe。 一个series是一个一维的数据类型,其中每一个元素都有一个标签。series类似于Numpy中元素带标签的数组。其中,标签可以
数据“爆炸”的时代,大数据常常被寄予厚望。到底,什么样的数据才算大数据,怎样才能用好大数据,传统统计学还有用武之地吗?清华大学统计学研究中心前不久成立,著名统计学家、哈佛大学终身教授刘军担任主任。日前
本文开始先说说CTP给开发者提供了什么。CTP提供给开发者的文件一共有4个头文件 ThostFtdcTraderApi.h,ThostFtdcMdApi.h,ThostFtdcUserApiStruc
本章主要介绍混合型朴素贝叶斯—— MergedNB 的实现。 首先是初始化: from b_NaiveBayes.Original.Basic import * from b_NaiveBayes.O
本章主要介绍离散型朴素贝叶斯—— MultinomialNB 的实现。对于离散型朴素贝叶斯模型的实现,由于核心算法都是在进行“计数”工作、所以问题的关键就转换为了如何进行计数。幸运的是、Numpy 中
多标签分类格式 对于多标签分类问题而言,一个样本可能同时属于多个类别。如一个新闻属于多个话题。这种情况下,因变量yy需要使用一个矩阵表达出来。 而多类别分类指的是y的可能取值大于2,但是y所属类别是唯
初步认知数据分布 拿到一个数据集,你先检查了数据源的质量,然后通过数据清洗提升了数据集的质量,再通过平均数的计算了解了数据集大小的一般水平,接着又通过方差和标准差了解了波动变化。经过这一系列的操作,你
读完上一篇的你,或许会觉得我说的内容太琐碎,太简单。那么进入第二步,许多和“数”相关的东西,就要在此展开了。 必要的描述统计分析 从审核数据源质量,到提升数据集质量,再到明确数据类型和单位,走完这