机器学习必备技能之“数据预处理”

TUSHARE 金融与技术学习兴趣小组 编译整理 | 一只小绿怪兽 译者简介:北京第二外国语学院国际商务专业研一在读,目前在学习Python编程和量化投资相关知识。 作者:Datacamp Machine Learning 机器学习,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获...

量化 / 学习笔记 2020-07-14 PM 107次 0条

在Python中实现线性回归 (五)---关于线性回归的不适用性情形及总结

**关于线性回归的不适用性情形** 可以对比scikit-learn中同类的回归模型,得到的模型结果都是一样的。 在数据分析的过程中,有时线性回归并不适用,尤其是面对一些比较复杂的非线性模型时。线性回归不适用的时候,还有很多其他方法可以作为备选方案,比如支持向量机,决策树,随机森林以及神经网络。 这些方法都有Python库可用。而且大多数是免费开源的。这也是Python为什...

量化 / 学习笔记 2020-07-14 AM 96次 0条

在Python中实现线性回归 (四)---statsmodels库的线性回归应用

我们也可以使用statsmodels库实现线性回归,这个库的优点是可以输出回归模型更详细的结果。使用statsmodels的方法也和scikit-learn类似。 **Step 1:导入相关库和类** import pandas as pd import tushare as ts import statsmodels.api as sm 除了p...

量化 / 学习笔记 2020-07-14 AM 88次 0条

在Python中实现线性回归 (三)---基于sklearn的多项式回归

执行多项式回归步骤与前面也相似,只是需要增加一组经过转换的自变量作为非线性项,如x2。 **Step 1:导入相关库和类** 除了需要导入pandas和tushare,sklearn.linear_model.LinearRegression外,还需要导入sklearn.preprocessing中的PolynomialFeatures类用来处理非线性项。 impo...

量化 / 学习笔记 2020-07-14 AM 101次 0条

在Python中实现线性回归 (二)---基于sklearn的多变量线性回归

多元线性回归和基础线性回归实现步骤基本一致。 **Step 1:导入相关库和类** import pandas as pd import numpy as np from sklearn.linear_model import LinearRegression import tushare as ts **Step 2:读取数据** ...

量化 / 学习笔记 2020-07-14 AM 62次 0条

在Python中实现线性回归 (一)---基于sklearn的单变量线性回归

**关于线性回归Python库** numpy是一款基础Python包,它可以在单维和多维数组上进行高效的操作。它还提供很多数值计算方法,同时也是开源库。 如果不熟悉numpy,可以阅读官方的numpy使用指南,此外还有numpy相关的文章会在附录中提供。网络上还有大量的numpy资料可供搜索。 scikit-learn是一个被大量用户用于机器学习的Python库,该库是基...

量化 / 学习笔记 2020-07-14 AM 73次 0条

在Python中实现线性回归 (零)---线性回归数学基础

TUSHARE 金融与技术学习兴趣小组 翻译整理 | One 本期编辑 | 一只小绿怪兽 译者简介:西南财经大学应用数学本科,英国曼彻斯特大学金融数学硕士,金融分析师,专注于利用数据建立金融模型,发掘潜在投资价值。 作者:Mirko Stojiljkovic 线性回归是统计学和机器学习的基础之一。无论是做统计,机器学习还是科学计算,都可能用上线性回归。因此,...

量化 / 学习笔记 2020-07-14 AM 103次 0条