关于线性回归的不适用性情形

可以对比scikit-learn中同类的回归模型,得到的模型结果都是一样的。

在数据分析的过程中,有时线性回归并不适用,尤其是面对一些比较复杂的非线性模型时。线性回归不适用的时候,还有很多其他方法可以作为备选方案,比如支持向量机,决策树,随机森林以及神经网络。

这些方法都有Python库可用。而且大多数是免费开源的。这也是Python为什么是机器学习主要语言之一的原因。

而scikit-learn库也提供了除了线性回归以外的其他方法,而且用法和本文中的使用方法非常类似。该库包含了支持向量机,决策树,随机森林等等算法,这里不过多展开了。这些算法都可以通过.fit(),.predict(),.score()进行调用。

总结

本文介绍了什么是线性回归已经如何在Python中实现,可以利用pandas对数据进行处理,pandas直观高效的处理数据,并且可以与scikit-learn, statsmodels库实现无缝衔接。

线性回归可以通过两种方式实现:① scikit-learn:如果不需要回归模型的详细结果,用sklearn库是比较合适的。② statsmodels:用于获取回归模型详细统计结果。两个库都可以做进一步的探索。更详细的使用方法可以参考相关官方文档。

在Python中执行线性回归时,可以按照以下步骤执行:

① 导入需要的库和类。

② 提供数据,并且进行适当的预处理。

③ 创建回归模型,用现有数据进行拟合。

④ 检验模型是否合适,比如:欠拟合或者过拟合。

⑤ 应用模型进行预测。

【参考链接】

网页链接【1】

网页链接【2】

网页链接【3】

网页链接【4】

作者:Tushare挖地兔
链接:https://xueqiu.com/9103835084/130068836
来源:雪球