如何用逻辑回归做数据分析？

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

赵小洛

2021-02-08

0 评论 13990 浏览 34 收藏

11 分钟

编辑导语：逻辑回归的本质上是线性回归，在数据分析中，我们经常会用到线性回归来进行分析，但如果因素较多时，我们就要用到逻辑回归的方式进行数据分析；本文作者分享了关于如何用逻辑回归做数据分析的方法，我们一起来看一下。

今天我们将学习逻辑回归（logistics regression），由于逻辑回归是基于线性回归的特殊变化，故还没有掌握线性回归的小伙伴，可以先点击这里，传送门：《如何用线性回归做数据分析？》

接下来，我将用最简单通俗的语言来为大家介绍逻辑回归模型及其应用。

逻辑回归是解决二分类问题的监督学习算法，用来估计某个类别的概率；其直接预测值是表示0-1区间概率的数据，基于概率再划定阈值进行分类，而求解概率的过程就是回归的过程。

逻辑回归应用于数据分析的场景主要有三种：

驱动力分析：某个事件发生与否受多个因素所影响，分析不同因素对事件发生驱动力的强弱（驱动力指相关性，不是因果性）；
预测：预测事件发生的概率；
分类：适合做多种分类算法、因果分析等的基础组件；

一、逻辑回归的原理

下图是之前讲到的线性回归模型的数据分布，线性回归是用一条线来拟合自变量和因变量之间的关系，我们可以看到其输出结果y是连续的。

例如我们想预测不同用户特征对所使用产品的满意分，可以采用线性回归模型；但是如果我们想根据这些因素去判断用户的性别，或者是否推荐使用等，之前的线性回归就不适用了，这时，我们就要用到逻辑回归进行二分类了。

但是分类模型输出结果却需要是离散的，如何把连续型的y转化为取值范围0-1的数值呢？

如何用逻辑回归做数据分析？

答案是，我们只需要将线性回归模型的结果带入到sigmoid函数（sigmoid函数就是Logistic函数，故本算法名为逻辑回归），即可将线性回归模型转化为二分类问题，这就是逻辑回归。我们可以这样理解：逻辑回归=线性回归+sigmoid函数

那么，什么是sigmoid函数呢？如图，当输入值趋于无穷小时，函数值趋近于0；输入值趋于无穷大时，函数值趋近于1。我们将线性回归结果y带入到sigmoid函数的x，即下图横坐标，就轻而易举的将连续变量y转换为了0-1区间的一个概率值。当这个概率值(函数值)小于0.5时，我们将最终结果预测为0，当概率值大于0.5时，我们将预测结果预测为1。

如何用逻辑回归做数据分析？