scikit-学习LogisticRegression.predict_proba的返回值
machine-learning
python
scikit-learn
5
0

LogisticRegression.predict_proba函数究竟返回什么?

在我的示例中,我得到这样的结果:

[[  4.65761066e-03   9.95342389e-01]
 [  9.75851270e-01   2.41487300e-02]
 [  9.99983374e-01   1.66258341e-05]]

根据其他计算,使用S形函数,我知道第二列是概率。该文档说,第一列是n_samples ,但是不能,因为我的示例是评论,是文本而不是数字。该文档还说,第二列是n_classes 。那肯定不是,因为我只有两个类(即+1-1 ),并且该函数应该用于计算实际上属于一个类的样本的概率,而不是关于类本身的概率。

第一列到底是什么?为什么在那?

参考资料:
Stack Overflow
收藏
评论
共 1 个回答
高赞 时间 活跃
4.65761066e-03 + 9.95342389e-01 = 1
9.75851270e-01 + 2.41487300e-02 = 1
9.99983374e-01 + 1.66258341e-05 = 1

第一列是该条目具有-1标签的概率,第二列是该条目具有+1标签的概率。

如果只想获取肯定标签的预测概率,则可以使用logistic_model.predict_proba(data)[:,1] 。这将为您提供[9.95342389e-01, 2.41487300e-02, 1.66258341e-05]结果。

收藏
评论
新手导航
  • 社区规范
  • 提出问题
  • 进行投票
  • 个人资料
  • 优化问题
  • 回答问题

关于我们

常见问题

内容许可

联系我们

@2020 AskGo
京ICP备20001863号