总结文本或简化文本
nlp
python
5
0

是否有任何库(最好在python中,但至少是开放源代码)可以汇总和/或简化自然语言文本?

参考资料:
Stack Overflow
收藏
评论
共 6 个回答
高赞 时间 活跃

尝试使用GPL开源许可发布的Open Text Summarizer 。它运行良好,但是自2007年以来就没有开发工作。

原始代码是用C编写的(库和命令行实用程序),但是有许多语言的包装器:

收藏
评论

也许您可以尝试sumy 。这是我用Python编写的一个很小的库。已经实现了Luhn和Edmundson的方法,LSA方法,SumBasic,KL-Sum,LexRank和TextRank算法。它已获得Apache2许可,并支持捷克语,斯洛伐克语,英语,法语,日语,中文,葡萄牙语,西班牙语和德语。

如果您缺少某些物品,请随时提出问题或发送拉取请求。

收藏
评论

我不确定当前是否有任何库可以执行此操作,因为文本摘要或至少可理解的文本摘要不是通过简单的即插即用库就可以轻松实现的。

这是我设法找到的与文本摘要相关的项目/资源的一些链接,可帮助您入门:

希望有帮助:)

收藏
评论

我也需要同样的东西,但是在Python中找不到任何可以帮助我获得全面结果的东西。

因此,我发现此Web服务确实非常有用,并且它们具有免费的API ,可以提供JSON结果,因此我想与您共享。

在这里查看: http : //smmry.com

收藏
评论

不是python,而是MEAD会进行文本汇总(在Perl中)。通常,即使不是总是特别流畅,听起来也会很容易理解。另请访问summarization.com ,以获取有关文本摘要任务的大量有用信息。

收藏
评论

看一下这篇文章 ,对这些方法和软件包进行了详细的研究:

  1. Lex_rank( sumy
  2. LSA(总和)
  3. 卢恩(相扑)
  4. PyTeaser
  5. Gensim TextRank
  6. PyTextRank
  7. Google TextSum

本文末尾做了“ 总结 ”。

sumy @ miso.belica的作者在上面的回答中给出了描述。

其他各种机器学习技术也已兴起,例如Facebook / NAMAS和Google / TextSum,但仍需要在Gigaword Dataset和大约7000 GPU小时的基础上进行广泛的培训。数据集本身非常昂贵。

总而言之,如果您无法使用高端机器,那么sumy是目前市场上最好的选择。非常感谢@ miso.belica提供这个出色的软件包。

收藏
评论
新手导航
  • 社区规范
  • 提出问题
  • 进行投票
  • 个人资料
  • 优化问题
  • 回答问题

关于我们

常见问题

内容许可

联系我们

@2020 AskGo
京ICP备20001863号