关键词搜索

源码搜索 ×
×

Python实用工具,fuzzywuzzy模块,Python实现鲁迅名言查询系统

发布2021-08-13浏览474次

详情内容

开发工具

Python版本:3.6.4

相关模块:

PyQt5模块;

python-Levenshtein模块;

fuzzywuzzy模块;

以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量,pip安装需要的相关模块即可。

原理简介

首先,下载一份鲁迅全集的.txt文件:

图片

然后用PyQt布局实现个简单的GUI:

  1. '''简单的GUI'''
  2. class GUI(QWidget):
  3. def __init__(self, parent=None):
  4. super().__init__()
  5. self.setWindowTitle('鲁迅名言查询-微信公众号:Charles的皮卡丘')
  6. self.setWindowIcon(QIcon('data/icon.jpg'))
  7. self.label1 = QLabel('句子:')
  8. self.line_edit = QLineEdit()
  9. self.label2 = QLabel('查询结果:')
  10. self.text = QTextEdit()
  11. self.button = QPushButton()
  12. self.button.setText('查询')
  13. self.cmb = QComboBox()
  14. self.cmb.setStyle(QStyleFactory.create('Fusion'))
  15. self.cmb.addItem('匹配度: 100%')
  16. self.cmb.addItem('匹配度: 90%')
  17. self.cmb.addItem('匹配度: 80%')
  18. self.cmb.addItem('匹配度: 70%')
  19. self.grid = QGridLayout()
  20. self.grid.setSpacing(12)
  21. self.grid.addWidget(self.label1, 1, 0)
  22. self.grid.addWidget(self.line_edit, 1, 1, 1, 38)
  23. self.grid.addWidget(self.button, 1, 39)
  24. self.grid.addWidget(self.label2, 2, 0)
  25. self.grid.addWidget(self.text, 2, 1, 1, 40)
  26. self.grid.addWidget(self.cmb, 1, 40)
  27. self.setLayout(self.grid)
  28. self.resize(200, 400)
  29. self.button.clicked.connect(self.inquiry)
  30. self.paragraphs = self.loadData('data/book.txt')

大概长这个样子:

image.png

那么接下来,只需要当用户点击查询按钮时,根据用户选择的匹配度下限,找到鲁迅全集的book.txt文件中的所有与待搜索句子匹配度大于该匹配度下限的段落并在查询结果框中显示出来即可。

在这里投机取巧偷个懒,直接当调包侠了,即这里直接使用了python的fuzzywuzzy包。

fuzzywuzzy是一个可以对字符串进行模糊匹配的小工具,使用起来非常简单。

这里我们直接调用它的partial_ratio方法来匹配两段话的相似度,并将相似度大于给定阈值的所有段落显示在结果框中。具体而言,代码实现如下:

  1. '''查询'''
  2. def inquiry(self):
  3. sentence = self.line_edit.text()
  4. matched = []
  5. score_thresh = self.getScoreThresh()
  6. if not sentence:
  7. QMessageBox.warning(self, "Warning", '请先输入需要查询的鲁迅名言')
  8. else:
  9. for p in self.paragraphs:
  10. score = fuzz.partial_ratio(p, sentence)
  11. if score >= score_thresh and len(sentence) <= len(p):
  12. matched.append([score, p])
  13. infos = []
  14. for match in matched:
  15. infos.append('[匹配度]: %d\n[内容]: %s\n' % (match[0], match[1]))
  16. if not infos:
  17. infos.append('未匹配到任何相似度大于%d的句子.\n' % score_thresh)
  18. self.text.setText('\n\n\n'.join(infos)[:-1])

文章到这里就结束了,感谢你的观看,下篇文章不用声卡让电脑自己哼起歌

为了感谢vb.net教程读者c#教程们,我想把python教程我最近收藏的一些编程干货分享给大家,回馈每一个读者,希望能帮到你们。

相关技术文章

点击QQ咨询
开通会员
返回顶部
×
微信扫码支付
微信扫码支付
确定支付下载
请使用微信描二维码支付
×

提示信息

×

选择支付方式

  • 微信支付
  • 支付宝付款
确定支付下载