关键词搜索

源码搜索 ×
×

Python实用工具,PyQt5模块,Python实现根据中文姓名猜测对方性别

发布2021-08-13浏览586次

详情内容

前言:

利用贝叶斯公式,根据对方的中文姓名猜测对方的性别。废话不多说,让我们愉快地开始吧~

image.png

开发工具

Python版本:3.6.4

相关模块:

pyqt5模块;

以及一些python自带的模块。

环境搭建

安装Python并添加到环境变量,pip安装需要的相关模块即可。

原理简介

先来简单介绍一下贝叶斯公式吧,然后再来说代码实现。
我们都知道,事件A在事件B已经发生的条件下发生的概率为:

image.png

如果A和B是两个相互独立的事件,则有:

image.png

显然,我们可以利用上面的公式来判断两个事件是否独立。再来引入一下全概率公式(上标c代表补集):

image.png

上面的公式画个维恩图的话其实很好理解(图源网络):

图片

综合上面的结论,我们可以很容易地推出贝叶斯公式来:

image.png

实际应用到我们的姓名猜测性别中的话,其实就是求:

image.png

显然,我们有:

image.png

这里我们已知每个汉字在男性名字和女性名字中出现的频率:

图片

我们可以假设他们是独立的,例如:

image.png

  1. def genderprob(name, probs, type_='male'):
  2. assert type_ in ['male', 'female']
  3. if type_ == 'male':
  4. p = self.male_total / self.total
  5. for c in name:
  6. p *= probs.get(c, (0, 0))[0]
  7. else:
  8. p = self.female_total / self.total
  9. for c in name:
  10. p *= probs.get(c, (0, 0))[1]
  11. return p

还是以刘亦菲为例:

  1. P(女性) = 女性姓名出现的次数 / 总出现次数
  2. P(刘|女) = 刘在女性姓名中出现的次数 / 女性姓名出现的总次数

分母在做除法的时候可以约去,所以不用算,即:

  1. male_prob = genderprob(name, self.name_probs, 'male')
  2. female_prob = genderprob(name, self.name_probs, 'female')
  3. result = {'male': male_prob / (male_prob + female_prob), 'female': female_prob / (male_prob + female_prob)}

然后利用PyQt5给这个姓名预测性别的小模型做个简单的可视化界面:

image.png

文章vb.net教程到这里c#教程就结束了,感谢python教程你的观看,下篇文章分享自动生成艺术签名的小工具

为了感谢读者们,我想把我最近收藏的一些编程干货分享给大家,回馈每一个读者,希望能帮到你们。

相关技术文章

点击QQ咨询
开通会员
返回顶部
×
微信扫码支付
微信扫码支付
确定支付下载
请使用微信描二维码支付
×

提示信息

×

选择支付方式

  • 微信支付
  • 支付宝付款
确定支付下载