Python语言之简历有错别字被拒绝聘用?文档被领导说?Python实现永无错别字!
小标 2018-08-09 来源 : 阅读 1836 评论 0

摘要:本文主要向大家介绍了Python语言之简历有错别字被拒绝聘用?文档被领导说?Python实现永无错别字!,通过具体的内容向大家展示,希望对大家学习Python语言有所帮助。

本文主要向大家介绍了Python语言之简历有错别字被拒绝聘用?文档被领导说?Python实现永无错别字!,通过具体的内容向大家展示,希望对大家学习Python语言有所帮助。

找出中文错别字


1.5 代码获取
你可以通过下面命令将代码下载到实验楼环境中,作为参照对比进行学习。
$ wget //labfile.oss.aliyuncs.com/courses/828/Document.tar

 

可以预想到,假设我们的语料库长度为 n ,我们可以以 O(1) 的时间复杂度来完成增添条目和查找条目的工作(因为我们给每个单词都设定了ID,所以可以直接访问前后关系对应的内存块),但是这个矩阵会占据 O(n*n)的空间,而且这是一个稀疏矩阵,很多的空间被浪费了。

 

三、开发准备
打开Xfce终端,进入 Code 目录,创建 ChineseSpellingCheck 文件夹, 将其作为课程的工作目录。
本次实验建议在 virtualenv 环境下进行。
关于 virtualenv,请看 virtualenv 介绍
首先安装 virtualenv



五、实验步骤
5.1 实现前后关系字典
创建文件夹 Code
在 Code 文件夹中创建文件 CountOfNumbers.py
我们先导入我们这次实验需要的包


word[0].encode("UTF-8") 的作用是检测英文的出现,如果一个中文字符如果没有通过 "UTF-8" 编码,也会被isalpha() 函数认为是一个英文字符。
我们继续我们的 CountOfNumbers.py 的编写



由于这个系统服务的对象是实验楼未来的文档,所以最佳的语料库就是实验楼现有的众多文档。在上一节中我们已经学习了怎么样创建并保存我们的 前后关系 字典。由于实验楼内部的文档不方便公开,我们没有直接提供语料库,而是提供了最终生成的字典。
之前也讨论了,再大的语料库,都不可能覆盖所有中文单词搭配。所以我们需要搜索引擎的场外助攻。
首先请下载我们的数据


查看网站的源码,我们发现有关 创建文档 的标题都用  标签标示了出来。
如果一个搭配不常出现。

搜索引擎会自动询问 是否只需要 --- 的结果
或者搜索引擎的标题中很少有该中文单词搭配的高亮结果。


我们还需要一个函数来判断这个搭配是否常用。这个函数相对来说比较简单,如果我们的单词单配在搜索引擎中出现次数超过3次,那么我们就认为它是一个常见的搭配。



获得我们的数据,并对测试文件进行分词。把没有在前后关系文档中出现的搭配放到 SuspiciousList 当中去。( suspicious adj.有嫌疑的)

获得了 SuspiciousList 之后,我们可以通过搜索引擎的判断来获得最终的错误单词列表 WrongWordList

5.4 把错误的单词在HTML文件中高亮
我们在找出错误的单词之后,肯定想看一看单词在原文中的位置方便修改。实验楼所有的文档都是 .md 的 MarkDown 格式书写的,没有办法直接高亮。但是我们可以吧 MarkDown 解析成 HTML 然后在网页上对错误的单词进行高亮操作。

 

本文由职坐标整理并发布,希望对同学们学习Python有所帮助,更多内容请关注职坐标编程语言Python频道!

本文由 @小标 发布于职坐标。未经许可,禁止转载。
喜欢 | 0 不喜欢 | 0
看完这篇文章有何感觉?已经有0人表态,0%的人喜欢 快给朋友分享吧~
评论(0)
后参与评论

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场 匹配合适岗位
验证码手机号,获得海同独家IT培训资料
选择就业方向:
人工智能物联网
大数据开发/分析
人工智能Python
Java全栈开发
WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了,明天再试试吧!

提交

我们会在第一时间安排职业规划师联系您!

您也可以联系我们的职业规划师咨询:

小职老师的微信号:z_zhizuobiao
小职老师的微信号:z_zhizuobiao

版权所有 职坐标-一站式AI+学习就业服务平台 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
 沪公网安备 31011502005948号    

©2015 www.zhizuobiao.com All Rights Reserved