如何利用Python实现一个论文降重工具


Posted in Python onJuly 09, 2021

前言

时值毕业季,有不少小伙伴深受论文查重的困扰。因此我便想到做一个简单的自动去重的工具,先看看效果,我们再对原理或是代码实现做进一步的分析。

首先需要输入appid以及key,这些可以在百度翻译开放平台申请一个账号,可以免费申请一个账号。接着将需要进行降重的文本内容复制到相应的输入框内,点击开始按钮,即可输出不同但意思相近的语句,即达到降重去重的作用。点击复制按钮便可以将得到的新文本复制到剪贴板上,点击清楚按钮可以重新输入需要降重的文本,并且循环往复地进行。

如何利用Python实现一个论文降重工具

去重原理

论文查重的粒度是句子,两个句子的相似度主要取决于句子包含哪些词,以及词在句子中的位置。句子相似度只是文字上的对比,不考虑语义上的相近。

正因如此,我们可以采取的措施便是变换句子结构,使用近似词替换。

为了完成这些句子的自动替换,从而达到降重的目的,这里很容易便想到利用不同语种之间的互相转换来生成新文本。比如在本工具中,我采用了中文→英文→韩文→中文的策略,你也可以采取更长的转换路径,但那样似乎会在很大程度上降低文本的可读性。

开放平台的使用

语句的翻译我采用了百度翻译开放平台的接口,简单地申请之后就可以获取每个月200万的免费字符翻译权限。

此API的接入方式略微有些麻烦,需要生成签名sign并且拼接完整的url。

def translate(q,lan_from,lan_to):
    url = 'http://api.fanyi.baidu.com/api/trans/vip/translate'
    salt = random.randint(1, 65536)
    sign = hashlib.md5((str(appid)+str(q)+str(salt)+str(key)).encode('utf-8')).hexdigest()
    params = {
        'from' :lan_from,
        'to' :lan_to,
        'salt' : salt,
        'sign' : sign,
        'appid' : appid,
        'q': q
    }
    r = requests.get(url,params=params)
    txt = r.json()
    if txt.get('trans_result', -1) == -1:
        print('ERROR Code:{}'.format(txt))
        return q
    return txt['trans_result'][0]['dst']

总结

在弄清楚原理以及API的调用方法之后,我们可以轻松地写出一个GUI界面,也就是这个降重工具。当然这个工具非常初级,大家可以进行更加全面的扩展。

到此这篇关于如何利用Python实现一个论文降重工具的文章就介绍到这了,更多相关Python论文降重工具内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python输出指定月份日历的方法
Apr 23 Python
python相似模块用例
Mar 04 Python
Python进行数据提取的方法总结
Aug 22 Python
Python提取网页中超链接的方法
Sep 18 Python
Python实现繁体中文与简体中文相互转换的方法示例
Dec 18 Python
Python 占位符的使用方法详解
Jul 10 Python
在python中用print()输出多个格式化参数的方法
Jul 16 Python
TensorFlow2.0:张量的合并与分割实例
Jan 19 Python
Python爬虫实现vip电影下载的示例代码
Apr 20 Python
使用Keras实现Tensor的相乘和相加代码
Jun 18 Python
python利用xlsxwriter模块 操作 Excel
Oct 14 Python
PyCharm2020.3.2安装超详细教程
Feb 08 Python
python实现MD5进行文件去重的示例代码
深入浅析python3 依赖倒置原则(示例代码)
Jul 09 #Python
Python中Selenium对Cookie的操作方法
Python常用配置文件ini、json、yaml读写总结
图文详解matlab原始处理图像几何变换
Django中session进行权限管理的使用
python利用pandas分析学生期末成绩实例代码
You might like
PHP中的正则表达式函数介绍
2012/02/27 PHP
浅析PHP中Collection 类的设计
2013/06/21 PHP
浅谈PDO的rowCount函数
2015/06/18 PHP
php 数组元素快速去重
2017/05/05 PHP
js或css实现滚动广告的几种方案
2010/01/28 Javascript
改善你的jQuery的25个步骤 千倍级效率提升
2010/02/11 Javascript
javascript 全等号运算符使用说明
2010/05/31 Javascript
De facto standard 世界上不可思议的事实标准
2010/08/29 Javascript
javascript限制文本框只允许输入数字(曾经与现在的方法对比)
2013/01/18 Javascript
jquery对元素拖动排序示例
2014/01/16 Javascript
基于MVC4+EasyUI的Web开发框架形成之旅之界面控件的使用
2015/12/16 Javascript
javascript加减乘除的简单实例
2016/07/12 Javascript
Bootstrap响应式侧边栏改进版
2016/09/17 Javascript
Vue.extend构造器的详解
2017/07/17 Javascript
vue轮播图插件vue-awesome-swiper
2017/11/27 Javascript
element-ui 设置菜单栏展开的方法
2018/08/22 Javascript
基于jQuery ztree实现表格风格的树状结构
2018/08/31 jQuery
JS判断两个数组或对象是否相同的方法示例
2019/02/28 Javascript
JavaScript实现拖拽功能
2020/02/11 Javascript
js+css3实现炫酷时钟
2020/08/18 Javascript
python时间整形转标准格式的示例分享
2014/02/14 Python
Python socket.error: [Errno 98] Address already in use的原因和解决方法
2014/08/25 Python
Python 内置函数complex详解
2016/10/23 Python
Pycharm学习教程(4) Python解释器的相关配置
2017/05/03 Python
CSS3 background-image颜色渐变的实现代码
2018/09/13 HTML / CSS
DHC中国官方购物网站:日本通信销售No.1化妆品
2016/08/20 全球购物
六道php面试题附答案
2014/06/05 面试题
决定成败的关键——创业计划书
2014/01/24 职场文书
学生会竞聘书范文
2014/03/31 职场文书
出纳试用期自我鉴定
2014/04/07 职场文书
学生上课看漫画的检讨书
2014/09/26 职场文书
坎儿井导游词
2015/02/09 职场文书
幼师求职自荐信
2015/03/26 职场文书
2019财务管理制度最新范本!
2019/07/09 职场文书
django如何自定义manage.py管理命令
2021/04/27 Python
用python修改excel表某一列内容的操作方法
2021/06/11 Python