如何利用Python实现一个论文降重工具


Posted in Python onJuly 09, 2021

前言

时值毕业季,有不少小伙伴深受论文查重的困扰。因此我便想到做一个简单的自动去重的工具,先看看效果,我们再对原理或是代码实现做进一步的分析。

首先需要输入appid以及key,这些可以在百度翻译开放平台申请一个账号,可以免费申请一个账号。接着将需要进行降重的文本内容复制到相应的输入框内,点击开始按钮,即可输出不同但意思相近的语句,即达到降重去重的作用。点击复制按钮便可以将得到的新文本复制到剪贴板上,点击清楚按钮可以重新输入需要降重的文本,并且循环往复地进行。

如何利用Python实现一个论文降重工具

去重原理

论文查重的粒度是句子,两个句子的相似度主要取决于句子包含哪些词,以及词在句子中的位置。句子相似度只是文字上的对比,不考虑语义上的相近。

正因如此,我们可以采取的措施便是变换句子结构,使用近似词替换。

为了完成这些句子的自动替换,从而达到降重的目的,这里很容易便想到利用不同语种之间的互相转换来生成新文本。比如在本工具中,我采用了中文→英文→韩文→中文的策略,你也可以采取更长的转换路径,但那样似乎会在很大程度上降低文本的可读性。

开放平台的使用

语句的翻译我采用了百度翻译开放平台的接口,简单地申请之后就可以获取每个月200万的免费字符翻译权限。

此API的接入方式略微有些麻烦,需要生成签名sign并且拼接完整的url。

def translate(q,lan_from,lan_to):
    url = 'http://api.fanyi.baidu.com/api/trans/vip/translate'
    salt = random.randint(1, 65536)
    sign = hashlib.md5((str(appid)+str(q)+str(salt)+str(key)).encode('utf-8')).hexdigest()
    params = {
        'from' :lan_from,
        'to' :lan_to,
        'salt' : salt,
        'sign' : sign,
        'appid' : appid,
        'q': q
    }
    r = requests.get(url,params=params)
    txt = r.json()
    if txt.get('trans_result', -1) == -1:
        print('ERROR Code:{}'.format(txt))
        return q
    return txt['trans_result'][0]['dst']

总结

在弄清楚原理以及API的调用方法之后,我们可以轻松地写出一个GUI界面,也就是这个降重工具。当然这个工具非常初级,大家可以进行更加全面的扩展。

到此这篇关于如何利用Python实现一个论文降重工具的文章就介绍到这了,更多相关Python论文降重工具内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
pyqt和pyside开发图形化界面
Jan 22 Python
基于Python_脚本CGI、特点、应用、开发环境(详解)
May 23 Python
Python实现网站注册验证码生成类
Jun 08 Python
pandas多级分组实现排序的方法
Apr 20 Python
python celery分布式任务队列的使用详解
Jul 08 Python
python读写csv文件的方法
Aug 13 Python
使用Python生成200个激活码的实现方法
Nov 22 Python
Django3.0 异步通信初体验(小结)
Dec 04 Python
python中property和setter装饰器用法
Dec 19 Python
Pytorch中.new()的作用详解
Feb 18 Python
Python matplotlib 绘制双Y轴曲线图的示例代码
Jun 12 Python
Python txt文件如何转换成字典
Nov 03 Python
python实现MD5进行文件去重的示例代码
深入浅析python3 依赖倒置原则(示例代码)
Jul 09 #Python
Python中Selenium对Cookie的操作方法
Python常用配置文件ini、json、yaml读写总结
图文详解matlab原始处理图像几何变换
Django中session进行权限管理的使用
python利用pandas分析学生期末成绩实例代码
You might like
ThinkPHP中处理表单中的注意事项
2014/11/22 PHP
php中的观察者模式简单实例
2015/01/20 PHP
基于Laravel实现的用户动态模块开发
2017/09/21 PHP
js滚动条回到顶部的代码
2011/12/06 Javascript
js网页中的(运行代码)功能实现思路
2013/02/04 Javascript
js onload事件不起作用示例分析
2013/10/09 Javascript
JS对象转换为Jquery对象示例
2014/01/26 Javascript
js动态往表格的td中添加图片并注册事件
2014/06/12 Javascript
浅谈JavaScript Array对象
2014/12/29 Javascript
JavaScript 匿名函数和闭包介绍
2015/04/13 Javascript
jquery实现简单实用的打分程序实例
2015/07/23 Javascript
如何使用jquery修改css中带有!important的样式属性
2016/04/28 Javascript
用jQuery获取table中行id和td值的实现代码
2016/05/19 Javascript
原生js封装二级城市下拉列表的实现代码
2016/06/16 Javascript
JavaScript中boolean类型之三种情景实例代码
2016/11/21 Javascript
JavaScript触发onScroll事件的函数节流详解
2016/12/14 Javascript
从零开始实现Vue简单的Toast插件
2018/12/03 Javascript
玩转Koa之koa-router原理解析
2018/12/29 Javascript
SSM+layUI 根据登录信息显示不同的页面方法
2019/09/20 Javascript
Vue 开发必须知道的36个技巧(小结)
2019/10/09 Javascript
详解为element-ui的Select和Cascader添加弹层底部操作按钮
2020/02/07 Javascript
解决idea开发遇到javascript动态添加html元素时中文乱码的问题
2020/09/29 Javascript
[43:03]完美世界DOTA2联赛PWL S2 PXG vs Magma 第二场 11.21
2020/11/24 DOTA
Python中使用装饰器来优化尾递归的示例
2016/06/18 Python
Python Paramiko模块的使用实际案例
2018/02/01 Python
简单了解django缓存方式及配置
2019/07/19 Python
浅谈Pytorch中的torch.gather函数的含义
2019/08/18 Python
python 实现多维数组转向量
2019/11/30 Python
matplotlib 画双轴子图无法显示x轴的解决方法
2020/07/27 Python
Corelle官方网站:购买康宁餐具
2016/11/02 全球购物
JD Sports荷兰:英国领先的运动时尚零售商
2020/03/13 全球购物
澳大利亚在线划船、露营和钓鱼商店:BCF Australia
2020/03/22 全球购物
《庐山的云雾》教学反思
2014/04/22 职场文书
2015年圣诞节活动总结
2015/03/24 职场文书
一文彻底理解js原生语法prototype,__proto__和constructor
2021/10/24 Javascript
vue组件冲突之引用另一个组件出现组件不显示的问题
2022/04/13 Vue.js