如何利用Python实现一个论文降重工具


Posted in Python onJuly 09, 2021

前言

时值毕业季,有不少小伙伴深受论文查重的困扰。因此我便想到做一个简单的自动去重的工具,先看看效果,我们再对原理或是代码实现做进一步的分析。

首先需要输入appid以及key,这些可以在百度翻译开放平台申请一个账号,可以免费申请一个账号。接着将需要进行降重的文本内容复制到相应的输入框内,点击开始按钮,即可输出不同但意思相近的语句,即达到降重去重的作用。点击复制按钮便可以将得到的新文本复制到剪贴板上,点击清楚按钮可以重新输入需要降重的文本,并且循环往复地进行。

如何利用Python实现一个论文降重工具

去重原理

论文查重的粒度是句子,两个句子的相似度主要取决于句子包含哪些词,以及词在句子中的位置。句子相似度只是文字上的对比,不考虑语义上的相近。

正因如此,我们可以采取的措施便是变换句子结构,使用近似词替换。

为了完成这些句子的自动替换,从而达到降重的目的,这里很容易便想到利用不同语种之间的互相转换来生成新文本。比如在本工具中,我采用了中文→英文→韩文→中文的策略,你也可以采取更长的转换路径,但那样似乎会在很大程度上降低文本的可读性。

开放平台的使用

语句的翻译我采用了百度翻译开放平台的接口,简单地申请之后就可以获取每个月200万的免费字符翻译权限。

此API的接入方式略微有些麻烦,需要生成签名sign并且拼接完整的url。

def translate(q,lan_from,lan_to):
    url = 'http://api.fanyi.baidu.com/api/trans/vip/translate'
    salt = random.randint(1, 65536)
    sign = hashlib.md5((str(appid)+str(q)+str(salt)+str(key)).encode('utf-8')).hexdigest()
    params = {
        'from' :lan_from,
        'to' :lan_to,
        'salt' : salt,
        'sign' : sign,
        'appid' : appid,
        'q': q
    }
    r = requests.get(url,params=params)
    txt = r.json()
    if txt.get('trans_result', -1) == -1:
        print('ERROR Code:{}'.format(txt))
        return q
    return txt['trans_result'][0]['dst']

总结

在弄清楚原理以及API的调用方法之后,我们可以轻松地写出一个GUI界面,也就是这个降重工具。当然这个工具非常初级,大家可以进行更加全面的扩展。

到此这篇关于如何利用Python实现一个论文降重工具的文章就介绍到这了,更多相关Python论文降重工具内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
进一步了解Python中的XML 工具
Apr 13 Python
Django与遗留的数据库整合的方法指南
Jul 24 Python
使用Python+Splinter自动刷新抢12306火车票
Jan 03 Python
对numpy中数组转置的求解以及向量内积计算方法
Oct 31 Python
Python 调用 zabbix api的方法示例
Jan 06 Python
python 调用pyautogui 实时获取鼠标的位置、移动鼠标的方法
Aug 27 Python
Python3 pandas 操作列表实例详解
Sep 23 Python
python 求10个数的平均数实例
Dec 16 Python
详解python方法之绑定方法与非绑定方法
Aug 17 Python
15个Pythonic的代码示例(值得收藏)
Oct 29 Python
scrapy实践之翻页爬取的实现
Jan 05 Python
selenium如何定位span元素的实现
Jan 13 Python
python实现MD5进行文件去重的示例代码
深入浅析python3 依赖倒置原则(示例代码)
Jul 09 #Python
Python中Selenium对Cookie的操作方法
Python常用配置文件ini、json、yaml读写总结
图文详解matlab原始处理图像几何变换
Django中session进行权限管理的使用
python利用pandas分析学生期末成绩实例代码
You might like
PHP 中使用explode()函数切割字符串为数组的示例
2017/05/06 PHP
jquery select操作的日期联动实现代码
2009/12/06 Javascript
actionscript与javascript的区别
2011/05/25 Javascript
jquery实现的让超出显示范围外的导航自动固定屏幕最顶上
2011/09/22 Javascript
JavaScript学习笔记(一) js基本语法
2011/10/25 Javascript
jQuery对下拉框,单选框,多选框的操作
2014/02/21 Javascript
一个判断抢购时间是否到达的简单的js函数
2014/06/23 Javascript
Firefox下无法正常显示年份的解决方法
2014/09/04 Javascript
JavaScript设计模式之工厂模式和构造器模式
2015/02/11 Javascript
javascript判断css3动画结束 css3动画结束的回调函数
2015/03/10 Javascript
jquery使用经验小结
2015/05/20 Javascript
jQuery实现单击弹出Div层窗口效果(可关闭可拖动)
2015/09/19 Javascript
js将json格式的对象拼接成复杂的url参数方法
2016/05/25 Javascript
浅析Javascript中bind()方法的使用与实现
2016/05/30 Javascript
微信小程序 toast 详解及实例代码
2016/11/09 Javascript
详解jQuery的Cookie插件
2016/11/23 Javascript
浅谈SpringMVC中post checkbox 多选框value的值(隐藏域方式)
2018/01/08 Javascript
Vue点击切换Class变化,实现Active当前样式操作
2020/07/17 Javascript
利用Python命令行传递实例化对象的方法
2016/11/02 Python
python实现俄罗斯方块
2018/06/26 Python
对python 匹配字符串开头和结尾的方法详解
2018/10/27 Python
Python如何访问字符串中的值
2020/02/09 Python
python 实现图像快速替换某种颜色
2020/06/04 Python
Python使用正则表达式实现爬虫数据抽取
2020/08/17 Python
波兰香水和化妆品购物网站:Notino.pl
2017/11/07 全球购物
英国领先的露营和露营车品牌之一:OLPRO
2019/08/06 全球购物
介绍一下Ruby的多线程处理
2013/02/01 面试题
金融管理应届生求职信
2014/02/20 职场文书
2014年教师节寄语
2014/08/11 职场文书
2014年班长个人工作总结
2014/11/14 职场文书
飞屋环游记观后感
2015/06/08 职场文书
法人代表证明书范本
2015/06/18 职场文书
傅雷家书读书笔记
2015/06/29 职场文书
Python数据可视化之绘制柱状图和条形图
2021/05/25 Python
一条 SQL 语句执行过程
2022/03/17 MySQL
SpringCloud Function SpEL注入漏洞分析及环境搭建
2022/04/08 Java/Android