如何利用Python实现一个论文降重工具


Posted in Python onJuly 09, 2021

前言

时值毕业季,有不少小伙伴深受论文查重的困扰。因此我便想到做一个简单的自动去重的工具,先看看效果,我们再对原理或是代码实现做进一步的分析。

首先需要输入appid以及key,这些可以在百度翻译开放平台申请一个账号,可以免费申请一个账号。接着将需要进行降重的文本内容复制到相应的输入框内,点击开始按钮,即可输出不同但意思相近的语句,即达到降重去重的作用。点击复制按钮便可以将得到的新文本复制到剪贴板上,点击清楚按钮可以重新输入需要降重的文本,并且循环往复地进行。

如何利用Python实现一个论文降重工具

去重原理

论文查重的粒度是句子,两个句子的相似度主要取决于句子包含哪些词,以及词在句子中的位置。句子相似度只是文字上的对比,不考虑语义上的相近。

正因如此,我们可以采取的措施便是变换句子结构,使用近似词替换。

为了完成这些句子的自动替换,从而达到降重的目的,这里很容易便想到利用不同语种之间的互相转换来生成新文本。比如在本工具中,我采用了中文→英文→韩文→中文的策略,你也可以采取更长的转换路径,但那样似乎会在很大程度上降低文本的可读性。

开放平台的使用

语句的翻译我采用了百度翻译开放平台的接口,简单地申请之后就可以获取每个月200万的免费字符翻译权限。

此API的接入方式略微有些麻烦,需要生成签名sign并且拼接完整的url。

def translate(q,lan_from,lan_to):
    url = 'http://api.fanyi.baidu.com/api/trans/vip/translate'
    salt = random.randint(1, 65536)
    sign = hashlib.md5((str(appid)+str(q)+str(salt)+str(key)).encode('utf-8')).hexdigest()
    params = {
        'from' :lan_from,
        'to' :lan_to,
        'salt' : salt,
        'sign' : sign,
        'appid' : appid,
        'q': q
    }
    r = requests.get(url,params=params)
    txt = r.json()
    if txt.get('trans_result', -1) == -1:
        print('ERROR Code:{}'.format(txt))
        return q
    return txt['trans_result'][0]['dst']

总结

在弄清楚原理以及API的调用方法之后,我们可以轻松地写出一个GUI界面,也就是这个降重工具。当然这个工具非常初级,大家可以进行更加全面的扩展。

到此这篇关于如何利用Python实现一个论文降重工具的文章就介绍到这了,更多相关Python论文降重工具内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python写的Socks5协议代理服务器
Aug 06 Python
Python六大开源框架对比
Oct 19 Python
python 脚本生成随机 字母 + 数字密码功能
May 26 Python
python自动发送邮件脚本
Jun 20 Python
Python3连接SQLServer、Oracle、MySql的方法
Jun 28 Python
python实现决策树分类(2)
Aug 30 Python
python django框架中使用FastDFS分布式文件系统的安装方法
Jun 10 Python
django写用户登录判定并跳转制定页面的实例
Aug 21 Python
python enumerate内置函数用法总结
Jan 07 Python
使用openCV去除文字中乱入的线条实例
Jun 02 Python
Python中pass的作用与使用教程
Nov 13 Python
python中的None与NULL用法说明
May 25 Python
python实现MD5进行文件去重的示例代码
深入浅析python3 依赖倒置原则(示例代码)
Jul 09 #Python
Python中Selenium对Cookie的操作方法
Python常用配置文件ini、json、yaml读写总结
图文详解matlab原始处理图像几何变换
Django中session进行权限管理的使用
python利用pandas分析学生期末成绩实例代码
You might like
通用PHP动态生成静态HTML网页的代码
2010/03/04 PHP
PHP实现根据浏览器跳转不同语言页面代码
2013/08/02 PHP
php中的登陆login实例代码
2016/06/20 PHP
php实现快速对二维数组某一列进行组装的方法小结
2019/12/04 PHP
用JavaScript实现单继承和多继承的简单方法
2009/03/29 Javascript
JavaScript Title、alt提示(Tips)实现源码解读
2010/12/12 Javascript
js判断一个元素是否为另一个元素的子元素的代码
2012/03/21 Javascript
解析页面加载与js函数的执行 onload or ready
2013/12/12 Javascript
JS控制表格实现一条光线流动分割行的方法
2015/03/09 Javascript
深入剖析JavaScript编程中的对象概念
2015/10/21 Javascript
jquery获取css的color值返回RGB的方法
2015/12/18 Javascript
基于javascript实现表格的简单操作
2016/05/21 Javascript
微信小程序 实战小程序实例
2016/10/08 Javascript
javascript实现table单元格点击展开隐藏效果(实例代码)
2017/04/10 Javascript
详解vue 2.6 中 slot 的新用法
2019/07/09 Javascript
vue指令v-html使用过滤器filters功能实例
2019/10/25 Javascript
autojs 蚂蚁森林能量自动拾取即给指定好友浇水的实现方法
2020/05/03 Javascript
Javascript柯里化实现原理及作用解析
2020/10/22 Javascript
[02:37]2015国际邀请赛选手档案—LGD.Xiao8
2015/07/28 DOTA
python模拟鼠标拖动操作的方法
2015/03/11 Python
轻松掌握python设计模式之访问者模式
2016/11/18 Python
Python编程pygame模块实现移动的小车示例代码
2018/01/03 Python
Python针对给定字符串求解所有子序列是否为回文序列的方法
2018/04/21 Python
python tkinter图形界面代码统计工具(更新)
2019/09/18 Python
python Django框架实现web端分页呈现数据
2019/10/31 Python
Html5 canvas实现粒子时钟的示例代码
2018/09/06 HTML / CSS
阿联酋电子产品购物网站:Menakart
2017/09/15 全球购物
经理助理岗位职责
2014/03/05 职场文书
运动会演讲稿200字
2014/08/25 职场文书
单位在职证明书
2014/09/11 职场文书
办理收楼委托书范本
2014/10/09 职场文书
财务个人年度总结范文
2015/02/26 职场文书
公司人事任命通知
2015/04/20 职场文书
python绘制箱型图
2021/04/27 Python
OpenCV-Python实现轮廓拟合
2021/06/08 Python
Python Django项目和应用的创建详解
2021/11/27 Python