如何利用Python实现一个论文降重工具


Posted in Python onJuly 09, 2021

前言

时值毕业季,有不少小伙伴深受论文查重的困扰。因此我便想到做一个简单的自动去重的工具,先看看效果,我们再对原理或是代码实现做进一步的分析。

首先需要输入appid以及key,这些可以在百度翻译开放平台申请一个账号,可以免费申请一个账号。接着将需要进行降重的文本内容复制到相应的输入框内,点击开始按钮,即可输出不同但意思相近的语句,即达到降重去重的作用。点击复制按钮便可以将得到的新文本复制到剪贴板上,点击清楚按钮可以重新输入需要降重的文本,并且循环往复地进行。

如何利用Python实现一个论文降重工具

去重原理

论文查重的粒度是句子,两个句子的相似度主要取决于句子包含哪些词,以及词在句子中的位置。句子相似度只是文字上的对比,不考虑语义上的相近。

正因如此,我们可以采取的措施便是变换句子结构,使用近似词替换。

为了完成这些句子的自动替换,从而达到降重的目的,这里很容易便想到利用不同语种之间的互相转换来生成新文本。比如在本工具中,我采用了中文→英文→韩文→中文的策略,你也可以采取更长的转换路径,但那样似乎会在很大程度上降低文本的可读性。

开放平台的使用

语句的翻译我采用了百度翻译开放平台的接口,简单地申请之后就可以获取每个月200万的免费字符翻译权限。

此API的接入方式略微有些麻烦,需要生成签名sign并且拼接完整的url。

def translate(q,lan_from,lan_to):
    url = 'http://api.fanyi.baidu.com/api/trans/vip/translate'
    salt = random.randint(1, 65536)
    sign = hashlib.md5((str(appid)+str(q)+str(salt)+str(key)).encode('utf-8')).hexdigest()
    params = {
        'from' :lan_from,
        'to' :lan_to,
        'salt' : salt,
        'sign' : sign,
        'appid' : appid,
        'q': q
    }
    r = requests.get(url,params=params)
    txt = r.json()
    if txt.get('trans_result', -1) == -1:
        print('ERROR Code:{}'.format(txt))
        return q
    return txt['trans_result'][0]['dst']

总结

在弄清楚原理以及API的调用方法之后,我们可以轻松地写出一个GUI界面,也就是这个降重工具。当然这个工具非常初级,大家可以进行更加全面的扩展。

到此这篇关于如何利用Python实现一个论文降重工具的文章就介绍到这了,更多相关Python论文降重工具内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
使用python提取html文件中的特定数据的实现代码
Mar 24 Python
Python CSV模块使用实例
Apr 09 Python
python实现将英文单词表示的数字转换成阿拉伯数字的方法
Jul 02 Python
python取代netcat过程分析
Feb 10 Python
Python request设置HTTPS代理代码解析
Feb 12 Python
用于业余项目的8个优秀Python库
Sep 21 Python
Python namedtuple命名元组实现过程解析
Jan 08 Python
python中def是做什么的
Jun 10 Python
python实现自动清理重复文件
Aug 24 Python
详解vscode实现远程linux服务器上Python开发
Nov 10 Python
pycharm激活码免费分享适用最新pycharm2020.2.3永久激活
Nov 25 Python
Python 全局空间和局部空间
Apr 06 Python
python实现MD5进行文件去重的示例代码
深入浅析python3 依赖倒置原则(示例代码)
Jul 09 #Python
Python中Selenium对Cookie的操作方法
Python常用配置文件ini、json、yaml读写总结
图文详解matlab原始处理图像几何变换
Django中session进行权限管理的使用
python利用pandas分析学生期末成绩实例代码
You might like
ThinkPHP整合百度Ueditor图文教程
2014/10/21 PHP
php通过array_push()函数添加多个变量到数组末尾的方法
2015/03/18 PHP
PHP预定义变量9大超全局数组用法详解
2016/04/23 PHP
PHP实现的Redis多库选择功能单例类
2017/07/27 PHP
仅IE9/10同时支持script元素的onload和onreadystatechange事件分析
2011/04/27 Javascript
常用Extjs工具:Extjs.util.Format使用方法
2012/03/22 Javascript
js获取键盘按键响应事件(兼容各浏览器)
2013/05/16 Javascript
解决checkbox的attr(checked)一直为undefined问题
2014/06/16 Javascript
浅谈$(document)和$(window)的区别
2015/07/15 Javascript
javascript实现右侧弹出“分享到”窗口效果
2016/02/01 Javascript
JavaScript添加随滚动条滚动窗体的方法
2016/02/23 Javascript
微信jssdk用法汇总
2016/07/16 Javascript
Vue实现双向数据绑定
2017/05/03 Javascript
Vue模板语法中数据绑定的实例代码
2019/05/17 Javascript
用Nodejs实现在终端中炒股的实现
2020/10/18 NodeJs
Vue——解决报错 Computed property "****" was assigned to but it has no setter.
2020/12/19 Vue.js
[28:42]Ti4正赛VG vs NEWBEE1
2014/07/19 DOTA
Python在Console下显示文本进度条的方法
2016/02/14 Python
numpy数组之存取文件的实现示例
2019/05/24 Python
使用python 写一个静态服务(实战)
2019/06/28 Python
python将字符串list写入excel和txt的实例
2019/07/20 Python
使用python批量转换文件编码为UTF-8的实现
2020/04/03 Python
Python如何输出百分比
2020/07/31 Python
一款CSS3实现多功能下拉菜单(带分享按)的教程
2014/11/05 HTML / CSS
推荐10个HTML5响应式框架
2016/02/25 HTML / CSS
某/etc/fstab文件中的某行如下: /dev/had5 /mnt/dosdata msdos defaults,usrquota 1 2 请解释其含义
2013/09/18 面试题
Linux如何命名文件--使用文件名时应注意
2014/05/29 面试题
同学会邀请书大全
2014/01/12 职场文书
优秀毕业生事迹材料
2014/02/12 职场文书
小学一年级学生评语
2014/04/22 职场文书
购房协议书范本
2014/10/02 职场文书
个人作风建设总结
2014/10/23 职场文书
2014年作风建设工作总结
2014/10/29 职场文书
2014年辅导员工作总结
2014/11/18 职场文书
2015年学生会部门工作总结
2015/04/21 职场文书
未发现nvidia显卡怎么办?Win11系统中未检测到nvidia显卡解决教程
2022/04/08 数码科技