如何利用Python实现一个论文降重工具


Posted in Python onJuly 09, 2021

前言

时值毕业季,有不少小伙伴深受论文查重的困扰。因此我便想到做一个简单的自动去重的工具,先看看效果,我们再对原理或是代码实现做进一步的分析。

首先需要输入appid以及key,这些可以在百度翻译开放平台申请一个账号,可以免费申请一个账号。接着将需要进行降重的文本内容复制到相应的输入框内,点击开始按钮,即可输出不同但意思相近的语句,即达到降重去重的作用。点击复制按钮便可以将得到的新文本复制到剪贴板上,点击清楚按钮可以重新输入需要降重的文本,并且循环往复地进行。

如何利用Python实现一个论文降重工具

去重原理

论文查重的粒度是句子,两个句子的相似度主要取决于句子包含哪些词,以及词在句子中的位置。句子相似度只是文字上的对比,不考虑语义上的相近。

正因如此,我们可以采取的措施便是变换句子结构,使用近似词替换。

为了完成这些句子的自动替换,从而达到降重的目的,这里很容易便想到利用不同语种之间的互相转换来生成新文本。比如在本工具中,我采用了中文→英文→韩文→中文的策略,你也可以采取更长的转换路径,但那样似乎会在很大程度上降低文本的可读性。

开放平台的使用

语句的翻译我采用了百度翻译开放平台的接口,简单地申请之后就可以获取每个月200万的免费字符翻译权限。

此API的接入方式略微有些麻烦,需要生成签名sign并且拼接完整的url。

def translate(q,lan_from,lan_to):
    url = 'http://api.fanyi.baidu.com/api/trans/vip/translate'
    salt = random.randint(1, 65536)
    sign = hashlib.md5((str(appid)+str(q)+str(salt)+str(key)).encode('utf-8')).hexdigest()
    params = {
        'from' :lan_from,
        'to' :lan_to,
        'salt' : salt,
        'sign' : sign,
        'appid' : appid,
        'q': q
    }
    r = requests.get(url,params=params)
    txt = r.json()
    if txt.get('trans_result', -1) == -1:
        print('ERROR Code:{}'.format(txt))
        return q
    return txt['trans_result'][0]['dst']

总结

在弄清楚原理以及API的调用方法之后,我们可以轻松地写出一个GUI界面,也就是这个降重工具。当然这个工具非常初级,大家可以进行更加全面的扩展。

到此这篇关于如何利用Python实现一个论文降重工具的文章就介绍到这了,更多相关Python论文降重工具内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python读取mp3中ID3信息的方法
Mar 05 Python
Python使用xlrd读取Excel格式文件的方法
Mar 10 Python
详细讲解用Python发送SMTP邮件的教程
Apr 29 Python
简单上手Python中装饰器的使用
Jul 12 Python
python3.X 抓取火车票信息【修正版】
Jun 19 Python
对python读取CT医学图像的实例详解
Jan 24 Python
python调用虹软2.0第三版的具体使用
Feb 22 Python
Python中psutil的介绍与用法
May 02 Python
Python浮点数四舍五入问题的分析与解决方法
Nov 19 Python
python计算Content-MD5并获取文件的Content-MD5值方式
Apr 03 Python
Python中使用threading.Event协调线程的运行详解
May 02 Python
Python识别验证码的实现示例
Sep 30 Python
python实现MD5进行文件去重的示例代码
深入浅析python3 依赖倒置原则(示例代码)
Jul 09 #Python
Python中Selenium对Cookie的操作方法
Python常用配置文件ini、json、yaml读写总结
图文详解matlab原始处理图像几何变换
Django中session进行权限管理的使用
python利用pandas分析学生期末成绩实例代码
You might like
PHP的cURL库简介及使用示例
2015/02/06 PHP
Laravel 5 框架入门(三)
2015/04/09 PHP
php跨服务器访问方法小结
2015/05/12 PHP
ThinkPHP设置禁止百度等搜索引擎转码(简单实用)
2016/02/15 PHP
实例讲解PHP设计模式编程中的简单工厂模式
2016/02/29 PHP
javascript div 遮罩层封锁整个页面
2009/07/10 Javascript
jQuery选择器中含有空格的使用示例及注意事项
2013/08/25 Javascript
node.js中的console.log方法使用说明
2014/12/09 Javascript
js实现卡片式项目管理界面UI设计效果
2015/12/08 Javascript
分享有关jQuery中animate、slide、fade等动画的连续触发、滞后反复执行的bug
2016/01/10 Javascript
jQuery Mobile页面返回不需要重新get
2016/04/26 Javascript
Function.prototype.apply()与Function.prototype.call()小结
2016/04/27 Javascript
基于Echarts 3.19 制作常用的图形(非静态)
2016/05/19 Javascript
深入浅析javascript中的作用域(推荐)
2016/07/19 Javascript
Vuejs第十一篇组件之slot内容分发实例详解
2016/09/09 Javascript
详解基于javascript实现的苹果系统底部菜单
2016/12/02 Javascript
浅析javascript中的Event事件
2016/12/09 Javascript
JS正则截取两个字符串之间及字符串前后内容的方法
2017/01/06 Javascript
详解探索 vuex 2.0 以及使用 vuejs 2.0 + vuex 2.0 构建记事本应用
2017/06/16 Javascript
使用taro开发微信小程序遇到的坑总结
2019/04/08 Javascript
Vue+penlayers实现多边形绘制及展示
2020/12/24 Vue.js
vue.js实现点击图标放大离开时缩小的代码
2021/01/27 Vue.js
跟老齐学Python之眼花缭乱的运算符
2014/09/14 Python
Python中使用OpenCV库来进行简单的气象学遥感影像计算
2016/02/19 Python
Python2.7+pytesser实现简单验证码的识别方法
2017/12/29 Python
Linux下Pycharm、Anaconda环境配置及使用踩坑
2018/12/19 Python
Python获取好友地区分布及好友性别分布情况代码详解
2019/07/10 Python
python求绝对值的三种方法小结
2019/12/04 Python
一套带答案的C++笔试题
2014/01/10 面试题
英语专业个人求职信范文
2014/02/01 职场文书
2014年语文教师工作总结
2014/12/18 职场文书
七年级地理教学计划
2015/01/22 职场文书
工艺技术员岗位职责
2015/02/04 职场文书
幼师大班个人总结
2015/02/13 职场文书
销售合作意向书范本
2015/05/08 职场文书
个人更名证明
2015/06/23 职场文书