校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁 > 知識庫 > 如何利用Python實現(xiàn)一個論文降重工具

如何利用Python實現(xiàn)一個論文降重工具

熱門標簽:預(yù)覽式外呼系統(tǒng) 外賣地址有什么地圖標注 上海正規(guī)的外呼系統(tǒng)最新報價 長春極信防封電銷卡批發(fā) 如何地圖標注公司 電銷機器人錄音要學(xué)習(xí)什么 銀川電話機器人電話 煙臺電話外呼營銷系統(tǒng) 企業(yè)彩鈴地圖標注

前言

時值畢業(yè)季,有不少小伙伴深受論文查重的困擾。因此我便想到做一個簡單的自動去重的工具,先看看效果,我們再對原理或是代碼實現(xiàn)做進一步的分析。

首先需要輸入appid以及key,這些可以在百度翻譯開放平臺申請一個賬號,可以免費申請一個賬號。接著將需要進行降重的文本內(nèi)容復(fù)制到相應(yīng)的輸入框內(nèi),點擊開始按鈕,即可輸出不同但意思相近的語句,即達到降重去重的作用。點擊復(fù)制按鈕便可以將得到的新文本復(fù)制到剪貼板上,點擊清楚按鈕可以重新輸入需要降重的文本,并且循環(huán)往復(fù)地進行。

去重原理

論文查重的粒度是句子,兩個句子的相似度主要取決于句子包含哪些詞,以及詞在句子中的位置。句子相似度只是文字上的對比,不考慮語義上的相近。

正因如此,我們可以采取的措施便是變換句子結(jié)構(gòu),使用近似詞替換。

為了完成這些句子的自動替換,從而達到降重的目的,這里很容易便想到利用不同語種之間的互相轉(zhuǎn)換來生成新文本。比如在本工具中,我采用了中文→英文→韓文→中文的策略,你也可以采取更長的轉(zhuǎn)換路徑,但那樣似乎會在很大程度上降低文本的可讀性。

開放平臺的使用

語句的翻譯我采用了百度翻譯開放平臺的接口,簡單地申請之后就可以獲取每個月200萬的免費字符翻譯權(quán)限。

此API的接入方式略微有些麻煩,需要生成簽名sign并且拼接完整的url。

def translate(q,lan_from,lan_to):
    url = 'http://api.fanyi.baidu.com/api/trans/vip/translate'
    salt = random.randint(1, 65536)
    sign = hashlib.md5((str(appid)+str(q)+str(salt)+str(key)).encode('utf-8')).hexdigest()
    params = {
        'from' :lan_from,
        'to' :lan_to,
        'salt' : salt,
        'sign' : sign,
        'appid' : appid,
        'q': q
    }
    r = requests.get(url,params=params)
    txt = r.json()
    if txt.get('trans_result', -1) == -1:
        print('ERROR Code:{}'.format(txt))
        return q
    return txt['trans_result'][0]['dst']

總結(jié)

在弄清楚原理以及API的調(diào)用方法之后,我們可以輕松地寫出一個GUI界面,也就是這個降重工具。當然這個工具非常初級,大家可以進行更加全面的擴展。

到此這篇關(guān)于如何利用Python實現(xiàn)一個論文降重工具的文章就介紹到這了,更多相關(guān)Python論文降重工具內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python實現(xiàn)的txt文件去重功能示例
  • Python做文本按行去重的實現(xiàn)方法
  • python實現(xiàn)文本去重且不打亂原本順序
  • python讀取TXT到數(shù)組及列表去重后按原來順序排序的方法
  • Python統(tǒng)計文件中去重后uuid個數(shù)的方法
  • 對python讀寫文件去重、RE、set的使用詳解

標簽:宜昌 珠海 西寧 佳木斯 盤錦 湖北 潮州 上饒

巨人網(wǎng)絡(luò)通訊聲明:本文標題《如何利用Python實現(xiàn)一個論文降重工具》,本文關(guān)鍵詞  如何,利用,Python,實現(xiàn),一個,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《如何利用Python實現(xiàn)一個論文降重工具》相關(guān)的同類信息!
  • 本頁收集關(guān)于如何利用Python實現(xiàn)一個論文降重工具的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    主站蜘蛛池模板: 阿尔山市| 姚安县| 巴林右旗| 黄石市| 静乐县| 霍州市| 曲沃县| 鄂伦春自治旗| 淄博市| 武汉市| 武定县| 芦山县| 海伦市| 加查县| 白城市| 壶关县| 姚安县| 离岛区| 拜泉县| 错那县| 达孜县| 江华| 新巴尔虎左旗| 曲水县| 平谷区| 定兴县| 重庆市| 会宁县| 绵阳市| 荔波县| 曲阜市| 库车县| 内丘县| 高青县| 林口县| 延寿县| 岑巩县| 嘉禾县| 新安县| 宜宾县| 通州区|