作為國內(nèi)三大學(xué)術(shù)論文數(shù)據(jù)商(知網(wǎng)、萬方、維普)之一,在論文檢測市場中,知網(wǎng)是絕大多數(shù)高校和中文期刊定稿論文必用的查重系統(tǒng),搜索量最大,萬方次之,維普最小。 越來越緊的學(xué)術(shù)政策下,高校畢業(yè)論文或者雜志社的投稿期刊文章,都要首先經(jīng)過知網(wǎng)學(xué)術(shù)不端系統(tǒng)的檢測,只有查重比例合格了才能進入下一環(huán)節(jié)。
第2點就是我們在進行查重的時候,知網(wǎng)查重系統(tǒng)是把學(xué)生的論文和自己的數(shù)據(jù)庫進行比較,數(shù)據(jù)庫雖然有英文和小語種數(shù)據(jù)庫,但是相對于中文數(shù)據(jù)庫來說,這些數(shù)據(jù)庫并沒有中文數(shù)據(jù)庫那么的廣泛,我們在引用文獻的時候如果引用外國文獻的觀點并且把它翻譯成中文,那么在進行比對的時候就不容易判定我們重復(fù)。 所以對于很多學(xué)生來說,他們都不了解知網(wǎng)查重機制,以至于自己查重查了好幾遍都沒有在學(xué)校的重復(fù)率標(biāo)準(zhǔn)以下。
知網(wǎng)論文查重采用最先進的語義模糊算法,關(guān)注 句子中心意思和關(guān)鍵詞 ,「了、著、的、可以」等虛詞的修改并不會降低重復(fù)率。 從圖 3-5 可以看出,雖然查重報告左右兩邊紅色部分內(nèi)容并不完全一致,但是系統(tǒng)會智能判定為語句重復(fù)。
7.當(dāng)知網(wǎng)查重系統(tǒng)識別到你論文中有某句話涉嫌抄襲的時候,它就會對這句話的前面后面部分都重點進行模糊識別,這個時候判斷標(biāo)準(zhǔn)就變得更嚴(yán)格,僅僅加一些副詞或虛詞 (比如“的”、“然后”、“但是”、“所以”此類詞語)是能夠識別出來的。 但這樣子的識別方式有時候會顯得不是很智能,可能會扯上一篇完全不相干的論文說是內(nèi)容相似,這個就屬于比較無奈的情況了。