大致上來說,知網(wǎng)查重算法采用的是一種根據(jù)語義模糊解析算法,用近似比對的方式進(jìn)行重復(fù)率檢測。 而不是簡單地基于某個(gè)最小語句為單位(比如傳說中的“13個(gè)字連續(xù)一樣”),進(jìn)行“循環(huán)比對”這么簡單。
知網(wǎng)論文查重系統(tǒng)計(jì)算的總字?jǐn)?shù),是Word文檔里統(tǒng)計(jì)的字符總數(shù)(計(jì)空格),而不是單純的依據(jù)Word里所統(tǒng)計(jì)的字?jǐn)?shù)。 所以說,不合理的排版(空格)格式,對于各位專家學(xué)者們進(jìn)行知網(wǎng)論文查重是有著不小的阻礙作用的。 知網(wǎng)查重時(shí)表格里面的內(nèi)容也會算字?jǐn)?shù),而簡單的Word統(tǒng)計(jì)的時(shí)候一般表格統(tǒng)計(jì)不到字?jǐn)?shù)。 這也就是說,知網(wǎng)論文查重入口可以有效的辨別表格是否是重復(fù)的的問題。 每篇文章基本都會有英文摘要或者英文參考文獻(xiàn),對于英文更占字符數(shù)了。
知網(wǎng)查重沒有13個(gè)字符就被判斷為抄襲這種說法,知網(wǎng)所采用的算法是自適應(yīng)多階指紋特征檢測技術(shù)。 而13個(gè)字符為重復(fù)知識江湖傳說。 若有侵權(quán),請告知本答主,將會修改或者刪除。 大致上來說,知網(wǎng)查重算法采用的是一種根據(jù)語義模糊解析算法,用近似比對的方式進(jìn)行重復(fù)率檢測。
知網(wǎng)檢測論文的重復(fù)性是按照13個(gè)字的連續(xù)性作為判斷的根據(jù),若作者希望修改后的論文查重沒有那么高,就可以先選擇將論文13個(gè)字相連的地方做修改,修改后保證13個(gè)字與字之間的內(nèi)容與抄襲的原作者文章內(nèi)容不一致,這樣過檢測的概率會很高。 學(xué)術(shù)不端網(wǎng) 覺得,按照目前的論文檢測系統(tǒng)來說,是非常容易的,只需要做簡單的修改,等到以后會不會縮短字?jǐn)?shù)進(jìn)行查重檢測就不得而知了。