封面、摘要、緒論、第一章、第二章、等等這樣一系列的都會各自分成一個片段來檢測,每一個片段都計算出一個相似度,再通過這樣每章的相似度來計算出整篇論文的總重復(fù)率。 當知網(wǎng)查重系統(tǒng)識別到你論文中有某句話涉嫌抄襲的時候,它就會對這句話的前面后面部分都重點進行模糊識別,這個時候判斷標準就變得更嚴格,僅僅加一些副詞或虛詞 (比如“的”、“然后”、“但是”、“所以”此類詞語)是能夠識別出來的。 在知網(wǎng)查重進行中,檢測系統(tǒng)只能識別文字部分,論文中的圖片、word域代碼、mathtype編輯的公式、是不檢測的,因為檢測系統(tǒng)尚無法識別這些復(fù)雜的內(nèi)容格式。
知網(wǎng)論文檢測系統(tǒng)是在一句話連續(xù)13個字重復(fù),并且超過該段落的閥值5%,就會被視為重復(fù)或者抄襲,并且標紅顯示,知網(wǎng)查重率就是重復(fù)的總字數(shù)除以論文總字數(shù)計算得到的,知網(wǎng)章節(jié)查重率就是章節(jié)重復(fù)字數(shù)除以章節(jié)總字數(shù)得到的。 因此降低知網(wǎng)查重率可以通過多分段落,將論文引用內(nèi)容低于13個字來降低知網(wǎng)查重率。 綜上所述:知網(wǎng)查重連續(xù)多少字算重復(fù)? 它是連續(xù)13字一樣就算重復(fù)的,不過它們會進行分章節(jié)計算并且重復(fù)字數(shù)超過了該段落的閥值5%,否則也是不會算重復(fù)的。
有的學(xué)校在規(guī)定論文是否通過查重時,不僅要求全文重復(fù)率不能超過多少,還對每章重復(fù)率也有要求,以連續(xù)13個字與別的文章重復(fù)做為判斷依據(jù)的。 所以不能連續(xù)超過13字相同,否則就會標紅。 知網(wǎng)查重是以連續(xù)13字相似做為依據(jù)的,所以只要保證論文中的每一句話都不與他人的內(nèi)容相似,然后保證任意連續(xù)13字都不同,那知網(wǎng)是檢測不出來。 如果論文有一處高于13字的重復(fù),那么知網(wǎng)的數(shù)據(jù)庫就會對該內(nèi)容進行模糊檢索。 修改論文時,如果只進行簡單的加字,這樣知網(wǎng)可能還是會檢測出來的,所以修改論文一定不要敷衍了事。 簡單的加“的”、“在…時”、“但是”這些詞語,還是有可能檢測出來的。
大致上來說,知網(wǎng)查重算法采用的是一種根據(jù)語義模糊解析算法,用近似比對的方式進行重復(fù)率檢測。 而不是簡單地基于某個最小語句為單位(比如傳說中的“13個字連續(xù)一樣”),進行“循環(huán)比對”這么簡單。