知網(wǎng)論文檢測(cè)系統(tǒng)是在一句話連續(xù)13個(gè)字重復(fù),并且超過該段落的閥值5%,就會(huì)被視為重復(fù)或者抄襲,并且標(biāo)紅顯示,知網(wǎng)查重率就是重復(fù)的總字?jǐn)?shù)除以論文總字?jǐn)?shù)計(jì)算得到的,知網(wǎng)章節(jié)查重率就是章節(jié)重復(fù)字?jǐn)?shù)除以章節(jié)總字?jǐn)?shù)得到的。 因此降低知網(wǎng)查重率可以通過多分段落,將論文引用內(nèi)容低于13個(gè)字來降低知網(wǎng)查重率。 綜上所述:知網(wǎng)查重連續(xù)多少字算重復(fù)? 它是連續(xù)13字一樣就算重復(fù)的,不過它們會(huì)進(jìn)行分章節(jié)計(jì)算并且重復(fù)字?jǐn)?shù)超過了該段落的閥值5%,否則也是不會(huì)算重復(fù)的。
大致上來說,知網(wǎng)查重算法采用的是一種根據(jù)語義模糊解析算法,用近似比對(duì)的方式進(jìn)行重復(fù)率檢測(cè)。 而不是簡(jiǎn)單地基于某個(gè)最小語句為單位(比如傳說中的“13個(gè)字連續(xù)一樣”),進(jìn)行“循環(huán)比對(duì)”這么簡(jiǎn)單。
封面、摘要、緒論、第一章、第二章、等等這樣一系列的都會(huì)各自分成一個(gè)片段來檢測(cè),每一個(gè)片段都計(jì)算出一個(gè)相似度,再通過這樣每章的相似度來計(jì)算出整篇論文的總重復(fù)率。 當(dāng)知網(wǎng)查重系統(tǒng)識(shí)別到你論文中有某句話涉嫌抄襲的時(shí)候,它就會(huì)對(duì)這句話的前面后面部分都重點(diǎn)進(jìn)行模糊識(shí)別,這個(gè)時(shí)候判斷標(biāo)準(zhǔn)就變得更嚴(yán)格,僅僅加一些副詞或虛詞 (比如“的”、“然后”、“但是”、“所以”此類詞語)是能夠識(shí)別出來的。 在知網(wǎng)查重進(jìn)行中,檢測(cè)系統(tǒng)只能識(shí)別文字部分,論文中的圖片、word域代碼、mathtype編輯的公式、是不檢測(cè)的,因?yàn)闄z測(cè)系統(tǒng)尚無法識(shí)別這些復(fù)雜的內(nèi)容格式。
知網(wǎng)論文查重系統(tǒng) 是以章為基本單元的。 比如封面、摘要、緒論都會(huì)作為單獨(dú)的一章,每一章出一個(gè)論文檢測(cè)結(jié)果,標(biāo)明重復(fù)率。 每一章有單獨(dú)的重復(fù)率,全文還有一個(gè)總的重復(fù)率。 有的學(xué)校在規(guī)定論文是否通過查重時(shí),不僅要求全文重復(fù)率不能超過多少,還對(duì)每章重復(fù)率也有要求,以連續(xù)13個(gè)字與別的文章重復(fù)做為判斷依據(jù)的。 所以不能連續(xù)超過13字相同,否則就會(huì)標(biāo)紅。 知網(wǎng)查重是以連續(xù)13字相似做為依據(jù)的,所以只要保證論文中的每一句話都不與他人的內(nèi)容相似,然后保證任意連續(xù)13字都不同,那知網(wǎng)是檢測(cè)不出來。