知網(wǎng)查重,是以“連續(xù)13個字重復”做為識別標準。 如果找不到連續(xù)13個字與別人的文章相同,就檢測不到重復。 (3)
封面、摘要、緒論、第一章、第二章、等等這樣一系列的都會各自分成一個片段來檢測,每一個片段都計算出一個相似度,再通過這樣每章的相似度來計算出整篇論文的總重復率。 當知網(wǎng)查重系統(tǒng)識別到你論文中有某句話涉嫌抄襲的時候,它就會對這句話的前面后面部分都重點進行模糊識別,這個時候判斷標準就變得更嚴格,僅僅加一些副詞或虛詞 (比如“的”、“然后”、“但是”、“所以”此類詞語)是能夠識別出來的。 在知網(wǎng)查重進行中,檢測系統(tǒng)只能識別文字部分,論文中的圖片、word域代碼、mathtype編輯的公式、是不檢測的,因為檢測系統(tǒng)尚無法識別這些復雜的內容格式。
查重系統(tǒng)中主要包含兩種查重范圍:一.學術文獻類,如知網(wǎng)萬方中的碩博畢業(yè)論文,期刊會議文獻等。 二.網(wǎng)絡文字,以百度文庫為首的搜索網(wǎng)站,另外告訴一下大家百度文庫中有百分之80的文章都是復制于知網(wǎng)資料。 而只有一種情況,查重是查不到的,那就是以紙質版為主的著作書籍。