上圖是知網(wǎng)查重系統(tǒng)的檢測范圍,也就是俗稱的查重數(shù)據(jù)庫,從中可以看到大部分是知網(wǎng)自己收錄的文獻,文章資料,比如碩博論文,學術期刊,會議,報紙,專利,圖書資源等,同時也有互聯(lián)網(wǎng)資源庫,互聯(lián)網(wǎng)文檔資源,同時還涵蓋了英文數(shù)據(jù)庫,港澳臺數(shù)據(jù)庫等,數(shù)據(jù)庫范圍是非常的廣泛。
知網(wǎng)本身就是數(shù)據(jù)商,都是自己建設的,通過高校、雜志社等途徑購買。具體數(shù)據(jù)包括如下:
一般是各大期刊發(fā)表的論文,以及碩博士論文
8、所有大學生在寫畢業(yè)論文時,必須經(jīng)歷的一步就是查重目前所有高校對畢業(yè)論文查重都有明確要求怎么查論文的重復率paperfree小編給大家講解重復率是判斷學生論文是否符合標準的依據(jù)論文重復率測試將直接影響學生能否順利進入。
樓上所言連續(xù)30字可能是以前的標準了。。。。我上周用萬方查過,連續(xù)5字都查出來了的,至于具體多少字,我不太清楚,但是不會超過12字。。。。而且它會自動去掉標點,像“的”“了”等詞匯,它也很可能過濾出來,將前后連接檢測出重復來。還有段落重復率檢測等等。。。。百度上的很多東西其實網(wǎng)上論文里面可能都存在。。。。我就是百度上找的很多東西,各種亂改,結果跑去萬方,發(fā)現(xiàn)有些本來不一樣的都改得跟很多論文一樣了。。。。第一次查出了40%的重復率(當然還沒有加參考文獻尾注,加了尾注的部分應該不算重復率)。。。。后來改了一遍,各種修改詞匯,改語序,改內(nèi)容順序等等,最后降到了3%以內(nèi)了。。。。不過據(jù)說知網(wǎng)會比萬方高8%左右。。。。
萬方和知網(wǎng)是根據(jù)你的論文和他數(shù)據(jù)庫收錄的論文進行比對的,若有連續(xù)30字一樣就認定抄襲,不包括網(wǎng)上百度的。