論文的查重粒度是句子,兩個(gè)句子的相似度主要取決于句子包含哪些詞,以及詞在句子中的位置。 目前句子相似度只有文字上的對(duì)比,不考慮語(yǔ)義上的相近。 被系統(tǒng)自動(dòng)識(shí)別出來(lái)的非正文部分(如目錄,標(biāo)題,公式,圖表,參考文獻(xiàn)等)不參與檢測(cè),檢測(cè)字?jǐn)?shù)一般略小于論文字?jǐn)?shù)。