上截圖前我們先確定一下分析的方法:首先分成兩大類即citation和quotation,因為citation有些復(fù)雜所以先說quotation,,再一點點的測試citation,。以某論文里的一處quotation為例,并佐以Turnitin的分析: 這段quotation已經(jīng)被Turnitin檢測到,,然后是Turnitin給出的理由: 我們可以發(fā)現(xiàn)Turnitin是有理有據(jù)的,,然后Turnitin提供了與這段類似的其它essay。 我們可以發(fā)現(xiàn)Turnitin是很神奇的啊,,他仿佛就是所有大學(xué)生的essay云啊,,可以猜測Turnitin應(yīng)該也是基于大數(shù)據(jù)挖掘的某種東西。 以下是他判定的相似率。 其實還是要強調(diào)一點,,Turnitin檢測的是相似度不是抄襲度,,所以我們還應(yīng)該以一個平常心去面對。 這段話中我們改變了整體句子的語序,,可見如果只是簡單的換下先后位置是沒有用的,依然能檢測出來,,但當我們改變句子語義并變換動詞后‘lead’后就會發(fā)現(xiàn)Turnitin不會把他當做相似內(nèi)容,,即使使用了相同的名詞alliances and circumstances, 甚至名詞位置順序不變都不會再被計入相似度內(nèi),。我們再來看另一種,,如果將原先是一段的句子拆分成兩個分別放在不同段落會怎樣呢? 原諒小編在這偷了個懶,,可見Turnitin也不傻依然會被檢測到,,而且還會被歸為同一類。 接著是Turnitin走流程的提供的分析,。 再然后是Turnitin給的有相似段落文章的地址,。 為了檢測動詞是不是至關(guān)重要的被檢測相似度的依據(jù)我們來換個詞代替flow并將此句子變成被動,但意思可能就變了,,唉答主英語水平有限.... 可見動詞并不是關(guān)鍵詞,,關(guān)鍵的應(yīng)該還是英文的邏輯,假如我們改變其中名詞的順序會發(fā)生什么呢,?讓我們測試一下,。 我們可以發(fā)現(xiàn)在改變了單詞順序的情況下Turnitin已經(jīng)不再把這段話算作相似段落了。至此相信大家應(yīng)該都明白了些什么了吧,。 總結(jié)一下就是,,Turnitin檢測相似度的原理顯然不同于所謂的中文字數(shù)的重復(fù)檢測原理,Turnitin檢測的是句子在語法上的邏輯,,這與單詞是否重復(fù)是沒有關(guān)系的,,只要你使用了不同的邏輯來表達相同的話就算你重復(fù)的單詞再多也是不會被檢測出來的。
|
|