作者:麥子(轉(zhuǎn)載請注:解螺旋·醫(yī)生科研助手) 瑞典的一組科研人說,跟100多年前相比,,現(xiàn)在的科學(xué)論文文本,,已經(jīng)越發(fā)地沒有穿透力了。好像的確如此呢,。 隨便找一篇Nature上的文章(Nature還常常將自己相對“親民”的氣質(zhì)引以為榮),,你總能在摘要中找到類似這樣的句子: Here we show that in mice DND1 binds a UU(A/U) trinucleotide motif predominantly in the 3' untranslated regions of mRNA, and destabilizes target mRNAs through direct recruitment of the CCR4-NOT deadenylase complex. 不過,瑞典那份調(diào)研說,,學(xué)術(shù)論文難讀的問題,,還不僅僅在于類似例句中這樣密密麻麻的術(shù)語。 卡洛林斯卡研究院的神經(jīng)科學(xué)家,,William Hedley Thompson,,和他的同事們一起做了這份文獻(xiàn)調(diào)研。他們分析了1881年到2015年間,,在122種高分生物醫(yī)學(xué)期刊上發(fā)表的70萬篇英文論文的摘要,。這份調(diào)研報(bào)告已于3月28日在BioRxiv上刊登了預(yù)印本。 蕪草叢生的,,還有一堆“科研黑話”,,例如一些多音節(jié)詞,本來沒什么科技含義,卻成了科研論文中的標(biāo)配專用語,。包括“robust”,、 “significant”、 “furthermore” 和 “underlying”,,雖然日常也能見到,,但在科研論文中卻異常普遍。這些詞倒不是天生晦澀,,但堆在一起,,讀著就讓人頭大。 小學(xué)四年級的詞匯量,? Thompson和他的小伙伴們用TreeTagger軟件分析文本,,檢測指標(biāo)包括每個單詞的音節(jié),每個句子的單詞數(shù),,以及一篇文章中有多少詞不屬于預(yù)設(shè)的常用詞匯庫(New Dale–Chall詞匯表,,簡稱NDC),即所謂的難詞數(shù)量,。 在此基礎(chǔ)上計(jì)算了FRE分?jǐn)?shù)和NCD分?jǐn)?shù),,F(xiàn)RE越低可讀性越差,后者反之,。 分析結(jié)果顯示,,自1881年以來,文章的可讀性是明顯穩(wěn)步下滑的,。 為了看看文章摘要的可讀性是否能代表全文的可讀性,,作者們又從PubMed下載了6家OA期刊的文章,約14萬篇,,同樣計(jì)算了這兩個分?jǐn)?shù),。 結(jié)果顯示,雖然摘要比全文難懂一些,,但兩者的相關(guān)性還是很高的(FRE:r =0.58, p < 10-15,;NDC:r = 0.63, p < 10-15)。核密度估計(jì)圖就展示了FRE評分: 作者們想,,這究竟是為什么呢,? 他們首先覺得,會不會共同作者越多,,文章可讀性就會越好一些,。剛開始是觀察到一點(diǎn)跡象,但隨著時間的變化,,這個趨勢又沒了,。 作者數(shù)量和FRE評分隨時間變化的關(guān)系 其次,,他們也觀察到,,下圖中NDC常用詞匯表(2949個詞,,紅色)、“科研黑話”(2140個詞,,藍(lán)色)和常用科技術(shù)語(2949個詞,,綠色)在文章中出現(xiàn)的頻率,也隨時間出現(xiàn)了穩(wěn)定的變化: 如果說,,是人類科學(xué)知識的增長要求用到越來越復(fù)雜的術(shù)語,,那么大概能解釋常用詞匯的減少和科技術(shù)語的增多。若果真如此,,那么常用詞匯庫也許要擴(kuò)充,。 但這還是不能解釋跟“科研黑話”越來越多有什么關(guān)系。他們還分析了幾個頗具代表性的“黑話”隨時間出現(xiàn)的頻率: 最后作者們表示攤手,。的確,,文章難讀懂的話,對公眾理解,、科學(xué)相關(guān)的政策制定都是個問題,;而對于科研人員來說,同一成果的可重復(fù)性,,也跟文章描述的研究方法是否明確易懂息息相關(guān),。 不過這份研究的分析技術(shù)也遭到了吐槽。 《讀者的大腦》一書的作者,,佛羅理達(dá)大學(xué)的Yellowlees Douglas指出,,那個NCD常用詞匯庫,基本上代表了美國四年級學(xué)生的理解能力,,才10歲左右,,能不能用于科研文獻(xiàn)的研究還是個問題。更有爭議的是,,用音節(jié)計(jì)數(shù)的方法來量化也太簡單粗暴了,,如此一來,“orange”和“praxis”是一樣的,。 西北大學(xué)研究科學(xué)出版趨勢的物理學(xué)家LuísAmaral也說,,1960年前的數(shù)據(jù)太少了,變數(shù)大,,可靠性也不高,;而1960年以后的趨勢又不甚明顯。 而且,,要區(qū)分科技術(shù)語和行業(yè)黑話也不太容易,。術(shù)語越來越多也未必是壞事,,它反映了科技領(lǐng)域,出現(xiàn)了越來越多有用的技術(shù)和概念,。比如“sequencing”,,1980年之前它不是什么科技詞匯,但現(xiàn)在它俯拾即是,,又有誰抱怨呢,? 裝逼的句子結(jié)構(gòu) 詞匯只是一方面,可能真的不容易說清,,但句子結(jié)構(gòu)的確就是個大問題,。用簡短易懂的詞匯也可以造出讀不懂的句子,秘訣就是把語法全還給老師,。 這也是Douglas的書中提到過的:讀者希望有序地接觸新概念,,而不必翻來覆去地查找,這句話的這個動詞是由哪個名詞發(fā)出的,,或者不得不手動疏理一個信息量巨大且復(fù)雜的句子,。遇到術(shù)語再去查都沒問題,但句子太復(fù)雜,,你就只好一個人玩耍了,。 不過,文章是否易懂,,還要看它有沒有給出足夠且切題的信息,。常常讀文獻(xiàn)的人可能會遇到,有的文章中,,某些論證環(huán)節(jié)給跳過了,,或者一些關(guān)鍵細(xì)節(jié)又漏掉了。猶其當(dāng)你發(fā)現(xiàn),,不止你讀不懂,,專家們也一頭霧水時,會不會可惜當(dāng)初花這么多時間琢磨了一篇爛文,。 這種流行趨勢是怎么造成的呢,?Douglas懷疑,許多文章的初稿都是剛?cè)腴T的小師弟小師妹寫的,,他們本來就不會判斷什么才是好文,。讀到了艱澀的文章,覺得“哇好高大上,!我都看不懂,!”然后千方百計(jì)啃下它(可能根本沒啃下來),又趕緊去模仿它,,于是寫出了更加不明就里的文章,,代代相傳,。 所以嘛,寫文章為什么要追求裝逼的詞匯和句子,。猶其是咱們本來就要辛苦學(xué)英文的,,簡直瞎折騰,瞎摻和,。如果Douglas的懷疑是真相,,那么簡化科學(xué)語言的使命,,就落到青椒們手上了呢→_→ 至于哪里有好文可以模仿,,Nature的顧問編輯Philip Ball建議先放下那只Nature,19世紀(jì)達(dá)爾文的作品不錯,,還有上世紀(jì)的演化生物學(xué)家Dawkins,。另外,其他普通文學(xué)作品對培養(yǎng)語言鑒賞力也有幫助,,比如小說家Dickens,。 麥子覺得,要說19世紀(jì)末,,《天演論》比《物種起源》要好讀一些,。不過那個時代的中譯本,就會是這種專門為了區(qū)分鴻儒和白丁而搞出來的畫風(fēng): 嚴(yán)復(fù)譯的《天演論》第一段 彼時,,白話文運(yùn)動還沒有到來,。所以,一只中國的生科黨穿越回19世紀(jì)末嘛,,就變成外文不難家里難,,好尷尬=_= 最后,不知大家有沒有注意到,,科研論文越來越難讀,,不是顯而易見人盡皆知不言而喻且人神共憤的嘛,這幫神經(jīng)科學(xué)家居然搞了數(shù)據(jù),,作了這么漂亮的圖,,還寫了文章,好有格調(diào),!不做實(shí)驗(yàn)就能出成果?。?/p> 參考資料: 1.It's not just you: science papers are getting harder to read 2.The Readability Of Scientific Texts Is Decreasing Over Time |
|