淹沒在文獻大海中?讓這些智慧工具助你一臂之力|《自然》技術特寫

原文作者:David Matthews

突出關鍵論文的搜尋引擎幫助科學家瞭解最新文獻資訊。

許多學者都熟悉Smolyansky經歷的這種“資訊流疲勞”。學術提醒工具原本是為了幫人集中關注相關論文,而現在它卻成了障礙本身,塞滿了全世界科學家的收件箱。

“最近我甚至沒有讀過自動更新的PubMed搜尋結果,它實在多到無從下手。”匹茲堡大學的生物學家Craig Kaplan說,“我真的跟不上文獻進展。”

淹沒在文獻大海中?讓這些智慧工具助你一臂之力|《自然》技術特寫

插圖:Project Twins

但一場變革正在進行。2019年, Smolyansky與他人合作創辦了Connected Papers,這是新一代視覺化文獻圖譜和推薦工具中的一員。其他還有一些工具承諾緩解資訊過載,整合了Twitter feeds、每日新聞和研究。

故事的起源

不同於透過郵箱傳送每日新文章列表,Connected Papers使用由使用者選擇的單篇“源頭論文”(origin paper)建立起相關研究的圖譜,部分基於重疊的文獻引用。Smolyansky說該服務的使用者最近已經超過了一百萬。

圖譜中根據出版日期的不同進行顏色標識 ,使用者還可以在“早先”的開創性論文和後來建立在其基礎上的 “衍生”作品間切換。這樣做的目的是,科學家能夠搜尋感興趣的源頭論文,然後在圖譜上檢視近期有哪些論文在其領域引起轟動,與其他研究關係如何,以及積累了多少引用。

“論文源源不斷,你沒必要時刻緊盯生怕漏掉哪篇。”Smolyansky說。他補充說,當科學家想要深入某個全新領域時,這一工具也是有用的,它能提供必要文獻的概覽。

另一個視覺化圖譜工具是Open Knowledge Maps,其服務由維也納同名非營利組織提供。它於2015年由奧地利格拉茨科技大學的前學術交流研究員Peter Kraker創立。

Open Knowledge Maps根據關鍵詞而非核心論文來建立圖譜,並且依賴文字相似性和元資料來計算論文的關聯性。該工具將相似子領域的100篇論文以氣泡形式排列,其相對位置顯示出相似性;搜尋有關“氣候變化”的文章,可能會產生一個關於 “風險認知”的相關氣泡。

生成這些氣泡圖譜只需20秒左右,使用者還可以對其進行調整,以覆蓋最多100篇近期發表的相關論文或其他資源。Open Knowledge Maps不僅包括期刊論文,還涵蓋諸如資料集和研究軟體一類的內容。其使用者到現在已經創造了超過40萬篇圖譜,Kraker說。

法國艾克斯-馬賽大學的語言研究者Amie Fairs自詡為Open Knowledge Maps的狂熱愛好者。“這個工具最值得稱道的就是,你可以搜尋極為廣泛的主題,像是‘語言生成’,然後它會把論文按主題彙集,有些可能你從沒想到過。”Fairs 說。例如,當她搜尋“語音腦區”(大腦中處理聲音和意義的區域)時,Open Knowledge Maps提出了一個關於處理過程中年齡相關差異的研究子領域。“我從未考慮在老齡化文獻中尋找這方面的資訊,但現在我會的。”她說。

不過,儘管對這項服務充滿熱情,Fairs仍然傾向於透過谷歌學術(Google Scholar)的推送尋找新的論文,這是該領域的主流工具;她解釋說,這更容易 “發現新世界”,順著引文鏈找下去。

點選推薦

谷歌學術根據使用者撰寫了哪些文章和檔案中的列表推薦論文。該演算法並不公開,但谷歌表示,推薦是基於 “你的文章主題、你發表文章的地方、合作和引用的作者、與你在同一領域工作的作者以及引用圖”。使用者可以根據關鍵詞搜尋或特定作者,手動設定額外的電子郵件提醒。

新加坡管理大學研究學術搜尋工具的圖書管理員Aaron Tay從推特和谷歌學術中獲得文獻推薦。他經常發現,這些工具強調的文章與他的人類同事如出一轍,不過要晚幾天。他說,谷歌學術的推薦“幾乎總能切中要害”。

除了已發表的文章,谷歌學術還可以挑出預印本和“低質量的論文”,Tay說。即使如此,“你仍可能拾得一些滄海遺珠”。(據發言人稱,由出版商愛思唯爾維護的Scopus競爭性文獻資料庫今年早些時候開始納入預印本,但並沒有對論文進行索引。“會有一些不符合Scopus標準的文章,但谷歌學術是收錄的,”他說。)

谷歌學術並未披露其資料庫的規模,但人們普遍認為它是現存最大的文章庫,據估計有近4億篇文章(M。 GusenbauerScientometrics

118

, 177-214; 2019)。而Open Knowledge Maps基於開源的比菲爾德學術搜尋引擎(Bielefeld Academic Search Engine)構建,該搜尋引擎擁有超過2。7億篇文獻(包括預印本),並經過整理以去除垃圾資訊。

Connected Papers使用由Semantic Scholar(華盛頓州西雅圖的艾倫人工智慧研究所於2015年建立的工具)編制的公開文章庫,其數量約為2億篇,包括預印本。Smolyansky承認,這種規模上的差異,意味著“極少情況下”谷歌學術會找到Semantic Scholar所沒有的 “一些小眾的1970年代的論文”。

Semantic Scholar的提醒系統被稱為自適應研究源(adaptive research feed),它建立了一個推薦論文列表,使用者能透過喜歡或不喜歡他們看到的文章來進行訓練。為了找到與之相似的論文,它採用了一種機器學習模型——該模型是根據相互引用情況以及Semantic Scholar使用者連續瀏覽過的文章進行訓練的,一共統計了大約800萬月度使用者。

再無“錯失恐懼症”

2008年推出的Feedly也利用點贊和否決來了解哪些新興的學術研究與使用者最相關,並得益於可針對特定關鍵詞或主題進行訓練的人工智慧助手。但Feedly並非專門面向研究人員,它的目標是成為全方位管理儀表盤,用於管理新聞、RSS源(一種提醒使用者注意網站上新內容的方式)、線上論壇Reddit、推特和播客。Feedly有一個免費版本,但額外的功能(例如關注超過100個來源、隱藏廣告)需每月花費6美元及以上(與本文提到的大多數其他完全免費的工具有所不同;另一個付費選項是ResearchGate +Plus,它可以提高使用者的知名度並提供高級別的統計資料)。

ResearchRabbit於2021年8月完全上線,描述自己是“論文界的Spotify(譯註:一家線上流媒體音樂服務平臺)”。使用者可以將相關的論文儲存到一個集合中,然後開始使用。每增加一篇論文,ResearchRabbit就會更新其推薦文章列表,就像音樂流平臺根據使用者新增在播放列表中的歌曲進行推薦。這家位於華盛頓州西雅圖的公司還未透露它是如何評估相關性的,不過它聲稱專注於精確推薦,而非大量的提醒。“我們只想向用戶傳送最相關的論文。”其執行長Michael Ma說。

弗吉尼亞聯邦大學的特殊教育和殘疾政策博士生Amber Brown Ruiz發現,ResearchRabbit的提醒比谷歌學術更個性化:谷歌學術有時會給她提供與自己工作表面上相似的論文,但實際離她的學科很遠。

Ruiz也使用Connected Papers來尋找新論文。她發現它的自動化程度不如谷歌學術,後者透過電子郵件傳送新的論文,“但你可以手動進去找出哪些文章是最新的。”她說。

所有這些工具的共同點是都使用某種人工智慧進行推薦。然而,有些學者喜歡更有人情味的方式,例如他們重視來自同事和推特聯絡人的推薦。而ResearchGate這個長期平臺把自己打造成科學家的社交網路,稱它可以集人工智慧和人情味之長(ResearchGate與《自然》的出版商施普林格·自然是內容共享的夥伴關係)。

ResearchGate成立於2008年,它既向用戶傳送電子郵件以推薦論文,也在使用者登入後透過滾動的資訊流展示論文。(使用者還可以瀏覽其聯絡人釋出的論文動態訊息,是按時間順序排列的。)ResearchGate利用使用者的出版物和在平臺上瀏覽的出版物資訊來了解他們的興趣,不過它並未公開演算法。然後,它根據共同引用、提取的主題和關鍵詞計算出相關文章。目前,ResearchGate包含約1。49億個出版物頁面,並擁有2000萬用戶。

“ResearchGate的秘訣是結合了活躍的社交網路和巨大的研究圖譜。”ResearchGate產品管理總監Joseph Debruin說。

在感到被新論文海洋淹沒的五年後,Smolyansky終於可以擺脫他的科學 “錯失恐懼症”了。他說:“你無需再擔心錯過什麼了。”

原文以Drowning in the literature? These smart software tools can help為標題發表在2021年11月1日《自然》的技術特寫版塊上

nature

doi: 10.1038/d41586-021-02346-4

點選

閱讀原文

檢視英文原文

好書推薦

鈽釔氧鎝元素故事出書啦!

不可錯過的元素科普經典之作

來自Nature Chemistry

100

餘位

世界科學家

118

化學元素

120

文章

金湧院士 中國化學會 中國化工學會

推薦閱讀

《自然的音符:118種化學元素的故事》由Nature自然科研譯自《自然-化學》(Nature Chemistry)的In Your Element專欄。是所有圖書中為數不多的,覆蓋當前全部已發現的118種化學元素的科普圖書,每一種元素都是邀請世界上對它研究深入的科學家之一撰寫,專業權威,生動有趣。適合中學生及以上所有對化學元素感興趣的讀者閱讀。本書由Nature Chemistry高階編輯作序。隨書贈送覆蓋118種化學元素的元素週期表明信片。

版權宣告:

2021 Springer Nature Limited。 All Rights Reserved

星標我們

,記得

點贊、在看+轉發

哦!