姓名:馬行健
學(xué)號(hào):16020199036
轉(zhuǎn)載自:https://zhuanlan.zhihu.com/p/50876232
【嵌牛鼻子】:AI代替人工?
【嵌牛導(dǎo)讀】:2016 年美國(guó)數(shù)字媒體公司 Vox Media 旗下新聞網(wǎng)站 Vox 發(fā)表了一篇調(diào)查了 270 名科學(xué)家,歸納出科研系統(tǒng)需要解決的 7 宗罪,其中一個(gè)就是同行評(píng)審,現(xiàn)在人工智能或許可以幫忙解決這個(gè)問(wèn)題,改善流程,節(jié)省審稿人的時(shí)間。Nature 一篇最新文章報(bào)道,已經(jīng)有一些學(xué)術(shù)出版商正在試行 AI 工具,從選擇評(píng)論者、檢查統(tǒng)計(jì)數(shù)據(jù)、到總結(jié)論文的發(fā)現(xiàn)。
【嵌牛原文】:2016 年美國(guó)數(shù)字媒體公司 Vox Media 旗下新聞網(wǎng)站 Vox 發(fā)表了一篇調(diào)查了 270 名科學(xué)家,歸納出科研系統(tǒng)需要解決的 7 宗罪,其中一個(gè)就是同行評(píng)審,現(xiàn)在人工智能或許可以幫忙解決這個(gè)問(wèn)題,改善流程,節(jié)省審稿人的時(shí)間。Nature 一篇最新文章報(bào)道,已經(jīng)有一些學(xué)術(shù)出版商正在試行 AI 工具,從選擇評(píng)論者、檢查統(tǒng)計(jì)數(shù)據(jù)、到總結(jié)論文的發(fā)現(xiàn)。
同行評(píng)審的目的是在出版前剔除掉低質(zhì)量的論文,但這個(gè)制度難以避免存在問(wèn)題,比如相當(dāng)耗時(shí),有些審稿人的評(píng)審過(guò)程不夠仔細(xì),導(dǎo)致錯(cuò)誤、有缺陷的論文被出版,以及編輯和審稿人知道作者是誰(shuí),作者卻不知道編輯和審稿人是誰(shuí),在這審稿過(guò)程中是否會(huì)有傾向性等爭(zhēng)議。而要怎么彌補(bǔ)同行評(píng)審的不足,行業(yè)內(nèi)也提出一些方式,像是提高透明度、建立工作組的協(xié)作同行評(píng)審等,人工智能搭配人類做裁決,則是一種新作法。
阿姆斯特丹出版業(yè)巨頭 Elsevier 的同行評(píng)審管理系統(tǒng) Aries Systems,在今年 6 月采用了名為 StatReviewer 軟件,該軟件會(huì)檢查手稿中的統(tǒng)計(jì)數(shù)據(jù)和方法是否合理。此外,許多期刊使用的同行評(píng)審平臺(tái) ScholarOne,正在與丹麥的論文及專利在線搜索平臺(tái) UNSILO 合作,UNSILO 利用自然語(yǔ)言處理(NLP)和機(jī)器學(xué)習(xí)(ML)來(lái)分析手稿,通過(guò)語(yǔ)義分析自動(dòng)提出關(guān)鍵概念、總結(jié)論文內(nèi)容。
UNSILO 開發(fā)的初版工具 是從 PubMed Central 學(xué)術(shù)數(shù)據(jù)庫(kù)抓取信息,PubMed Central 可以將新手稿與 170 萬(wàn)份已發(fā)布的生物醫(yī)學(xué)研究論文的全文進(jìn)行比較,為了繼續(xù)擴(kuò)大信息量,UNSILO 表示,后續(xù)很快會(huì)增加超過(guò) 2000 萬(wàn)份 PubMed Central 的論文,同時(shí)也與知名的信息數(shù)據(jù)分析機(jī)構(gòu)科睿唯安(Clarivate Analytics)旗下的 ScholarOne 合作。
另外,UNSILO 也會(huì)提出哪些關(guān)鍵短語(yǔ)最能代表論點(diǎn)或研究發(fā)現(xiàn),并會(huì)標(biāo)示出這些主張是否與以前發(fā)表過(guò)的論文類似,讓編輯更快了解研究結(jié)果。UNSILO 銷售總監(jiān) Neil Christensen 認(rèn)為,使用語(yǔ)義分析來(lái)提取文本的主要陳述,此法通常會(huì)比作者提交關(guān)鍵字更能清楚地概述論文,但也強(qiáng)調(diào),此工具并不會(huì)做出決定,只是告訴人類在比較此篇手稿和已發(fā)布的論文時(shí)有哪些突出之處,評(píng)審還是人類。
AI 能是人類編輯、審稿人的助手嗎?
“它不會(huì)取代編輯的判斷,但可以讓事情變得更容易些”,一家英國(guó)出版商的顧問(wèn) David Worlock 在德國(guó)法蘭克福書展上看到了 UNSILO 示范后,給出了這番評(píng)語(yǔ),但是他同時(shí)提出一個(gè)值得思考的問(wèn)題——AI 潛在的陷阱,機(jī)器學(xué)習(xí)工具是根據(jù)先前已發(fā)表的論文來(lái)進(jìn)行訓(xùn)練,這樣的決策系統(tǒng)可能會(huì)加強(qiáng)同行評(píng)審中的現(xiàn)有偏見(jiàn)問(wèn)題。
目前看來(lái),不太相信 AI 的不只 David Worlock 一人,在英國(guó) eLife 期刊領(lǐng)導(dǎo)創(chuàng)新部門的 Giuliano Maciocci 表示,在想要解決同行評(píng)審這個(gè)令人頭疼的問(wèn)題中,UNSILO 提出了有趣的方法,但并不是 eLife 會(huì)考慮采用的方案?!拔覀儾⒉煌耆嘈潘?eLife 這樣的期刊背景下特別有用,因?yàn)閷<宜枷敕浅V匾彼f(shuō)。
另外,一家被科睿唯安收購(gòu)、使用機(jī)器學(xué)習(xí)開發(fā)同行評(píng)審追蹤工具的初創(chuàng)公司 Publons 聯(lián)合創(chuàng)始人 Andrew Preston 則直言,算法還沒(méi)聰明到可以讓人類編輯就根據(jù) AI 提出的信息判斷要接受或拒絕一篇論文,“這些工具可以確保稿件符合要求,但絕不會(huì)取代審稿人在評(píng)估方面所做的工作,”他說(shuō)。
讓 AI 嘗試作為同行評(píng)審員的意義在于節(jié)省審稿人的時(shí)間,由機(jī)器做例行性的工作,概念類似于商業(yè)環(huán)境中的機(jī)器人流程自動(dòng)化(Robotic Process Automation,RPA),在 AI 的應(yīng)用領(lǐng)域,比起面部識(shí)別、自動(dòng)駕駛等,RPA 或自動(dòng)化文件處理不是一個(gè)聽(tīng)起來(lái)很性感的領(lǐng)域,但其實(shí)商業(yè)潛力不小,除了上述的論文檢視、同行評(píng)審之外,監(jiān)管科技(Regtech)更是熱門議題,簡(jiǎn)單來(lái)說(shuō),RPA 就是通過(guò)自動(dòng)化軟件來(lái)取代需要大量人力的例行性、高重復(fù)性的工作,在金融、法律等領(lǐng)域都有一些實(shí)際的落地案例。數(shù)日前,日本軟體銀行旗下的軟銀愿景基金就投資了 RPA 初創(chuàng)公司 Automation Anywhere 3 億美元。
今年 3 月一家來(lái)自以色列、專攻合約審查領(lǐng)域的 AI 初創(chuàng)公司 LawGeex 與斯坦福大學(xué)、杜克大學(xué)法學(xué)院和南加州大學(xué)的法學(xué)教授合作一項(xiàng)研究,讓 20 名有經(jīng)驗(yàn)的律師與經(jīng)過(guò)訓(xùn)練的法律 AI 程序挑戰(zhàn),在 4 小時(shí)內(nèi)審查 5 項(xiàng)保密協(xié)議(NDA),并確定 30 個(gè)法律問(wèn)題,包括仲裁、賠償?shù)?,結(jié)果人類律師平均正確率為 85%,AI 則拿下了 94% 的正確率達(dá),而且 AI 只在 26 秒內(nèi)完成任務(wù),人類律師平均需要 92 分鐘。
但律師不會(huì)失業(yè),就像論文審查的決定權(quán)力仍在人類審稿人手上,AI 帶來(lái)的是改善或加速流程的進(jìn)行,并抓出人類必須投入大量心力才能抓到的錯(cuò)誤,訓(xùn)練有素的 AI 可以在專門、特定的領(lǐng)域達(dá)到很好的表現(xiàn),AI 與專業(yè)人士的協(xié)同合作,將是未來(lái)不可逆的趨勢(shì)。

