專治「圖片誤用」! Elsevier、Nature等頂刊用AI揪出作弊科學家

WBOY
發布: 2023-04-12 11:04:03
轉載
1639 人瀏覽過

前不久,我們剛起底了一位靠PS大法發表多篇論文的諾獎得主。

而現在,越來越多的學術出版機構開始使用AI軟體來發現被竄改的數據,那些心存僥倖的科學家們可要三思而後行了。

專治「圖片誤用」! Elsevier、Nature等頂刊用AI揪出作弊科學家

圖片誤用乎?

在現今的學術圈,把同一張細胞群的圖片複製、翻轉、旋轉、移動、裁剪後再利用,可是相當普遍的情況。

利用這些被竄改的圖片,研究人員裝出他們擁有很多數據、做了很多實驗的樣子,而真實情況並非如此。

根據美國癌症研究協會 (AACR)的營運總監Daniel Evanko的說法,圖像重複是AACR在2016年至2020年間撤回論文的主要原因。而撤稿不僅會損害作者的名譽,還會損害出版商的聲譽。

為了避免給雙方帶來尷尬,像AACR這樣的學術出版物在發布論文前,已經開始用AI軟體來偵測影像重複了。這個軟體叫Proofig,一個由以色列新創公司開發的影像檢查程式。

Evanko在9月初於芝加哥舉行的國際同儕審查和科學出版大會上,展示了試點研究的結果,介紹了Proofig對AACR產生了怎樣的影響。

專治「圖片誤用」! Elsevier、Nature等頂刊用AI揪出作弊科學家

AACR出版十種研究期刊,每年審查超過13,000份投稿。從2021年1月到2022年5月,官員使用Proofig篩選了1,367份暫時接受出版的論文,檢查出了208份存在圖像重複的論文,聯繫了論文作者。

據外媒報導:在許多情況下,論文中的圖像重複是由於「圖片誤用」,這個問題只要透過提交新資料就可以解決。

小編對此表示:就這麼簡單?

在其他一些情況下,Proofig顯示出了非常明確的造假跡象。這208篇論文中,有4篇被撤回,1篇被拒絕。

一直以來,學術造假並不罕見,在信譽不佳的機構中時有發生。然而現在,在著名大學的頂尖實驗室中,學術造假事件都頻頻被發現。

Science最近發布的一項調查報告稱,數十年的阿茲海默症研究中的新療法之所以無果,臨床試驗之所以失敗,都是基於一篇圖像重複的高引用論文。

Proofig發現的其中一個造假證據,就是利用蛋白質印跡(Western blots)技術產生的一系列模糊線條,這些線條被複製、編輯和貼上到了小鼠數據中。而未經訓練的眼睛很難發現這種造假。

Proofig的CEO Dror Kolodkin-Gal表示,尋找這種微妙的變化對大多數人類來說是一項相當乏味的任務,但它非常適合電腦。

專治「圖片誤用」! Elsevier、Nature等頂刊用AI揪出作弊科學家

#2019諾獎得主Gregg L. Semenza的「圖片誤用」

Proofig在工作時,首先會檢查一個特定的圖像是否與論文中的其他子圖像相符。子圖像可能是經過移動、翻轉或旋轉,或被裁剪、複製的,有相當多的可能性。

Proofig會結合電腦視覺和人工智慧演算法,來擷取和分類影像。這種計算十分複雜,好在現在的機器學習進展神速。

「在人工智慧出現之前,光是從論文中提取子圖像就需要十倍的研發投入,而且天知道該如何進行運算。無論是演算法上的技術進步,或是在雲端中運行GPU的能力,都帶來了巨大的改變。」Kolodkin-Gal這樣說。

仍需人工參與

當然,Proofig這樣的AI 軟體,並不能自己找出作弊者。

影像鑑識專家和獨立科學顧問Elisabeth Bik表示:要解釋軟體得出的結果,我們仍然需要一個具有相關知識和經驗的人。畢竟,在某些情況下,人眼是可以勝過計算機的。

「你不能讓軟體自行運轉,因為它可能會標記出很多沒有問題的東西。」

Bik在工作中使用了另一種AI軟體-ImageTwin。有時,它並不能很清晰地分析蛋白質的印跡。 「蛋白質印跡基本上就是一條純背景上的黑色條紋。我用人類的肉眼能夠看到形狀上的一些細微之處,但這個軟體不知何故就是看不到。」

「這大概是因為我們的眼睛和大腦的工作原理是超級複雜的。我想,也許是因為這個軟體只查找相對距離,所以黑色條紋看起來就是個黑色條紋。它也不太擅長尋找小的邊緣,或與其他形狀相似的形狀。」Bik說。

專治「圖片誤用」! Elsevier、Nature等頂刊用AI揪出作弊科學家

2019諾獎得主Gregg L. Semenza的「圖片誤用」

檢查蛋白質印記對於機器來說非常有挑戰性,Kolodkin-Gal同意這個說法。 「我們花了很多投資,才終於找到一個好的演算法,來找到那些條帶。這對人工智慧來說太有挑戰性了,因為這些條帶非常小。」

在出版過程的不同階段,學術出版品都會使用像Proofig這樣的圖像檢查工具。 AACR會掃描所有初步接收的論文稿件,而Taylor&Francis公司只會用它來檢查被編輯或同儕審查員提出疑問的論文。

「如果軟體偵測到潛在的影像複製或其他操作,而這個判斷得到了我們的專家團隊的支持,我們將按照既定程序和出版道德委員會針對此類事件制定的指導方針展開調查。」某公司的發言人這樣說。

在發稿流程中,何時使用這些工具,取決於成本。影像處理是運算密集型的,因此出版物必須為像Proofig這樣的公司支付雲端運算成本。

專治「圖片誤用」! Elsevier、Nature等頂刊用AI揪出作弊科學家

2019諾獎得主Gregg L. Semenza的「圖片誤用」

在提交階段就篩選每篇論文的話,成本實在太高了。例如,使用Proofig分析120個子影像,需要花費99美元。而要徹底檢查一篇論文,Proofig需要在一篇論文中處理所有可能的組合,這可以算一筆「巨款」了。

目前,AACR和Taylor & Francis等組織正在協商,希望以更便宜的價格,為他們的業務量身定制一個打包服務。

SAGE的主管Helen King表示:「由於人工監督和使用軟體的成本,我們目前在論文進入更高級的審查階段時,才會使用Proofig。迄今為止,它已經在檢測的近三分之一的論文中標記了問題,接下來,就需要相關的專業知識來解釋了。」

AI無法檢測不同論文中的複製圖像

現在,越來越多的組織開始使用AI軟體了。

美國臨床研究協會也採用了Proofig,同時Frontiers等出版商也開發了自己的工具。

Wiley也在使用某種軟體,而PLOS、Elsevier和Nature要麼對專案開放,要麼會積極測試專案。

專治「圖片誤用」! Elsevier、Nature等頂刊用AI揪出作弊科學家

儘管人工智慧軟體在發現可疑數據方面表現得越來越出色,但它並不能抓到科學家們所有形式的作弊。

Proofig可以檢查圖像是否在同一論文中出現重複,但如果圖像在不同論文中被複製或處理,它就捕捉不到了。顯然,為了應對這種情況,Proofig需要建立一個從已發表論文中抓取的圖像快取資料庫,來進行全方位的比較。

專治「圖片誤用」! Elsevier、Nature等頂刊用AI揪出作弊科學家

2019諾獎得主Gregg L. Semenza的「圖片誤用」

「我們面臨的最大挑戰,就是大數據。」Kolodkin-Gal說。 「如果出版物不聯合起來,建立一個圖像資料庫,圖像剽竊仍會是一個大問題。要開發人工智慧,你就必須擁有大數據。」

雖然還擁有種種缺陷,但Proofig軟體的出現,仍然是打擊作弊和提高學術誠信的一個好開始。

「我確實認為出版物開始使用軟體是一件非常好的事,因為它為出版過程提供了一些品質控制,會起到威懾作用。這類軟體會讓作者知道:我們將針對這些類型的重複審查你的論文。在我看來,它無法阻止造假,但它會讓造假變得更難一點。」Bik說。

如果AI真的能對學術造假行為產生足夠的威懾,那真是善事一樁了。

以上是專治「圖片誤用」! Elsevier、Nature等頂刊用AI揪出作弊科學家的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:51cto.com
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板