Meta發(fā)布，“科研者的福音”，上線僅三天被罵到撤退[Meta]

科技

 0  264

pebb080808 2023-07-13 04:48

閱讀需：0

聲明：本文來自微信公眾號(hào)“CSDN”（ID:CSDNnews），整理:何苗，，授權(quán)轉(zhuǎn)載發(fā)布。

上周，Meta 推出了一種名為 Galactica 的新型大型語言模型（large language model，LLM），它由4800萬篇科學(xué)文章、網(wǎng)站文章、教科書、講義和維基等訓(xùn)練而成。其本意是想解決學(xué)術(shù)界信息過載，幫助研究人員做信息梳理、知識(shí)推理和寫作輔助，一度被認(rèn)為是“科研者的福音”。Meta 將其模型宣傳為“可以總結(jié)學(xué)術(shù)論文，解決數(shù)學(xué)問題，生成維基文章，編寫科學(xué)代碼，為分子和蛋白質(zhì)做注解，等等?！?/p>

但是，它并沒有像 Meta 所希望的那樣大放異彩。MIT Technology Review 報(bào)道，三天后，在激烈的爭(zhēng)議中，Meta 撤下了它的在線演示版本。

時(shí)至今日，圍繞 Galactica 的討論并沒有停止。

1人工智能or科學(xué)造假制造機(jī)

人們是如何發(fā)現(xiàn) Galactica 有問題的?

Galactica 一經(jīng)開放使用，就吸引了大波網(wǎng)友和研究人員開始試用，有科研人員發(fā)現(xiàn)它確實(shí)能為自己生成的內(nèi)容引用文獻(xiàn)，但有時(shí)這個(gè)文獻(xiàn)并不存在，作者卻是真實(shí)存在的人。

也有科學(xué)家實(shí)驗(yàn)過后發(fā)現(xiàn) LLM 即使能產(chǎn)出看似有條理的文本，但其實(shí)并無法理解其中意義。因此科學(xué)家發(fā)現(xiàn) LLM 模型可能產(chǎn)出具有偏見的文章，或是出現(xiàn)事實(shí)謬誤。

著名的 AI 學(xué)者 Gary·Marcus 表示，Galactica 把他的出生日期、教育經(jīng)歷和研究領(lǐng)域等信息全搞錯(cuò)了。

類似的討論也發(fā)生在 Twitter 上。如果你讓AI生成一篇關(guān)于“生活在太空的熊”的維基頁(yè)面，AI 也會(huì)試著生成。

除了生成論文，Galactica 也可以生成詞條的百科查詢、對(duì)所提問題作出知識(shí)性的回答，除了文本生成外，還可以執(zhí)行涉及化學(xué)公式和蛋白質(zhì)序列的多模態(tài)任務(wù)。例如在化學(xué)反應(yīng)中，要求 Galactica 在化學(xué)方程 LaTeX 中預(yù)測(cè)反應(yīng)的產(chǎn)物，模型僅根據(jù)反應(yīng)物就能進(jìn)行推理，結(jié)果如下:

總體來看，Galactica 有點(diǎn)問題，也有點(diǎn)意思。

2科學(xué)家與網(wǎng)友怎么看

在模型發(fā)布當(dāng)天，Meta AI 的首席 AI 科學(xué)家 Yan LeCun 表示:“輸入文本，Galactica 將生成包含相關(guān)參考文獻(xiàn)、公式和所有內(nèi)容的論文?！?/p>

而知名 AI 學(xué)者、Robust.AI 創(chuàng)始人 Gary Marcus 對(duì) Galactica 模型測(cè)試過后表達(dá)了強(qiáng)烈的質(zhì)疑:大型語言模型（LLM）混淆數(shù)學(xué)和科學(xué)知識(shí)有點(diǎn)可怕。高中生可能會(huì)喜歡它，并用它來愚弄他們的老師。這應(yīng)該令我們感到擔(dān)憂。

有網(wǎng)友提出一些反對(duì)意見，與其帶來的好處相比，Galactica 會(huì)帶來更多負(fù)面后果，想想這對(duì)學(xué)生寫論文會(huì)有什么影響。它產(chǎn)出的偽論文可能危害真正的科學(xué)研究。

有人將其歸因于深度學(xué)習(xí)的局限性:深度學(xué)習(xí)的本質(zhì)是從數(shù)據(jù)中學(xué)習(xí)，這本來就不同于人類的智能，根本無法實(shí)現(xiàn)通用人工智能（AGI）。

馬克斯普朗克智能系統(tǒng)研究所所長(zhǎng) Michael Black 則認(rèn)為這不是個(gè)好的導(dǎo)向:“它提供了聽起來是權(quán)威的科學(xué)，但沒有科學(xué)方法的基礎(chǔ)。Galactica 根據(jù)科學(xué)寫作的統(tǒng)計(jì)特性產(chǎn)生偽科學(xué)，很難區(qū)分真假。這可能會(huì)開啟一個(gè)深度科學(xué)造假的時(shí)代。這些被生成的論文將被其他人在真實(shí)的論文中引用。這將會(huì)是一團(tuán)亂麻。我贊賞這個(gè)項(xiàng)目的初衷，但提醒大家還是要注意，這不是科學(xué)的加速器，甚至也不是科學(xué)寫作的有用工具。這對(duì)科學(xué)來說是潛在的扭曲和危險(xiǎn)。”

三天后 Galactica 被撤，Yan LeCun 在推特上寫道:“ Galactica 演示暫時(shí)下線。不再可能通過隨意濫用它來獲得一些樂趣。開心嗎?”

這位大拿的反應(yīng)有些耐人尋味，自此引發(fā)了后續(xù)人們對(duì)“研究批評(píng)”的討論。

3開放研究批評(píng)，再給 AI 通用化一些時(shí)間

近日，有國(guó)外技術(shù)評(píng)論文章表示:

圖靈獎(jiǎng)獲得者、Meta 首席科學(xué)家 Yann LeCun 為 Galactica 的撤退而辯護(hù)的態(tài)度是荒謬的，他不允許外人去批評(píng)產(chǎn)品是有問題的。而 Meta 官方對(duì) Galactica 被撤的反應(yīng)比較平和中正。

LeCun 曾回應(yīng) AI 評(píng)論家 Gary Marcus:或者它（Galactica）被刪除是因?yàn)橄衲?Marcus)這樣的人濫用模型并歪曲它。感謝您刪除了一個(gè)有用且有趣的公共演示，這就是我們不能擁有好東西的原因。

Meta 官方“感謝大家嘗試卡拉狄加模型演示。我們感謝迄今為止從社區(qū)收到的反饋，并暫時(shí)暫停了演示。我們的模型可供想要了解更多有關(guān)工作并重現(xiàn)論文結(jié)果的研究人員使用?！?/p>

他認(rèn)為官方對(duì)自己使用自己的代碼所做的事情負(fù)責(zé)，而不是在指責(zé)批評(píng)家。而Yann LeCun 的反應(yīng)有些過度，我們應(yīng)該允許大眾對(duì)學(xué)術(shù)領(lǐng)域批評(píng)，而不是壓制，研究批評(píng)不該被視為人身攻擊。

與所有語言模型一樣，夭折的 Galactica 看起來是一個(gè)無法分辨事實(shí)與虛構(gòu)的無意識(shí)機(jī)器人，距離它宣傳中的能力尚有距離。

近年來，新型軟硬件計(jì)算系統(tǒng)、大數(shù)據(jù)、機(jī)器學(xué)習(xí)的發(fā)展，使得人工智能的潛能得到了很大發(fā)揮，形成了新的生產(chǎn)力，在社會(huì)發(fā)展各方面發(fā)揮巨大作用。但目前人工智能應(yīng)用的瓶頸仍在于怎樣向各行各業(yè)推廣，將人工智能工具做到易用、安全，使知識(shí)獲取像互聯(lián)網(wǎng)搜索那樣簡(jiǎn)單，并以一種容易理解、安全可靠的方式加以運(yùn)用。當(dāng)一個(gè)新事物出現(xiàn)，我們可能需要以更平和的心態(tài)來看待。

參考來源:

https://statmodeling.stat.columbia.edu/2022/11/23/bigshot-chief-scientist-of-major-corporation-cant-handle-criticism-of-the-work-he-hypes/

https://www.technologyreview.com/2022/11/18/1063487/meta-large-language-model-ai-only-survived-three-days-gpt-3-science/

https://twitter.com/GaryMarcus/status/1593264844412977158?s=20&t=Gw8PrA_Ytku9_9TaubsHyw

https://twitter.com/paperswithcode/status/1593259033787600896

相關(guān)標(biāo)簽:

評(píng)論

消滅零回復(fù)

Meta發(fā)布，“科研者的福音”，上線僅三天被罵到撤退[Meta]

站長(zhǎng)推薦

Meta發(fā)布，“科研者的福音”，上線僅三天被罵到撤退[Meta]