聲明:本文來自微信公眾號(hào)“CSDN”(ID:CSDNnews),整理:何苗,,授權(quán)轉(zhuǎn)載發(fā)布。
上周,Meta 推出了一種名為 Galactica 的新型大型語言模型(large language model,LLM),它由4800萬篇科學(xué)文章、網(wǎng)站文章、教科書、講義和維基等訓(xùn)練而成。其本意是想解決學(xué)術(shù)界信息過載,幫助研究人員做信息梳理、知識(shí)推理和寫作輔助,一度被認(rèn)為是“科研者的福音”。Meta 將其模型宣傳為“可以總結(jié)學(xué)術(shù)論文,解決數(shù)學(xué)問題,生成維基文章,編寫科學(xué)代碼,為分子和蛋白質(zhì)做注解,等等?!?/p>
但是,它并沒有像 Meta 所希望的那樣大放異彩。MIT Technology Review 報(bào)道,三天后,在激烈的爭(zhēng)議中,Meta 撤下了它的在線演示版本。
時(shí)至今日,圍繞 Galactica 的討論并沒有停止。
1人工智能or科學(xué)造假制造機(jī)人們是如何發(fā)現(xiàn) Galactica 有問題的?
Galactica 一經(jīng)開放使用,就吸引了大波網(wǎng)友和研究人員開始試用,有科研人員發(fā)現(xiàn)它確實(shí)能為自己生成的內(nèi)容引用文獻(xiàn),但有時(shí)這個(gè)文獻(xiàn)并不存在,作者卻是真實(shí)存在的人。
也有科學(xué)家實(shí)驗(yàn)過后發(fā)現(xiàn) LLM 即使能產(chǎn)出看似有條理的文本,但其實(shí)并無法理解其中意義。因此科學(xué)家發(fā)現(xiàn) LLM 模型可能產(chǎn)出具有偏見的文章,或是出現(xiàn)事實(shí)謬誤。
著名的 AI 學(xué)者 Gary·Marcus 表示,Galactica 把他的出生日期、教育經(jīng)歷和研究領(lǐng)域等信息全搞錯(cuò)了。
類似的討論也發(fā)生在 Twitter 上。如果你讓AI生成一篇關(guān)于“生活在太空的熊”的維基頁(yè)面,AI 也會(huì)試著生成。
除了生成論文,Galactica 也可以生成詞條的百科查詢、對(duì)所提問題作出知識(shí)性的回答,除了文本生成外,還可以執(zhí)行涉及化學(xué)公式和蛋白質(zhì)序列的多模態(tài)任務(wù)。例如在化學(xué)反應(yīng)中,要求 Galactica 在化學(xué)方程 LaTeX 中預(yù)測(cè)反應(yīng)的產(chǎn)物,模型僅根據(jù)反應(yīng)物就能進(jìn)行推理,結(jié)果如下:
總體來看,Galactica 有點(diǎn)問題,也有點(diǎn)意思。
2科學(xué)家與網(wǎng)友怎么看在模型發(fā)布當(dāng)天,Meta AI 的首席 AI 科學(xué)家 Yan LeCun 表示:“輸入文本,Galactica 將生成包含相關(guān)參考文獻(xiàn)、公式和所有內(nèi)容的論文?!?/p>
而知名 AI 學(xué)者、Robust.AI 創(chuàng)始人 Gary Marcus 對(duì) Galactica 模型測(cè)試過后表達(dá)了強(qiáng)烈的質(zhì)疑:大型語言模型(LLM)混淆數(shù)學(xué)和科學(xué)知識(shí)有點(diǎn)可怕。高中生可能會(huì)喜歡它,并用它來愚弄他們的老師。這應(yīng)該令我們感到擔(dān)憂。
有網(wǎng)友提出一些反對(duì)意見,與其帶來的好處相比,Galactica 會(huì)帶來更多負(fù)面后果,想想這對(duì)學(xué)生寫論文會(huì)有什么影響。它產(chǎn)出的偽論文可能危害真正的科學(xué)研究。
有人將其歸因于深度學(xué)習(xí)的局限性:深度學(xué)習(xí)的本質(zhì)是從數(shù)據(jù)中學(xué)習(xí),這本來就不同于人類的智能,根本無法實(shí)現(xiàn)通用人工智能(AGI)。
馬克斯普朗克智能系統(tǒng)研究所所長(zhǎng) Michael Black 則認(rèn)為這不是個(gè)好的導(dǎo)向:“它提供了聽起來是權(quán)威的科學(xué),但沒有科學(xué)方法的基礎(chǔ)。Galactica 根據(jù)科學(xué)寫作的統(tǒng)計(jì)特性產(chǎn)生偽科學(xué),很難區(qū)分真假。這可能會(huì)開啟一個(gè)深度科學(xué)造假的時(shí)代。這些被生成的論文將被其他人在真實(shí)的論文中引用。這將會(huì)是一團(tuán)亂麻。我贊賞這個(gè)項(xiàng)目的初衷,但提醒大家還是要注意,這不是科學(xué)的加速器,甚至也不是科學(xué)寫作的有用工具。這對(duì)科學(xué)來說是潛在的扭曲和危險(xiǎn)。”
三天后 Galactica 被撤,Yan LeCun 在推特上寫道:“ Galactica 演示暫時(shí)下線。不再可能通過隨意濫用它來獲得一些樂趣。開心嗎?”
這位大拿的反應(yīng)有些耐人尋味,自此引發(fā)了后續(xù)人們對(duì)“研究批評(píng)”的討論。
3開放研究批評(píng),再給 AI 通用化一些時(shí)間近日,有國(guó)外技術(shù)評(píng)論文章表示:
圖靈獎(jiǎng)獲得者、Meta 首席科學(xué)家 Yann LeCun 為 Galactica 的撤退而辯護(hù)的態(tài)度是荒謬的,他不允許外人去批評(píng)產(chǎn)品是有問題的。而 Meta 官方對(duì) Galactica 被撤的反應(yīng)比較平和中正。
LeCun 曾回應(yīng) AI 評(píng)論家 Gary Marcus:或者它 (Galactica)被刪除是因?yàn)橄衲?Marcus)這樣的人濫用模型并歪曲它。感謝您刪除了一個(gè)有用且有趣的公共演示,這就是我們不能擁有好東西的原因。
Meta 官方“感謝大家嘗試卡拉狄加模型演示。我們感謝迄今為止從社區(qū)收到的反饋,并暫時(shí)暫停了演示。我們的模型可供想要了解更多有關(guān)工作并重現(xiàn)論文結(jié)果的研究人員使用?!?/p>
他認(rèn)為官方對(duì)自己使用自己的代碼所做的事情負(fù)責(zé),而不是在指責(zé)批評(píng)家。而Yann LeCun 的反應(yīng)有些過度,我們應(yīng)該允許大眾對(duì)學(xué)術(shù)領(lǐng)域批評(píng),而不是壓制,研究批評(píng)不該被視為人身攻擊。
與所有語言模型一樣,夭折的 Galactica 看起來是一個(gè)無法分辨事實(shí)與虛構(gòu)的無意識(shí)機(jī)器人,距離它宣傳中的能力尚有距離。
近年來,新型軟硬件計(jì)算系統(tǒng)、大數(shù)據(jù)、機(jī)器學(xué)習(xí)的發(fā)展,使得人工智能的潛能得到了很大發(fā)揮,形成了新的生產(chǎn)力,在社會(huì)發(fā)展各方面發(fā)揮巨大作用。但目前人工智能應(yīng)用的瓶頸仍在于怎樣向各行各業(yè)推廣,將人工智能工具做到易用、安全,使知識(shí)獲取像互聯(lián)網(wǎng)搜索那樣簡(jiǎn)單,并以一種容易理解、安全可靠的方式加以運(yùn)用。當(dāng)一個(gè)新事物出現(xiàn),我們可能需要以更平和的心態(tài)來看待。
參考來源:
https://statmodeling.stat.columbia.edu/2022/11/23/bigshot-chief-scientist-of-major-corporation-cant-handle-criticism-of-the-work-he-hypes/
https://www.technologyreview.com/2022/11/18/1063487/meta-large-language-model-ai-only-survived-three-days-gpt-3-science/
https://twitter.com/GaryMarcus/status/1593264844412977158?s=20&t=Gw8PrA_Ytku9_9TaubsHyw
https://twitter.com/paperswithcode/status/1593259033787600896