編者按:當(dāng)人工智能滲透到了傳媒領(lǐng)域,機(jī)器人新聞公司Automated Insights是如何挑戰(zhàn)專業(yè)記者成為媒體圈新貴的呢?為什么美聯(lián)社、微軟、雅虎都成為了這家公司的隊(duì)友?什么技術(shù)讓它可以年產(chǎn)新聞10億篇?
2014騰訊互聯(lián)網(wǎng)媒體峰會即將拉開帷幕,自動化洞察副總裁亞當(dāng)伯爾頓史密斯受邀出席會議。
機(jī)器人新聞背后,是程序猿鍵盤下的神奇代碼
Automated Insights,俗稱“機(jī)器人”媒體,實(shí)際上并不是由可以看到或觸摸到的機(jī)器人編寫的,而是通過計(jì)算機(jī)程序?qū)⒁恍?shù)據(jù)整合成結(jié)構(gòu)化語言,生成新聞報(bào)道或個(gè)性化廣告文章。
AI最初的名字是Statstreet,由CiscoSystems的工程師Robbie Allen在2007年創(chuàng)建。最初,它是一個(gè)分析和顯示體育數(shù)據(jù)的平臺。球迷可以通過推特以及嵌入其服務(wù)的各種網(wǎng)站和博客實(shí)時(shí)獲取自己喜歡的球隊(duì)的比賽信息。2011年更名為Automated Insights,領(lǐng)域擴(kuò)展到金融、地產(chǎn)、醫(yī)療、公關(guān)等。
年產(chǎn)10億篇新聞,可繞地球N圈
目前AI的主要技術(shù)產(chǎn)品是Wordsmith。這個(gè)技術(shù)平臺幾乎可以接收任何數(shù)據(jù)格式(包括API、XML、CSV、電子表格)等。然后通過算法找出數(shù)據(jù)特征趨勢和內(nèi)容脈絡(luò),生成敘事性的長短文、報(bào)告、可視化圖形等。最后通過云服務(wù)、API、JSON、XML、Twitter、Email等渠道實(shí)時(shí)推送文章。
AI擁有超過3億個(gè)不同新聞的模板,它們在2013年產(chǎn)生了3億個(gè)新聞故事,比所有其他媒體的總和還要多。Wordsmith技術(shù)消除了傳統(tǒng)媒體的缺點(diǎn),因?yàn)樗梢栽诙虝r(shí)間內(nèi)即時(shí)響應(yīng)和處理大量數(shù)據(jù)。今年,AI計(jì)劃生產(chǎn)10億篇文章。
機(jī)器人新聞的下一個(gè)目標(biāo):讀起來萌萌噠
對于這份俗稱機(jī)器人寫作的手稿,最需要解決的問題其實(shí)是讓它讀起來更自然,不生硬。尤其是當(dāng)讀者發(fā)現(xiàn)這些內(nèi)容是由技術(shù)自動化產(chǎn)生的時(shí)候,他們會對內(nèi)容提出更加苛刻的意見。AI后端使用Ruby、MongoDB和Redis,基礎(chǔ)設(shè)施使用AWS,前端使用Angular JS。為了真正實(shí)現(xiàn)“像人類專家一樣寫作”,Automated Insights不斷改進(jìn)算法,將文章的語法結(jié)構(gòu)融入到人情味中,比如加入一些幽默的句子。當(dāng)然,Automated Insights有更多的想法:既然可以提供個(gè)性化的文章,那么可以提供個(gè)性化的廣告嗎?對于媒體來說,這條路線也意味著商業(yè)擴(kuò)張的潛力。
媒體、技術(shù)跨界團(tuán)隊(duì):復(fù)合背景很重要
談及automatic Insights的使命,CEO艾倫在LinkedIn的簡歷中寫道:基于技術(shù)打造下一代偉大的媒體公司,并解釋automatic Insights并不是要裁掉記者。寫作軟件生成更多個(gè)性化的新聞內(nèi)容,同時(shí)大大提高寫作效率。
從高管團(tuán)隊(duì)對其員工的背景體驗(yàn)中,我們可以看到AI所強(qiáng)調(diào)的技術(shù)與媒體的結(jié)合。CEO艾倫畢業(yè)于麻省理工學(xué)院,曾就職于IBM、思科和O'Reilly Media(前兩家是科技公司,第三家是媒體公司)。他還是活動目錄和網(wǎng)絡(luò)技術(shù)方面的專家。副總裁亞當(dāng)擁有豐富的天使融資和風(fēng)險(xiǎn)投資經(jīng)驗(yàn)。
同時(shí),公司擁有很多既擅長數(shù)據(jù)挖掘又擅長寫作的員工。這些員工可能是統(tǒng)計(jì)學(xué)專業(yè)的,但也有寫作經(jīng)驗(yàn)。
AI“神”隊(duì)友:開創(chuàng)智能新聞寫作新時(shí)代
目前,與Automated Insights合作,或直接投資或使用其技術(shù)的機(jī)構(gòu)中有很多科技巨頭和權(quán)威媒體:微軟、美聯(lián)社、雅虎、三星等。雖然該公司在2009年遭受打擊,推特在沒有事先警告的情況下封鎖了他們的數(shù)百個(gè)賬戶,但從2010年到2011年,它分別獲得了130萬美元和400萬美元的投資,到目前為止,AI融資總額已經(jīng)超過1080萬美元。但真正讓AI在媒體圈引起軒然大波的是,今年7月,美聯(lián)社宣布將使用其新聞寫作軟件代替人力撰寫美國上市公司的財(cái)務(wù)報(bào)告。
眾所周知,與財(cái)務(wù)報(bào)告數(shù)據(jù)相關(guān)的披露文章主要是枯燥的數(shù)字,手工編制費(fèi)時(shí)費(fèi)力,毫無樂趣。在與AI合作之前,美聯(lián)社每個(gè)季度只能發(fā)布近300份財(cái)務(wù)報(bào)告。切換到自動化系統(tǒng)后,他們將提供多達(dá)4400篇上市公司的財(cái)務(wù)報(bào)告數(shù)據(jù)文章(目前美國有4600家上市公司)。在此之前,美聯(lián)社還在使用來自AI自動化技術(shù)的數(shù)據(jù)分析進(jìn)行體育賽事。
如今,盡管Automated Insights沒有披露自己的利潤,但其業(yè)務(wù)增長非常迅速。與美聯(lián)社這樣的大型媒體機(jī)構(gòu)牽手是一個(gè)重大突破。進(jìn)入移動互聯(lián)網(wǎng)時(shí)代后,如何幫助移動應(yīng)用生成用戶的個(gè)性化信息將成為他們下一個(gè)需要解決的問題。