咨詢熱線:021-80392549

獨家 | 創(chuàng)新工場首席科學家周明:NLP 與金融「聯(lián)姻」,從經(jīng)濟實惠的小模型開始

放大字體  縮小字體 發(fā)布日期:2022-06-07     來源:雷鋒網(wǎng)     瀏覽次數(shù):574
核心提示:獨家 | 創(chuàng)新工場首席科學家周明:NLP 與金融「聯(lián)姻」,從經(jīng)濟實惠的小模型開始 6月6日,創(chuàng)新工場首席科學家、瀾舟科技創(chuàng)始人周明
獨家 | 創(chuàng)新工場首席科學家周明:NLP 與金融「聯(lián)姻」,從經(jīng)濟實惠的小模型開始
6月6日,創(chuàng)新工場首席科學家、瀾舟科技創(chuàng)始人周明博士代表瀾舟科技,在北京與華夏基金簽署戰(zhàn)略合作協(xié)議,宣告成立「金融NLP聯(lián)合實驗室」。

這是繼周明在2020年12月離開微軟亞洲研究院后的又一個重大動向。

周明博士是我國研究自然語言處理(NLP)的先驅者之一:

他是中國第一個中英翻譯系統(tǒng)CEMT-I(哈工大1989年)、日本最有名的中日機器翻譯產(chǎn)品J-北京(日本高電社1998年)的研制者,曾擔任2019年國際計算語言學協(xié)會(ACL)主席,中國計算機學會理事、中文信息技術專委會主任、術語工作委員會主任、中國中文信息學會常務理事,谷歌學術引用數(shù)超過32000次。

1999年,周明加入微軟亞洲研究院,隨后擔任自然語言研究組的負責人、微軟亞研副院長。2020年12月,他從微軟離職,隨后加入創(chuàng)新工場擔任首席科學家,2021年6月孵化出瀾舟科技,7月就推出輕量化模型——「孟子」,在中文語言理解評測CLUE榜單的多項指標上登頂?shù)谝,引起不少關注。

如今,不到一年,瀾舟科技便與華夏基金成立「金融NLP聯(lián)合實驗室」,致力于在金融場景中實現(xiàn)NLP技術的落地,成長著實迅速。而據(jù)AI科技評論與周明博士的對話,在此次與金融的「聯(lián)姻」中,輕量化模型「孟子」將扮演重要角色。
科技
獨家 | 創(chuàng)新工場首席科學家周明:NLP 與金融「聯(lián)姻」,從經(jīng)濟實惠的小模型開始

根據(jù)華夏基金首席數(shù)據(jù)官陳一昕的介紹,在以往的「金融+NLP」建設中,他們往往面臨模型與行業(yè)場景適配性差、訓練代價大、中文理解能力不足等問題。面對金融領域文本專業(yè)性強、應用場景多變的情況,構建落地快、易迭代、可適配金融垂直領域的中文NLP模型是一個亟待實現(xiàn)的目標。

而此時,「孟子」的輕量化優(yōu)勢便發(fā)揮了出來。

周明告訴AI科技評論,諸如「孟子」的輕量化模型部署成本低,能夠快速迭代,用戶壓力小,且適配性強。此外,通過知識融合、數(shù)據(jù)增強,能力上或并不遜于大模型,十分適合金融場景的需求,更容易落地。

以下是雷峰網(wǎng)(公眾號:雷峰網(wǎng))-AI科技評論與周明博士的對話:

AI科技評論:能否簡單介紹一下瀾舟科技跟華夏基金共同成立金融NLP聯(lián)合實驗室的背景?

周明:我在2020年年底從微軟亞洲研究院離開,到創(chuàng)新工場擔任首席科學家,去年6月孵化了瀾舟科技。瀾舟科技的核心技術是自然語言理解,可以用于實現(xiàn)文本的智能理解、搜索、問答、摘要、翻譯以及知識圖譜等等。但具體落地,要找一個場景。

剛創(chuàng)立瀾舟科技時,我就首先想到金融。那時候我就想,要進入金融領域,不能隔靴瘙癢,而是要有更緊密的合作。我們要了解金融的需求,金融方也要知道我們的技術長板和短板,所以我就開始尋找能夠緊密合作的金融伙伴。

恰好在去年10月,我應邀參加一個在上海舉行的智能投研大會,做了一個特邀報告,其中介紹了瀾舟科技的自然語言處理技術,包括「孟子」預訓練模型。華夏基金的楊思成在臺下,對我們很感興趣,就介紹我和華夏基金的首席數(shù)據(jù)官陳一昕認識,雙方一拍即合。

我們共同認為,過去科技企業(yè)與金融公司的項目合作模式不夠密切。項目制是甲方與乙方,對方擬好一個需求,我圍繞需求提供技術、按時間交付,但技術的不斷迭代需要科技與場景的緊密結合,所以我和陳一昕最終決定采用「聯(lián)合實驗室」的方式,把大家放在一個籃子里,AI 可以隨著市場變化快速迭代,業(yè)務也可以更了解 AI。

AI科技評論:項目制是目前 AI/NLP 與其他領域結合的主流合作形式嗎?聯(lián)合實驗室是不是相對比較少?

周明:是的。在這里我要解釋一下,金融是一個特殊的領域,不像有的領域可以實現(xiàn)相對標準化的服務,「AI+金融」或「金融+AI」在當前還沒有定論。

金融的需求沒有那么明確,而且場景多樣化,同時 AI 技術也在不停地迭代,例如,大模型約每三個月就要迭代一次。

因此,金融行業(yè)的人士對 AI 是既渴望、又覺得太繁復,跟不上 AI 的節(jié)奏。在這種方式下,項目制就會產(chǎn)生一些問題,而聯(lián)合實驗室則能更靈活地應付這種快速多變的局面,把雙方的優(yōu)勢與長處發(fā)揮出來。

AI科技評論:據(jù)您觀察,目前國內(nèi)做 NLP 落地、或憑借 NLP 技術進軍金融領域的公司多嗎?

周明:兩者都不多。由于技術的局限性,NLP落地很難,因此全世界的NLP公司都比較少,但像百度、微軟、谷歌等背后都有 NLP 團隊,主要是服務于它們自身的業(yè)務和產(chǎn)品,作為一個部件,例如拼寫檢查、文檔分析、索引等等,但極少有公司專門以 NLP 技術立足。

近兩年大模型出現(xiàn)后,NLP 的能力大幅度提升,開始有人嘗試基于 NLP 技術創(chuàng)業(yè),但受疫情影響無法推行,很多科研者還在等待機會。也有將 NLP 當應用的公司,例如客服公司,但并非專門研究NLP。

AI科技評論:金融業(yè)務有哪些特征?在金融場景中,NLP能夠解決什么樣的問題?

周明:首先說NLP(自然語言處理)技術。目前 NLP 領域有許多基于互聯(lián)網(wǎng)的海量數(shù)據(jù)訓練出來的大規(guī)模預訓練模型,過去幾年也在全世界引起了廣泛關注。但瀾舟科技做的是「孟子」輕量化模型,模型不大、容易落地,同時又具備分析、搜索、翻譯、生成等能力。

NLP的這些能力在金融領域有很多用處,比如智能信息抽取。幾乎所有金融單位都要處理很多無結構、有結構或半結構的文檔,如網(wǎng)頁有表格、有字段。舉個例子,基金的變化,昨天的價格多少、今天的價格多少、基金數(shù)量、購買人數(shù)、交易量、上升與下降幅度等等,有可能寫在年報里,也有可能寫在網(wǎng)頁里,我們就可以使用智能文檔分析技術,將其重要信息抽取出來形成數(shù)據(jù)庫。

再聯(lián)想其他能力,NLP 幾乎貫穿金融業(yè)務的所有環(huán)節(jié),所以金融機構都重視 NLP 技術。但如何將NLP能力開發(fā)好、部署好,成本極低又能快速便捷地用起來,卻是不容易做到的。

AI科技評論:在這次NLP與金融的聯(lián)合中,「孟子」模型的落地如何體現(xiàn)?

周明:「孟子」在瀾舟公司的所有技術體系中都會體現(xiàn),包括智能文檔、信息抽取、知識圖譜、搜索問答,還有文本生成等,這些核心技術均會進入到跟華夏一同成立的聯(lián)合實驗室中。「孟子」會基于一些金融數(shù)據(jù)做訓練,從而獲得處理金融數(shù)據(jù)的能力。

基于「孟子」,我們希望可以在金融領域中做文檔智能信息抽取、OCR、輿情分析、暴雷事件分析、報警、風控,也可以做國內(nèi)外金融信息的抽取匯總和檢索、年報的自動生成和和行情預判等等,還有金融行業(yè)需要的客服、獲客、客戶推薦優(yōu)秀產(chǎn)品、客戶跟蹤、用戶畫像等。

AI科技評論:「孟子」強調(diào)的是小模型,小模型對于處理金融領域的問題是否有獨特的優(yōu)勢?

周明:在一定的情況下,模型越大、參數(shù)越多,泛化能力就越強、水平就越高,這是共識。但訓練一個巨大的模型需要巨大算力,在使用大模型時,推理也需要很大的計算集群,需要買成百上千張卡來支持運行,一般的公司(包括金融機構)都負擔不起,性價比也拉低。

而輕量化模型對用戶的壓力非常小,一般情況下只用少量GPU,甚至有些任務只用CPU也可以,部署成本可以大幅降低,又快又準。即便性能也許比大模型差了一點,但在大部分用戶看來是劃算的。也是基于這樣的市場,我們在成立瀾舟科技時就決定做輕量化模型。

瀾舟科技是國內(nèi)最早研究輕量化模型的公司之一。在研究「孟子」時,我們以為模型的能力會大幅削弱,但后來發(fā)現(xiàn),如果輕量化模型的算法過關,加上知識的融入、數(shù)據(jù)的增強,輕量化模型有可能不輸給大模型。這是非常了不起的一件事。 
工博士工業(yè)品商城聲明:凡資訊來源注明為其他媒體來源的信息,均為轉載自其他媒體,并不代表本網(wǎng)站贊同其觀點,也不代表本網(wǎng)站對其真實性負責。您若對該文章內(nèi)容有任何疑問或質疑,請立即與商城(www.podvhdv.cn)聯(lián)系,本網(wǎng)站將迅速給您回應并做處理。
聯(lián)系電話:021-31666777
新聞、技術文章投稿QQ:3267146135  投稿郵箱:syy@gongboshi.com