老小家蟻 (資料圖片)
中華小家蟻,體型真的很小,也就2mm左右(作者供圖)
□葉崢嶸
說起螞蟻的窩,你會想到哪些地方?洞穴里?樹干中?還有在樹枝上懸掛的球巢?沒錯,這些都是螞蟻做窩的常見選擇。不過,有些螞蟻對住處品味有點獨特,甚至還看上了“高科技”住宅——有人不小心把奶茶潑到了筆記本電腦屏幕上,結(jié)果引來一群螞蟻,它們干脆直接住在了電腦屏幕的夾縫中……
小家蟻就喜歡住家里
網(wǎng)上流傳的一段視頻中,海南的一位女子稱,自己因為喜歡在電腦前吃甜食、喝奶茶,落在電腦上的糖漬、碎渣便招來螞蟻入住到電腦窄縫里。
仔細觀察這段視頻中密密麻麻進出的小螞蟻,不難發(fā)現(xiàn)它們的身份。首先,這螞蟻塊頭肯定大不到哪去;其次這群螞蟻中的工蟻體態(tài)細長,幾只大屁股的蟻后混在其中,放大細看的話,還能看到它們胸部與腹部之間兩個小球狀的結(jié)節(jié)。由這些細節(jié)可以推斷出它們應(yīng)該是一種小家蟻。
顧名思義,小家蟻,就是喜歡住在家里的螞蟻。不少種類的小家蟻都能在我們的住處被發(fā)現(xiàn)。因為體形小,它們可以隨意地在家中各種犄角旮旯、磚縫、櫥柜以及各種我們難以想象的狹小縫隙中搭窩,對生存環(huán)境的要求也很隨便。
國內(nèi)常見的小家蟻主要有兩種:中華小家蟻和法老小家蟻——一個是中國本土螞蟻,一個是來自非洲的入侵物種。這兩種小家蟻完全可以直接用肉眼區(qū)分:中華小家蟻是純黑色或者偏棕色一些,而法老小家蟻除了腹部有些黑以外,身披黃金甲,有幾分埃及木乃伊的畫風(fēng)。
不過,這段視頻中的小家蟻,因為屏幕光線太亮,一時很難看清到底是什么顏色,暫時只能猜測它可能是法老小家蟻。
法老小家蟻是入侵物種
說到入侵螞蟻,紅火蟻的名號更加遠近聞名,因巨大的破壞力和可能會讓人休克的蟻酸而讓全國人民都對之記憶深刻。但紅火蟻再強大,它最多也只能在南方各地惹禍,因它們的巢穴建得比較淺,抗寒能力很差,幾乎無法向北繼續(xù)進犯。但北方人民也不可以高枕無憂,因為這種法老小家蟻雖然危害并不明顯,卻不挑南北,已遍布全國——它們的老家在遙遠的非洲大陸,如今卻因為人為活動而漂洋過海,入侵到世界各地,除了兩極附近區(qū)域,現(xiàn)在全世界大部分國家都能見到它們的身影。在我國,它們最初出現(xiàn)在南方地區(qū),因為喜歡溫暖環(huán)境,但由于它們主要生活在室內(nèi),而我國大部分北方地區(qū)室內(nèi)都有暖氣,所以北方地區(qū)也未能幸免被這種法老小家蟻入侵。
這種法老小家蟻也可以簡稱為小黃家蟻或者是法老蟻。因為個頭小,相較于紅火蟻那種能帶來立竿見影的直接危害,它們既沒有危險到能讓人進醫(yī)院的蜇針蟻酸,也沒有鋒利的上顎,而且還不會出現(xiàn)在野外,只是與人類生活密切綁定,貌似并不危險。但它們絕不容小覷。
小家蟻的一大特點就是家族興盛。它們會產(chǎn)生蟻后,一個家族中的蟻后數(shù)量會越來越多,而且互相之間能和睦相處。相對應(yīng)的,工蟻的數(shù)量幾乎也能無限擴增,條件適合的話,一個小家蟻家族的工蟻數(shù)量能到上百萬。和我們古時候的宗親大家族一般,興盛到一定規(guī)模后,它們就會“分家”。當(dāng)一部分工蟻找到合適的新家地址,比如視頻中那臺食物豐富、空間適宜又能確保安全的手提電腦,它們就會叫來幾只蟻后,從原來的家庭中“分家”出來,入住新址。
但我們?yōu)槭裁凑f這種小家蟻也很危險呢?不僅是因為它們的入住會導(dǎo)致手提電腦沒法再用,也難以維修,而是因為這些小家蟻的食譜很雜很豐富,它們不僅會與人類分享家中的美食,還可能會到戶外覓食,比如一些死蝙蝠、死老鼠的尸體等。且不說死蝙蝠身上是否還帶著對人有害的病毒病菌,只要想想這些法老蟻的工蟻們在外面品嘗完不知道什么動物尸體或者是其他不干凈的東西,又回到家中在我們的食物上大快朵頤,就會明白,它們無論在哪個國家,都是令人厭惡的疾病傳播者。
所以,雖然它們也只是自然環(huán)境里的一個小角色,只是按著自己的“生存模式”活著,而且還是借著人類的“東風(fēng)”才散播到全世界的,但只要在家中遇見它們,就別猶豫,趕緊上螞蟻藥吧。
(來源 科學(xué)辟謠公眾號)
作者:葉崢嶸
來源: 羊城晚報
去年以來,PC市場再度出現(xiàn)增長,小米、華為兩家手機廠商紛紛加入PC市場,與傳統(tǒng)的聯(lián)想、戴爾等PC豪強爭搶市場,呈現(xiàn)出一派繁榮景象。現(xiàn)在,又一支PC“新軍”殺到——在顯示器和液晶面板市場排名前列的惠科集團,推出了全新的“螞蟻電腦”一體機新品,并喊出了“好電腦,惠科造”的響亮口號。
一石激起千層浪,HKC是何方神圣?“螞蟻電腦”又是什么?早就過度競爭的PC市場還有機會嗎?以下,我們來揭開事件的神秘面紗。
PC的生產(chǎn)力地位目前無法被取代!
和熱鬧非凡的手機市場相比,PC市場顯得寂寞了許多,當(dāng)年紅火一時的DIY電子市場也紛紛退潮。然而,最近兩年P(guān)C市場又重新煥發(fā)新的活力,越來越多的用戶開始意識到,智能手機雖然功能強大,人們離不開智能手機,但它更多是用于消費。真正要用來干活,工作,創(chuàng)業(yè),養(yǎng)家,改圖,編視頻,還必須PC出馬,只有PC才是生產(chǎn)力!
而在PC各個品類當(dāng)中,一體機目前雖然市場體量不夠大,但卻一枝獨秀,據(jù)數(shù)據(jù)顯示,2019年中國區(qū)大客戶市場商用一體機電腦增長率達到10.69%。這是因為,在寸土寸金的辦公環(huán)境下,一體機占地小,簡便、易用。除了專職設(shè)計、視頻制作等工作需要高性能電腦以外,一體機提供的性能足夠滿足絕大多數(shù)商用辦公的需要。而分體式臺式機由于體積大,占地大,各種連接線纜多,已經(jīng)逐漸被企業(yè)用戶放棄。
HKC惠科集團馬興海表示:“PC市場正朝著高低兩個方向發(fā)展,一個是高性能、電競游戲的方向,需要的是性能強、價格貴、配置高;另一個方向就是朝著簡便、易用、高性價比的方向,即一體機。一體機是當(dāng)前增長最快、需求最旺盛的PC品類。此次我們選擇一體機作為突破口,既是看中了一體機市場的巨大增長潛力,也是HKC自身實力和特點的延伸。HKC是中國前兩大顯示器生產(chǎn)廠商,中國前四大液晶面板廠,有著很強的制造實力和渠道分銷網(wǎng)絡(luò),我們有信心抓住PC市場的新機會。”
好電腦,惠科造!
一般認(rèn)為,PC已經(jīng)是一個成熟產(chǎn)品,性能足夠,使用簡單,不容易壞,人們對PC的服務(wù)要求并不高。但是,當(dāng)用戶真的需要PC服務(wù)時,卻發(fā)現(xiàn)真的是一個“大問題”。這是因為,為了降低成本,許多企業(yè)已經(jīng)不再有專門的IT人員或網(wǎng)管進行維護,PC廠商也很少再提供及時的上門服務(wù)。對于家用PC用戶來說,服務(wù)同樣是個“問題”。家庭用戶居住分散,上門服務(wù)成本高,不劃算。
“服務(wù)好,才是真的好,HKC的優(yōu)勢在于服務(wù)”馬興海表示。HKC惠科集團本身以電子產(chǎn)品起家,是一支不容小覷的力量,集研發(fā)、生產(chǎn)、銷售于一體,從上游面板、芯片、模組等,到整機制造再到銷售網(wǎng)絡(luò)。2019年,惠科集團銷售額370億元人民幣,集團投資總額接近2000億元人民幣,投資規(guī)模甚至超過了許多老牌巨頭,是當(dāng)今中國投資規(guī)模最大的IT民營企業(yè)。同時,HKC還擁有遍布全國的數(shù)千家線下銷售店和售后服務(wù)點,因此,HKC螞蟻電腦不僅以一體機的可靠、易用為特點,更是將服務(wù)作為最大的特色,為用戶提供5分鐘快速響應(yīng)、2小時上門,以及3年免費上門服務(wù)。
目前,HKC“螞蟻電腦”一體機已經(jīng)向全國經(jīng)銷商渠道鋪貨,京東商城品牌旗艦店也即將上線開賣。相信隨著HKC“螞蟻電腦”新軍的加入,今年的PC市場將會更精彩。
器之心報道
作者:杜偉
在 AI 新時代,圖與大型語言模型能擦出什么火花?這是一個值得「深挖」的重要課題。
2021 年 3 月,知名 IT 咨詢公司 Gartner 在《2021 年十大數(shù)據(jù)和分析技術(shù)趨勢》報告中表示,圖技術(shù)已經(jīng)成為很多現(xiàn)代數(shù)據(jù)和分析能力的基礎(chǔ),并預(yù)測到 2025 年,圖技術(shù)將應(yīng)用于 80% 的數(shù)據(jù)和分析創(chuàng)新。
同時,2021-2023 世界人工智能大會連續(xù)三年舉辦了圖技術(shù)相關(guān)分論壇,引起了學(xué)界和業(yè)界的廣泛關(guān)注和熱烈反響。
不難看出,近年來圖技術(shù)非常被看好。圖技術(shù)一般指圖數(shù)據(jù)管理和分析技術(shù),研究客觀世界實體之間的關(guān)系,涉及大量異構(gòu)數(shù)據(jù)、存儲和分析。包括圖計算、圖學(xué)習(xí)、圖數(shù)據(jù)庫等一系列與圖技術(shù)原理相關(guān)的技術(shù)更匯聚形成圖智能,并被認(rèn)為是人工智能領(lǐng)域下一個前沿高地。
進入到了 2023 年,隨著大模型成為人工智能發(fā)展的主流趨勢,它們與圖計算等圖智能技術(shù)的融合成為全新的研究命題。近期,一些學(xué)者也開始關(guān)注大圖模型概念,如清華朱文武教授團隊最新論文《Large Graph Models: A Perspective》,介紹了大型圖模型面臨的挑戰(zhàn)、機遇和應(yīng)用前景。
我們不禁要問,圖智能與大模型之間的關(guān)系如何處理呢?二者的融合最終會往哪個方向發(fā)展?這些問題或許只有經(jīng)過學(xué)界與業(yè)界共同研究、探討之后才能得到更全面、更可信、更有操作性的答案。
在上周由螞蟻技術(shù)研究院和中國計算機學(xué)會數(shù)據(jù)庫專委主辦的 2023 外灘大會「新一代數(shù)據(jù)底座 —— 探索圖智能的應(yīng)用與發(fā)展」分論壇上,海內(nèi)外頂尖專家、學(xué)者和從業(yè)者聚焦圖智能領(lǐng)域的最新進展,對人工智能、大語言模型(以下簡稱大模型)與圖智能技術(shù)的融合展開了深度解構(gòu)。
螞蟻技術(shù)研究院院長陳文光
推出大圖模型,螞蟻圖智能先人一步
在這場論壇上,我們見證了圖智能與大模型融合研究的一項重要成果。那就是螞蟻推出的大圖模型(Large Graph Model, LGM),它將圖計算、圖學(xué)習(xí)等圖智能技術(shù)與大模型相結(jié)合,同時釋放大模型的生成能力和圖計算的關(guān)聯(lián)關(guān)系分析能力,通過更直觀、全面的信息呈現(xiàn)和更精準(zhǔn)的洞察,更好地解決海量復(fù)雜的數(shù)字化應(yīng)用難題。
在談到為何會將圖計算這一強大的數(shù)據(jù)處理技術(shù)與大模型這一最有可能走向通用人工智能的技術(shù)相互驅(qū)動、融合利用時,螞蟻集團圖學(xué)習(xí)高級技術(shù)專家劉永超表示,大模型雖可以推理出隱性關(guān)聯(lián)關(guān)系,但無法繪制關(guān)系圖,而使用圖結(jié)構(gòu)表示數(shù)據(jù)關(guān)系更便于理解。如果給大模型「配上」圖計算,則先從海量信息中邏輯推理,再利用超級計算算出關(guān)系。「這類似于給人腦外接了一臺超級計算機,能力更強了。」
他進一步解釋稱,大模型在本質(zhì)上完成了對文字、圖像、視頻等數(shù)據(jù)的信息壓縮。因此他們開始思考這種將高維空間數(shù)據(jù)壓縮到低維空間的信息編碼方式對研究圖智能的啟發(fā)。結(jié)果顯而易見,螞蟻將信息更豐富的圖數(shù)據(jù)壓縮到大模型中,打造出了大圖模型。簡單來講,大圖模型以圖為核心,融合了預(yù)訓(xùn)練、LLM 和提示等技術(shù)構(gòu)建的壓縮圖信息。
至于大圖模型能解決哪些核心問題?劉永超總結(jié)了以下幾點,一是解決數(shù)據(jù)稀少、多樣性缺失、數(shù)據(jù)分布不均甚至數(shù)據(jù)隱私、安全、保密等問題,提升數(shù)據(jù)質(zhì)量、多樣性、公平性、安全性;二是通過快速的圖樣本生成,減少對耗時耗錢數(shù)據(jù)采集和標(biāo)注的依賴;三是基于提示詞能夠發(fā)現(xiàn)和解釋數(shù)據(jù)特性。
劉永超
在大圖模型研究中,螞蟻一方面完成了第一階段「生成式異質(zhì)圖增強」工作,也是業(yè)界首個,可以根據(jù)現(xiàn)有數(shù)據(jù)生成新的數(shù)據(jù)點。相關(guān)論文《Multi-Aspect Heterogeneous Graph Augmentation》被計算機頂會 WWW 2023 收錄。另一方面通過 Prompt(指令或提示)引導(dǎo)模型學(xué)習(xí)和發(fā)現(xiàn)特定數(shù)據(jù)特性,加速數(shù)據(jù)分析和特性發(fā)現(xiàn)的過程。
螞蟻內(nèi)部也就 LGM 能做什么展開深層次業(yè)務(wù)實踐探索,目前至少可以用作商業(yè)場景通用風(fēng)險模型、全網(wǎng)賬戶畫像基座模型和大規(guī)模圖策略推薦。除了大圖模型,劉永超還分享了圖計算賦能大模型的工作,主要是圖向量數(shù)據(jù)庫和圖增強的大模型。其中圖增強的大模型使用圖數(shù)據(jù)尤其是知識圖譜,來輔助解決大模型遇到的幻覺、行為不對齊、有毒等難題。
大圖模型的出現(xiàn)為大模型和圖計算兩個領(lǐng)域都帶來了新的機遇,為兩個領(lǐng)域攜手發(fā)展提供了一條路徑。一方面利用圖計算補足大模型在圖生成、推理、理解等方面的不足,提升解決圖任務(wù)的效果。另一方面融入大模型更高效地助力破解圖領(lǐng)域難題,為圖智能走向通用人工智能提供一條可行性方案。可以說,螞蟻率先開始大圖模型的研究,充分體現(xiàn)了其在大模型時代把握技術(shù)潮流方面的前瞻性,也必將為圖智能的進一步應(yīng)用與發(fā)展帶來助益。
其實在圖計算領(lǐng)域,螞蟻一直是引領(lǐng)者。作為國內(nèi)最早研究圖計算技術(shù)的企業(yè)之一,螞蟻不僅構(gòu)建了世界規(guī)模領(lǐng)先的圖計算集群,還形成了一套以圖數(shù)據(jù)庫為底座、包含流式圖計算、離線圖學(xué)習(xí)的大規(guī)模圖計算平臺 TuGraph。TuGraph 曾三次打破圖數(shù)據(jù)庫權(quán)威測評 LDBC SNB 世界紀(jì)錄,2021 年獲得世界互聯(lián)網(wǎng)大會「領(lǐng)先科技成果」獎,2023 年入選 IDC MarketScape 中國圖數(shù)據(jù)庫市場「領(lǐng)導(dǎo)者」象限。
螞蟻積極把圖計算能力向外開放。其中 TuGraph 平臺中的圖數(shù)據(jù)庫 TuGraph DB 3.3 于 2022 年 9 月正式開源。此次論壇螞蟻集團圖數(shù)據(jù)庫開源負(fù)責(zé)人林恒分享了最新的 TuGraph-DB 4.0 版本以及螞蟻全棧圖智能計算架構(gòu)。自開源以來,TuGraph-DB 經(jīng)歷了云上一鍵部署、Python 算法接口、POG 支持、圖學(xué)習(xí)引擎、高可用等階段,最終形成了 4.0 版本,并計劃于 2024 年 1 月推出下一代存儲引擎。
林恒
那么,TuGraph-DB 4.0 具備哪些核心功能呢?第一點是支持標(biāo)準(zhǔn)化圖查詢語言 ISO GQL,它的定位可以類比 SQL 查詢語言,極大地降低圖的使用門檻;其次是高可用性,基于 RAFT 協(xié)議實現(xiàn)多活熱備、一寫多讀,提供企業(yè)級的能力;接著是強大的圖學(xué)習(xí)能力,和數(shù)據(jù)庫結(jié)合后能夠?qū)崟r采樣,兼容 DGL、PyG 等常見圖學(xué)習(xí)框架;最后豐富了易用的接口,存儲過程支持 Python、C++、Rust 等多語言。一切為了更簡單易用、功能完備,并選擇將一些企業(yè)級功能開放,完善生態(tài)建設(shè)。
回到螞蟻內(nèi)部,林恒表示正根據(jù)各業(yè)務(wù)的多樣化需求來升級圖數(shù)據(jù)庫,對圖的使用從以往的「散點式」發(fā)展為了「體系式」。升級后可以同時具備多源數(shù)據(jù)融合能力、HTAP 型圖融合能力以及圖智能、圖挖掘能力,實現(xiàn)一庫多能,提升交互體驗。此外它作為螞蟻圖智能計算全棧解決方案的底層部分,連同圖計算和統(tǒng)一 API 接口、一站式研發(fā)平臺為實現(xiàn)豐富的圖應(yīng)用提供數(shù)據(jù)、算力和平臺支撐。
目前,螞蟻更多關(guān)注成熟的金融場景,比如風(fēng)控、審計等。不過林恒也認(rèn)為,圖數(shù)據(jù)庫具備的通用性可以在智能制造、CRM 等其他場景大顯身手。同時持續(xù)關(guān)注圖生態(tài)、行業(yè)標(biāo)準(zhǔn)等,其主導(dǎo)發(fā)起的全球首個金融圖數(shù)據(jù)庫測試基準(zhǔn) LDBC FinBench 已于今年 6 月正式發(fā)布,為金融行業(yè)提供了一個量化的基準(zhǔn)測試工具。
圖技術(shù)一直在進步,并正在思考大模型時代如何演進
在螞蟻集團等業(yè)界探索圖智能與大模型融合創(chuàng)新的同時,學(xué)界和科研機構(gòu)也在推進圖技術(shù)向前發(fā)展,尋找與大模型的契合點。
我們知道,任何數(shù)據(jù)都繞不開數(shù)據(jù)庫管理系統(tǒng)(DBMS),圖數(shù)據(jù)亦然。根據(jù)知名數(shù)據(jù)庫流行度排行網(wǎng)站 DB-Engines 的統(tǒng)計,自 2013 至 2022 年,圖數(shù)據(jù)庫管理系統(tǒng)的受歡迎程度增長比任何其他數(shù)據(jù)庫類別都快。圖已經(jīng)無處不在,但面臨擴展性、可視化和查詢語言等方面的挑戰(zhàn),學(xué)界研究的圖與實際使用中的也存在脫節(jié)。這些都是流圖(Straming Graph)類型興起的原因。
對于圖而言,加拿大滑鐵盧大學(xué)教授 M. Tamer Ozsu 解釋稱,流意味著無界和高速度,流圖也不等同于動態(tài)圖。流數(shù)據(jù)不是靜止的,而是流入一個系統(tǒng),比如流音樂或流視頻,這類系統(tǒng)被稱為數(shù)據(jù)流系統(tǒng)(DSS)。DSS 與傳統(tǒng) DBMS 的最大區(qū)別在于瞬態(tài)數(shù)據(jù)可以通過持續(xù)查詢生成連續(xù)的結(jié)果。數(shù)據(jù)流處理系統(tǒng)(DSPS)可能無法提供全部的 DBMS 功能,但幾乎都具備擴展功能。
M. Tamer Ozsu
對于流圖,目前可以應(yīng)用在電子商務(wù)欺詐檢測(如信用卡欺詐)和網(wǎng)絡(luò)入侵檢測(如 DOS 攻擊)。流圖計算模型一方面是連續(xù)的,需要處理每條邊以及線性空間;另一方面呈窗口化,使用窗口來批處理邊緣。流圖工作負(fù)載表現(xiàn)在兩個方面,一是圖查詢,每個查詢訪問圖的一部分。二是圖分析,每個查詢訪問整個圖。
如 M. Tamer Ozsu 教授最后所言,流圖真實存在于現(xiàn)實生活的應(yīng)用中,如實時決策。不過他也認(rèn)為,我們并沒有對流圖面臨的挑戰(zhàn)(比如流的無界性)給予足夠的重視。因此可以說,從靜態(tài)圖到流圖,整個領(lǐng)域目前是開放的。
除了圖自身的演進之外,在圖發(fā)揮重要作用的知識圖譜(KG)領(lǐng)域也迎來新的技術(shù)變革時刻。那就是在大模型時代,知識圖譜如何把握新機遇并迎戰(zhàn)新挑戰(zhàn)。
對此,浙江大學(xué)計算機學(xué)院教授陳華鈞指出,知識圖譜是圖智能的重要支撐技術(shù)。隨著 ChatGPT 的興起,人們開始關(guān)心知識圖譜與大模型的關(guān)系。二者都是表示和處理知識的方法,只是在可解釋性、知識類型和可計算性上存在差異。自然語言可以被人類理解,但不易于計算,催生了較容易計算處理的知識圖譜。大模型雖易于計算處理,但完全不可理解,導(dǎo)致它們面臨知識謬誤、幻覺等問題。
這時出現(xiàn)一個值得深思的問題,大模型為了易于計算所付出的代價能不能通過知識圖譜來彌補?陳華鈞認(rèn)為二者可以融合共同發(fā)揮作用。
一方面是大模型知識棧中的知識圖譜,它通過知識增強和結(jié)構(gòu)增強(引入不同類型的結(jié)構(gòu)信號、從外部知識庫檢索)、知識圖譜結(jié)合提示學(xué)習(xí)、知識編輯、思維鏈結(jié)構(gòu)化、工具調(diào)用與增強、可控內(nèi)容生成等方式,分別在大模型的預(yù)訓(xùn)練、適應(yīng)與調(diào)整、應(yīng)用與交互三個階段發(fā)揮作用,有效提升模型訓(xùn)練以及對下游任務(wù)的泛化能力。
另一方面是知識圖譜棧中的大模型,它有助于解決傳統(tǒng)的知識圖譜問題。GPT 等大模型具備較強的指令驅(qū)動型圖譜構(gòu)建和泛化抽取能力,對比傳統(tǒng)圖譜構(gòu)建優(yōu)勢明顯。此外利用結(jié)構(gòu)化知識大模型可以執(zhí)行知識圖譜等結(jié)構(gòu)化知識的邏輯查詢、問答等操作。在推理時,大模型既可以作為知識圖譜推理的自然語言交互接口以增強后者,也能將自身具備的推理與知識圖譜推理實現(xiàn)交互增強。
陳華鈞
在陳華鈞看來,大模型技術(shù)的發(fā)展代表了 AI 表示和處理知識能力的大幅提升。雖然會對知識圖譜帶來沖擊,但隨著其與語言模型的深層次融合,未來可能演進出一個全新的知識圖譜技術(shù)方向。相較于表示知識有限的序列結(jié)構(gòu)的自然語言,包含圖的結(jié)構(gòu)化描述更易于描述客觀世界。因此,相對于大模型(LLM)而言,他認(rèn)為我們更需要可以處理各種知識表示結(jié)構(gòu)的大型知識模型(LKM)。
在知識圖譜與大模型的「互補共進」之外,聚焦于某個領(lǐng)域的圖預(yù)訓(xùn)練大模型已經(jīng)開始嶄露頭角。之江實驗室圖計算中心副主任陳紅陽展示了面向生物制藥領(lǐng)域的朱雀圖預(yù)訓(xùn)練大模型,其潛在應(yīng)用方向包括藥物分子生成、藥物性質(zhì)預(yù)測、藥物結(jié)構(gòu)預(yù)測等。
不過想做生物制藥 GPT 談何容易,面臨著很多挑戰(zhàn),比如如何應(yīng)對生物領(lǐng)域的非歐結(jié)構(gòu)數(shù)據(jù)、如何解決圖神經(jīng)網(wǎng)絡(luò)過平滑和數(shù)據(jù)標(biāo)簽稀疏問題。圖計算中心見招拆招,一一解決對應(yīng)的問題,最終完成模型訓(xùn)練。整個大模型的訓(xùn)練很難,需要不斷嘗試。他們采取并行策略,已經(jīng)進行了 128 張 DCU 卡的穩(wěn)定性試驗。目前正在擴展至 1024 張 DCU 卡,相應(yīng)的端到端平臺也將開源。
同時,之江朱雀圖計算平臺面向科學(xué)計算領(lǐng)域,尤其是天然擁有與圖關(guān)聯(lián)數(shù)據(jù)的計算育種、生物制藥和量子化學(xué)。作為一站式平臺,它在計算引擎、圖存儲、軟硬件適配、計算資源等多方面都做了優(yōu)化。陳紅陽重點介紹了一些前沿圖學(xué)習(xí)算法,其中自研孿生圖神經(jīng)網(wǎng)絡(luò) PSG 算法刷新國際頂級圖學(xué)習(xí)榜單 OGB 挑戰(zhàn)賽記錄。此外基于平臺在藥物知識圖譜、計算制藥、高能物理、量子圖機器學(xué)習(xí)等領(lǐng)域均有應(yīng)用與創(chuàng)新。
陳紅陽
展望未來,陳紅陽希望圍繞圖與科學(xué)計算(即 Graph4SCI)進一步探索,通過深入優(yōu)化把軟硬件協(xié)同和異構(gòu)系統(tǒng)計算做得更好,爭取實現(xiàn)更多的國產(chǎn)軟硬件適配和算力加速。同時繼續(xù)深耕圖計算技術(shù)及氣候、地理、生物和量子化學(xué)等領(lǐng)域應(yīng)用,通過與更多企業(yè)、高校和科研機構(gòu)共享數(shù)據(jù)、平臺和算力,推動圖智能在科學(xué)研究中進一步發(fā)展。
以上種種,我們可以看到,無論是知識圖譜還是圖計算,圖技術(shù)一直在更迭變化之中,以適應(yīng)不同科研領(lǐng)域及多樣化應(yīng)用場景的需求。更顯著的一點是,人們已經(jīng)開始思考如何將圖與大模型融合,并付諸行動,從而能夠把握住大模型引領(lǐng)的這股 AI 技術(shù)浪潮。
圖智能 + 大模型:未來的路還很長
此次論壇出現(xiàn)了很多新的概念,比如大圖模型、圖預(yù)訓(xùn)練大模型以及大型知識模型等。我們從中可以看到這樣一種趨勢,自 ChatGPT 以來,包括圖計算在內(nèi)的很多技術(shù)領(lǐng)域或許都無法回避與大模型的融合研究。只有把握住這一技術(shù)奇點,才更有可能在原有技術(shù)范疇內(nèi)進行革新,更高效地賦能業(yè)務(wù)實踐。
可以預(yù)見,未來大模型和圖智能技術(shù)結(jié)合的更多可能性將會被逐漸挖掘出來。正如陳文光所言,二者之間的關(guān)系是當(dāng)前最重要的問題。在這個非常值得探索的發(fā)展方向上,需要包括螞蟻在內(nèi)的更多業(yè)界先行者持續(xù)創(chuàng)新圖與大模型融合技術(shù)、構(gòu)建平臺、建設(shè)更廣泛的生態(tài)。
未來的路雖然漫長,但對于螞蟻來說,已經(jīng)走出了領(lǐng)先的一步。相信未來大圖模型應(yīng)用的場景會越來越多,圖智能領(lǐng)域也將一步步邁向自己的 AGI 時刻。
參考文獻:
https://arxiv.org/pdf/2308.14522.pdf
https://www.gartner.com/cn/newsroom/press-releases/gartner_2021_