|
AI,對(duì)學(xué)術(shù)研究有什么幫助《國(guó)務(wù)院關(guān)于深入實(shí)施“人工智能+”行動(dòng)的意見(jiàn)》提出,推動(dòng)哲學(xué)社會(huì)科學(xué)研究方法向人機(jī)協(xié)同模式轉(zhuǎn)變,探索建立適應(yīng)人工智能時(shí)代的新型哲學(xué)社會(huì)科學(xué)研究組織形式,拓展研究視野和觀察視域。 此前,本版曾推出專題報(bào)道《人工智能:來(lái)自科學(xué),改變科學(xué)》,探討了人工智能給自然科學(xué)研究帶來(lái)的變化。本期走進(jìn)哲學(xué)社會(huì)科學(xué)領(lǐng)域,邀請(qǐng)專家學(xué)者談?wù)勊麄冊(cè)谌粘Q芯抗ぷ髦惺褂肁I的探索和思考。 古籍整理與研究有了得力“助手” 講述人:北京師范大學(xué)文學(xué)院教授、漢字漢語(yǔ)研究與社會(huì)應(yīng)用實(shí)驗(yàn)室主任 王立軍 一部未經(jīng)整理的古籍,其字形認(rèn)同、句讀標(biāo)點(diǎn)、詞義考辨、典故溯源,每一項(xiàng)工作都對(duì)研究者的專業(yè)學(xué)養(yǎng)和時(shí)間投入提出極高要求。傳統(tǒng)的人工整理模式不僅周期長(zhǎng)、成本高,也因?qū)I(yè)人才的稀缺,使得大量古籍文獻(xiàn)難以得到及時(shí)有效的整理和利用。我們一直在思考,能否借助現(xiàn)代科技,為這項(xiàng)古老而崇高的事業(yè)注入新的能量? 人工智能技術(shù)的快速發(fā)展,為我們提供了解決這一難題的新思路。2022年,在國(guó)家文化數(shù)字化戰(zhàn)略的指引下,我們團(tuán)隊(duì)獲批承擔(dān)國(guó)家語(yǔ)委重大項(xiàng)目,致力于利用人工智能前沿技術(shù),攻克古籍整理數(shù)字化和智能化中的關(guān)鍵難題。 這條道路充滿挑戰(zhàn)。通用大語(yǔ)言模型在標(biāo)引或釋讀古漢語(yǔ)文本時(shí),容易出現(xiàn)內(nèi)容篡改和事實(shí)性錯(cuò)誤等“幻覺(jué)”現(xiàn)象,無(wú)法做到對(duì)古漢語(yǔ)專業(yè)領(lǐng)域知識(shí)的準(zhǔn)確理解。因此,我們選擇從頭訓(xùn)練垂直領(lǐng)域模型,利用大規(guī)模、高質(zhì)量的專業(yè)古籍語(yǔ)料來(lái)應(yīng)對(duì)通用大語(yǔ)言模型的這一弊端。為致敬近代國(guó)學(xué)大師章太炎先生,我們將該模型命名為“AI太炎”。過(guò)去,一位學(xué)者整理一部典籍的初稿可能需要數(shù)月乃至數(shù)年;如今,“AI太炎”能在短時(shí)間內(nèi)完成一部古籍文本的自動(dòng)標(biāo)點(diǎn)、注釋生成、文白翻譯、典故提取等基礎(chǔ)性工作。 然而,這并不意味著AI將取代學(xué)者。恰恰相反,它將我們從大量煩瑣、重復(fù)的基礎(chǔ)勞動(dòng)中解放出來(lái),使我們能夠聚焦于更具深度和創(chuàng)造性的學(xué)術(shù)探究。譬如,在漢語(yǔ)詞義的演變研究中,我們利用“AI太炎”的智能釋義技術(shù),對(duì)近2億字語(yǔ)料進(jìn)行全量標(biāo)注。當(dāng)古今漢語(yǔ)詞匯的意義流變軌跡,以系統(tǒng)性數(shù)據(jù)的形式清晰呈現(xiàn)時(shí),我們得以用一種全新的、數(shù)據(jù)驅(qū)動(dòng)的方式,去觀察和分析語(yǔ)言演變的宏觀規(guī)律。這在過(guò)去是難以想象的。 學(xué)術(shù)成果的生命力在于其社會(huì)價(jià)值。我們積極推動(dòng)“AI太炎”在多元場(chǎng)景中落地應(yīng)用:與出版機(jī)構(gòu)合作,將AI融入古籍?dāng)?shù)字化整理的工作流程;研發(fā)多語(yǔ)種翻譯功能,支持將文言文翻譯為英、法、俄、日等語(yǔ)言;建設(shè)文言文知識(shí)庫(kù)和分級(jí)閱讀語(yǔ)料庫(kù),研發(fā)學(xué)習(xí)難點(diǎn)自動(dòng)識(shí)別、知識(shí)點(diǎn)自動(dòng)關(guān)聯(lián)等教學(xué)輔助技術(shù),服務(wù)一線語(yǔ)文教學(xué)需求…… 當(dāng)然,我們對(duì)AI的應(yīng)用邊界和潛在風(fēng)險(xiǎn)保持高度的審慎。首先,AI并非全知全能,對(duì)于知識(shí)盲區(qū)和復(fù)雜情境可能輸出不準(zhǔn)確內(nèi)容,因此其結(jié)果應(yīng)作為“參考”而非“定論”,專業(yè)人士的審核把關(guān)不可或缺。其次,要警惕因技術(shù)依賴導(dǎo)致的思維惰性,尤其在人才培養(yǎng)中,原典閱讀和句讀訓(xùn)練等傳統(tǒng)方法仍十分必要。此外,人文學(xué)科更應(yīng)堅(jiān)守人文關(guān)懷和對(duì)文史知識(shí)的深刻洞察——AI雖能高效處理信息,卻難以觸及文字背后的復(fù)雜情感和深邃思想。人文學(xué)者的創(chuàng)造力與洞察力,始終是古籍整理與研究中不可替代的核心。 作為新時(shí)代人文學(xué)科的研究者,我們既要積極擁抱技術(shù)變革,也要堅(jiān)定守護(hù)人文學(xué)科的核心價(jià)值與學(xué)術(shù)精神。我們相信,通過(guò)人機(jī)協(xié)同的創(chuàng)新實(shí)踐,那些沉睡在典籍中的古老智慧,必將得到更有效的活化與傳承,在新時(shí)代綻放出更加璀璨的光芒。 這可能是考古學(xué)的“第三次革命” 講述人:山東大學(xué)文化遺產(chǎn)研究院院長(zhǎng)、講席教授 方輝 當(dāng)前,陶器研究逐漸從編年史的視角轉(zhuǎn)向?qū)ζ渑c社會(huì)關(guān)系的關(guān)注,陶器社會(huì)研究因此成為重要話題。陶器社會(huì)研究可以說(shuō)是碳-14測(cè)年技術(shù)帶來(lái)的,它使考古學(xué)家有了絕對(duì)年代標(biāo)尺,對(duì)考古學(xué)來(lái)說(shuō)是一次革命性發(fā)展。如果說(shuō)碳-14測(cè)年解決的是年代序列問(wèn)題,那么DNA研究則觸及了人本身以及社會(huì)組織的問(wèn)題,為考古研究又帶來(lái)革命性轉(zhuǎn)變,而且這個(gè)轉(zhuǎn)變還在進(jìn)行中。 目前,在考古中有一種現(xiàn)象還沒(méi)有引起足夠重視,那就是跨坑拼對(duì)現(xiàn)象。我們?cè)诎l(fā)掘中曾遇到這種情況:一個(gè)陶器散落在相距40米的不同地方,但由于它上面有暗紋,無(wú)意當(dāng)中一拼對(duì),發(fā)現(xiàn)它們是同一件器物。出土這兩個(gè)陶片的兩個(gè)不同的灰坑,圍繞著一個(gè)大祭壇分布,形成了一個(gè)共時(shí)的活動(dòng)遺留。這提示我們,跨坑拼對(duì),對(duì)于微觀聚落的共時(shí)性建構(gòu)是非常重要的。 然而,考古工作者總是要處理海量的文物遺存,人工拼對(duì)有時(shí)候很難進(jìn)行識(shí)別,因?yàn)檫@不只涉及一個(gè)灰坑、一個(gè)地層,甚至是一個(gè)遺址。面對(duì)海量的陶片,通過(guò)人力實(shí)現(xiàn)拼對(duì)從而證明不同單位的共時(shí)性是很難的。但是,人工智能卻是可能實(shí)現(xiàn)的,它可以快速進(jìn)行識(shí)別,并嘗試加以驗(yàn)證。 從2024年起,我們選取濟(jì)南大辛莊遺址中的一個(gè)灰坑開(kāi)展考古工作,這個(gè)灰坑分為14層,包含18000多片陶片。我們?cè)趯?duì)每一片陶片進(jìn)行編號(hào)、拍照、記錄等數(shù)據(jù)采集過(guò)程中發(fā)現(xiàn),這些陶片都有層位信息,可以實(shí)現(xiàn)跨層拼對(duì)。但由于數(shù)量龐大,人工拼對(duì)短期內(nèi)難以完成,我們決定試試AI。 于是,我們向全球開(kāi)放了這些珍貴的考古數(shù)據(jù),并發(fā)起了“大辛莊陶片拼合AI挑戰(zhàn)賽”,要求參賽團(tuán)隊(duì)開(kāi)源其解決方案。我們希望參賽者能夠開(kāi)發(fā)出具有通用性和可解釋性的算法模型,有效應(yīng)對(duì)陶片歷經(jīng)3000年風(fēng)化、磨損和顏色失真等復(fù)雜情況。 最終,參賽者提交了300多份解決方案,但因?yàn)樘掌恼疵嫘畔、厚度、曲率都?huì)對(duì)AI拼對(duì)造成困難,需要龐大的算力支撐,最終實(shí)現(xiàn)有效拼對(duì)的不是很多。目前,據(jù)不完全統(tǒng)計(jì),在18000多片陶片中,有效拼對(duì)的大約有60個(gè)。 不過(guò),基于AI的陶器研究,其意義并非僅僅在于單純地增加可拼對(duì)的器物數(shù)量。實(shí)際上,它的潛在價(jià)值對(duì)于微觀聚落考古的共時(shí)性建構(gòu)至關(guān)重要。拼合出的器物形態(tài)與數(shù)量,可以作為我們理解當(dāng)時(shí)社會(huì)組織、生活圖景和文化交流的重要線索。相信隨著AI拼對(duì)技術(shù)的成熟,它未來(lái)可能會(huì)給考古學(xué)帶來(lái)對(duì)古代社會(huì)不一樣的理解。也許,這正是考古學(xué)的“第三次革命”。 為國(guó)際傳播提供更科學(xué)精準(zhǔn)的參考 講述人:湖南師范大學(xué)人工智能與精準(zhǔn)國(guó)際傳播實(shí)驗(yàn)室主任 高協(xié)平 過(guò)去,要研究一個(gè)國(guó)際熱點(diǎn)事件的媒體報(bào)道,通常會(huì)抽樣選擇一些有代表性的媒體,統(tǒng)計(jì)分析其數(shù)百篇報(bào)道。這就像通過(guò)隨機(jī)取幾個(gè)水樣,來(lái)推測(cè)整片海洋的成分。而現(xiàn)在,AI給了我們“駕馭整片海洋”的能力。 我們?cè)鲞^(guò)一項(xiàng)關(guān)于“一帶一路”倡議全球傳播的研究。通過(guò)AI驅(qū)動(dòng)的網(wǎng)絡(luò)爬蟲(chóng),在幾小時(shí)內(nèi)就采集到上百個(gè)國(guó)家和地區(qū)、數(shù)十種語(yǔ)言、長(zhǎng)達(dá)五年跨度的數(shù)百萬(wàn)篇新聞報(bào)道和社交媒體帖子。這個(gè)數(shù)據(jù)量,是傳統(tǒng)方法很難做到的。但這只是第一步。面對(duì)這片信息的“汪洋”,如何分析?我們引入大數(shù)據(jù)方法和自然語(yǔ)言處理技術(shù)。AI模型可以自動(dòng)對(duì)海量文本進(jìn)行情感分析,精準(zhǔn)識(shí)別不同國(guó)家媒體對(duì)該倡議的態(tài)度。通過(guò)主題建模,它能像一位不知疲倦的助手,自動(dòng)歸納出外媒報(bào)道中最常出現(xiàn)的議題,譬如是聚焦“經(jīng)濟(jì)合作”還是“地緣政治”?是強(qiáng)調(diào)“基礎(chǔ)設(shè)施建設(shè)”還是“文化影響”?這讓我們從過(guò)去對(duì)“點(diǎn)”的推測(cè),躍升到對(duì)“面”甚至“體”的精確描繪。我們不再只是“覺(jué)得”某個(gè)議題很重要,而是能通過(guò)數(shù)據(jù)“看到”它在整個(gè)信息生態(tài)中的權(quán)重、演變和關(guān)聯(lián)。這種研究范式的轉(zhuǎn)變,是革命性的。 隨著以“我即媒體”為象征的社交媒體時(shí)代來(lái)臨,傳播學(xué)早已不限于文字形態(tài),圖片、表情包、短視頻成為新時(shí)代的“世界語(yǔ)”。傳統(tǒng)研究方法面對(duì)這些非文本內(nèi)容,常常感到無(wú)力。但AI中的計(jì)算機(jī)視覺(jué)技術(shù),為我們打開(kāi)了新世界的大門(mén)。 我們研究過(guò)一些國(guó)際社交媒體上的中國(guó)形象傳播。以前做這種研究需要招募一大批志愿者,人工觀看成千上萬(wàn)的視頻,記錄其中出現(xiàn)的長(zhǎng)城、高鐵、京劇臉譜等中國(guó)元素,效率極低且主觀性強(qiáng),F(xiàn)在,我們訓(xùn)練AI模型,讓它可以自動(dòng)識(shí)別視頻中的視覺(jué)符號(hào),分析畫(huà)面構(gòu)圖、色彩基調(diào),甚至結(jié)合字幕和語(yǔ)音,進(jìn)行更深刻的挖掘,做出更綜合的判斷。AI賦能下的多模態(tài)分析,讓我們能夠更全面、更立體地解讀這個(gè)視覺(jué)化的傳播時(shí)代,讓那些“只可意會(huì)”的視覺(jué)修辭,變得“可以言傳”,甚至可以量化分析。 可能有人會(huì)問(wèn):AI的“冷冰冰”數(shù)據(jù),會(huì)不會(huì)取代人文社科的“溫度”與深度思考?我們的回答是:不會(huì)。AI不是取代思想的“魔法”,而是解放生產(chǎn)力的“利器”。它將我們從煩瑣、重復(fù)的勞動(dòng)中解放出來(lái),讓我們有更多精力去進(jìn)行理論構(gòu)建、提出更具創(chuàng)見(jiàn)的假設(shè),去解讀數(shù)據(jù)背后深刻的社會(huì)、文化與心理動(dòng)因。 展望未來(lái),我們正嘗試構(gòu)建更智能的“精準(zhǔn)國(guó)際傳播”模型。希望利用AI,不僅分析“已經(jīng)發(fā)生了什么”,還能預(yù)測(cè)“將產(chǎn)生怎樣的結(jié)果”,更能精準(zhǔn)建議“如何面向?qū)ξ磥?lái)”,從而為講好中國(guó)故事提供更科學(xué)、更精準(zhǔn)的決策參考。 “數(shù)智決策”改變金融理論與實(shí)踐 講述人:西南財(cái)經(jīng)大學(xué)大數(shù)據(jù)研究院副院長(zhǎng) 徐亮 我來(lái)自西南財(cái)經(jīng)大學(xué)大數(shù)據(jù)研究院“地方金融動(dòng)態(tài)監(jiān)測(cè)及系統(tǒng)性風(fēng)險(xiǎn)預(yù)警”團(tuán)隊(duì)。在AI技術(shù)飛速發(fā)展和國(guó)家“金融強(qiáng)國(guó)”戰(zhàn)略結(jié)合日益緊密的當(dāng)下,我越來(lái)越深刻地感受到,AI驅(qū)動(dòng)的“數(shù)智決策”正在深刻改變金融理論與實(shí)踐。 金融理論和實(shí)踐,離不開(kāi)預(yù)測(cè)和決策兩個(gè)環(huán)節(jié)。預(yù)測(cè)就是對(duì)未來(lái)收益或者行為的預(yù)期。在數(shù)字時(shí)代,數(shù)據(jù)基礎(chǔ)發(fā)生了根本變化,多模態(tài)混頻數(shù)據(jù),如交易流水、輿情文本、財(cái)報(bào)圖像等文本、數(shù)字和圖片同時(shí)存在,極大增加了預(yù)測(cè)難度。決策就是投資的決定或者面臨風(fēng)險(xiǎn)的處置方式。傳統(tǒng)的基于模型計(jì)算結(jié)果的決策模式,缺乏自我調(diào)節(jié)和修正能力,而“先預(yù)測(cè)、后決策”分離范式容易導(dǎo)致“預(yù)測(cè)準(zhǔn)確但決策效果不佳”。 我在研究中面臨多模態(tài)數(shù)據(jù)預(yù)測(cè)的一個(gè)典型場(chǎng)景,是“電碳融合”背景下的企業(yè)信用評(píng)級(jí)。以往的企業(yè)信用評(píng)級(jí)多基于企業(yè)財(cái)務(wù)信息。隨著電力賬戶和碳賬戶數(shù)據(jù)的融合,有了更高頻度和更多模態(tài)數(shù)據(jù)來(lái)源,如每15分鐘更新一次企業(yè)電力負(fù)荷數(shù)據(jù)等。我們團(tuán)隊(duì)和國(guó)網(wǎng)湖北經(jīng)研院及銀行合作,將企業(yè)電碳賬戶和綠色金融深度融合,利用時(shí)間序列大模型,創(chuàng)新“多模態(tài)數(shù)據(jù)對(duì)齊表征技術(shù)”,對(duì)企業(yè)未來(lái)的用電負(fù)荷進(jìn)行有效預(yù)測(cè),針對(duì)細(xì)分行業(yè)和企業(yè)成長(zhǎng)階段性特點(diǎn)制定差異化的企業(yè)電碳信用體系和評(píng)價(jià)規(guī)范,推動(dòng)企業(yè)電碳賬戶數(shù)據(jù)和評(píng)價(jià)結(jié)果與金融機(jī)構(gòu)實(shí)現(xiàn)信息互通、結(jié)果互認(rèn)。 套期保值是通過(guò)金融衍生品工具,如期貨期權(quán),來(lái)減少企業(yè)面臨采購(gòu)和價(jià)格風(fēng)險(xiǎn)的有效手段。過(guò)去,衍生品數(shù)量的決策往往依賴書(shū)本上的公式。為了使套期保值決策能動(dòng)態(tài)反映市場(chǎng)環(huán)境和之前決策的損益情況,我們開(kāi)發(fā)出套期保值智能體,使其具備動(dòng)態(tài)反思和自適應(yīng)調(diào)整能力,可以自動(dòng)化完成企業(yè)套期保值決策生成。 AI還可以服務(wù)于金融安全監(jiān)管。以反洗錢(qián)為例,大模型技術(shù)具有逐步推理和強(qiáng)化學(xué)習(xí)的決策能力,可針對(duì)不同的個(gè)體行為分析其可能參與洗錢(qián)的主要原因和最適合的處置措施。我們團(tuán)隊(duì)和四川省大數(shù)據(jù)中心合作,創(chuàng)新提出“基于激活函數(shù)的大模型動(dòng)態(tài)強(qiáng)化學(xué)習(xí)”技術(shù),在四川、山東等多地落地,為相關(guān)部門(mén)提供了多起P2P、電詐等重大風(fēng)險(xiǎn)事件預(yù)警。 編輯:金文婕 審核:燕青 版權(quán)聲明:如有侵權(quán) 請(qǐng)聯(lián)系刪除 |
