SCHOLAT團隊大模型研究成果在《計算機應用》2025年第3期“大模型前沿研究與典型應用”專題刊出
https://www.joca.cn/CN/subject/listSubjectChapters.do?subjectId=1742365411707
引用本文:
袁成哲, 陳國華, 李丁丁, 朱源, 林榮華, 鐘昊, 湯庸. ScholatGPT:面向學術社交網絡的大語言模型及智能應用[J]. 計算機應用, 2025, 45(3): 755-764.
Chengzhe YUAN, Guohua CHEN, Dingding LI, Yuan ZHU, Ronghua LIN, Hao ZHONG, Yong TANG. ScholatGPT: a large language model for academic social networks and its intelligent applications[J]. Journal of Computer Applications, 2025, 45(3): 755-764.
論文鏈接:https://www.joca.cn/CN/10.11772/j.issn.1001-9081.2024101477
附:“大模型前沿研究與典型應用”專題編者按:
“大模型”(大規模預訓練模型)自面世以來,其技術發展日新月異。大模型是引領人工智能領域的變革式新范式,能夠提供強大的知識表示與聚合能力,已展現出可與人腦媲美的視覺感知與邏輯推理能力。在超大參數規模、海量訓練數據和強大計算資源支撐下,大規模基礎模型(CLIP、SAM、GPT-4、Sora、LLaMA等)已成為一系列下游任務的基石,展示出強大的任務性能與卓越的泛化能力,在自然語言處理、計算機視覺、工業數字化和智能化等多個領域有著重要突破和廣泛應用,其技術影響力已超越計算機領域,成為多學科交叉創新的關鍵驅動力。
鑒于大模型技術對計算機應用領域的巨大影響,《計算機應用》組織編委及其研究團隊撰寫并向社會廣泛征集相關論文,最后從中遴選20篇從多個角度全面介紹大模型的前沿研究現狀和典型應用場景。
在這些文章中,有關于語言大模型在自然語言理解、知識圖譜構建、知識問答系統、個性化學習系統等方面的典型應用,也有用于圖像處理和分析的視覺大模型應用實例,還有多模態大模型的使用探索。既有關于預訓練、數據增強、參數微調、提示學習等大模型核心技術的研究和討論,也有將大模型成果用于各行各業及各種應用場景的介紹,特別是還有對大模型帶來的偏見和幻覺等問題的分析和對策。
我刊編委——四川大學呂建成教授,中國科學技術大學劉淇教授、陳恩紅教授,哈爾濱工業大學(深圳)陳斌教授,華南師范大學湯庸教授,中山大學操小春教授及其團隊對大模型在自然語言理解、目標檢測、智能教學和社交網絡等方面應用的技術路線及解決方案進行了較為具體和全面的介紹。另外,特別邀請了中國科學院大學秦小林教授撰寫綜述文章,“介紹大模型的基礎架構、訓練技術及發展歷程,分析當前通用大模型關鍵技術及以大模型為底座的先進融合技術,進一步闡述了大模型在實際應用中面臨的挑戰,包括數據偏差、模型幻覺、計算資源消耗等問題,并對大模型的未來進行了展望”。
《計算機應用》特別策劃的“大模型前沿研究與典型應用”專題,聚焦大模型研究的最新進展、技術創新及典型應用,旨在促進學術界、工業界與跨學科領域之間的知識分享與合作。
該專題作者單位中既有中國科學院計算技術研究所、中國科學院成都計算機應用研究所、人工智能國家重點實驗室、哈爾濱工業大學(深圳)國際人工智能研究院、人工智能與數字經濟廣東省實驗室、安徽省人工智能實驗室、大數據智能分析與行業應用湖北省重點實驗室等從事“大模型”方面研究和應用的科研院所,也有中國科學技術大學、四川大學、中山大學、華南師范大學、北京航空航天大學、東北大學、河海大學、山西大學、蘇州大學、北京外國語大學、海軍工程大學、湖北大學、貴州大學等從事“大模型”方面研究和應用的高等院校,還有“大模型”的研制和應用企業如科大訊飛人工智能研究院、國網信息通信產業集團、國網電力科學研究院、國能運輸技術研究院。作者及其團隊在人工智能特別是大模型研究領域具有較高造詣,來自全國各地的權威研究機構,地域分布也具有廣泛的代表性,相信他們在大模型方面的研究成果對相關領域研究和應用的從業者有較大參考價值。
雖然由于組織時間倉促及編輯水平有限,該專題的內容對正處于迅猛發展過程和廣泛應用范圍中的大模型的介紹難免“管中窺豹”,但希望能“拋磚引玉”,提高大家對該項重要技術的重視程度,加強該方面成果的傳播,促進大模型的技術創新和應用落地。