最近,智能算法研究中心黃翰教授受邀作了多場關于AI大模型賦能的報告或培訓,特別是在大學教育領域的應用。然而,他發現很多單位并沒有部署類似DeepSeek這樣的大模型,他們更多是想了解如何利用通用大模型來提升工作效率。因此,黃老師結合自己的研究和實踐經驗,分享了他的看法,希望能為各單位提供一些有價值的參考。接下來,就讓我們一起看看黃教授怎么說吧:
1、通用大模型的局限性
首先,我必須潑一盆冷水:目前的通用大模型在實際工作中并沒有帶來顯著的賦能效果。它們更多是提供了一種AI體驗,比如通過智能問答獲取知識,這些內容在以前往往需要通過大量閱讀或深度檢索和整理才能獲取;又比如通過大模型實現作詩、寫作、聊天等娛樂性功能。無論是AI體驗還是娛樂功能,其實通用大模型并沒有在工作中實現真正的賦能。
為什么通用大模型難以賦能工作?一方面,它的數據質量堪憂。通用大模型使用的數據大多是非標注數據,這些數據未經人工標記、分類或注釋,其可靠性和可信度往往難以保證。另一方面,它的推理邏輯不穩定。通用大模型在推理時帶有隨機性,缺乏嚴格的業務邏輯。盡管它學習了大量數據中的邏輯,但這些邏輯更多是形式上的,而非深層次的語義或任務邏輯。因此,很多時候,它的結果要么是錯的,要么邏輯上講不通。更糟糕的是,大模型有時會編造不存在的事實。比如,我最近在查資料時發現,有些參考文獻是大模型編造出來的,甚至包含論文題目、摘要、卷號、頁碼等信息。這些關鍵信息本應是客觀的,但大模型卻將其視為符號輸出,隨意編造。這不僅會誤導研究方向,還可能引發信任危機。
基于以上局限性,通用大模型在較復雜工作場景或要求數據真實性的場景中很難實現實質性的工作賦能。有人可能會問:未來改進后是否能解決這個問題?答案是,雖然未來的技術進步可能會帶來一些改善,但目前來看,問題的核心在于通用大模型學習的內容過于龐雜。我們可以這樣理解:通用大模型所學習的數據就像大江大海,各種各樣的信息匯聚在一起。在這種情況下,想要精準提取你需要的資源,或者找到適合生長的生態,幾乎是不可能的。
2、從通用到垂直:大模型賦能的新方向
既然通用大模型在實際工作中存在諸多局限性,那我們該如何更好地利用大模型呢?從國家戰略以及當前市場趨勢來看,目前的方向是從通用大模型向垂直大模型過渡。
在通用和垂直大模型之間,我們還經歷了行業大模型階段。行業大模型在通用大模型的基礎上加入行業數據和專家經驗進行訓練,更聚焦于某一領域。例如云南白藥攜手華為云共同打造了“雷公大模型”, 旨在構建普惠的中醫藥知識服務平臺和專業的中藥材產業服務平臺。
垂直大模型則更進一步,通常使用任務相關數據進行預訓練或微調,以提高在某一任務上的性能和效果。例如谷歌開發的醫療大語言模型MedPaLM,專為醫學問答、疾病診斷和醫學文獻分析等任務設計,能夠通過理解醫學文本提供專業的建議和參考。
3、構建私域大模型:方法與實踐
如果你有不便公開的數據,或者不愿意與外界共享,可以考慮構建私域大模型。那么,如何構建私域大模型呢?是否可以使用通用大模型的底座,結合自己的數據進行訓練呢?比如,用DeepSeek滿血版在本地進行訓練?答案是不太可行。通用大模型的底座過于龐大,就像一個巨大的湖泊,你用自己的少量數據或者某些業務邏輯的資料去做訓練或微調,就好比在湖里放茶葉,根本沖不出茶的味道。
要構建一個真正能賦能工作的私域大模型,首先應該找一個精簡的底座,這個底座需具備基本的人機交互、推理邏輯和語義理解功能。然后,用你所在領域的知識庫進行預訓練,再依據業務邏輯進行微調。此外,甚至可以通過強化學習來鞏固學習效果。只有這樣構建出的私域大模型,才能真正賦能我們的工作。
4、總結
如果現在問我大模型賦能各行各業的問題,我首先會問你所講的大模型是指什么?如果你指的是通用大模型,很遺憾,目前它還難以達到顯著的賦能效果。但如果你有自己的垂直大模型或本地部署的大模型,我可以告訴你如何構建私域大模型。當然,你也可以選擇有成功案例和豐富經驗的團隊來幫助你完成這一過程,從而避免在試錯過程中產生不必要的損失。
在我看來,私域大模型將會成為垂直大模型元年中的一個重要“爆品”。希望以上分享能為大家帶來更多啟發和建議,感謝大家的關注!