PKU-DAIR實驗室新手科研入門指南Repo重磅上線!
北京大學數據與智能實驗室(Data And Intelligence Research Lab at Peking Univeristy,PKU-DAIR )致力于數據庫系統、大數據管理與分析以及人工智能等領域的前沿研究。團隊長期在理論和技術創新上不斷探索,已在國際頂級學術會議或期刊發表論文200余篇,并推出多個開源項目,與多家知名企業開展了卓有成效的合作。
為幫助新手快速熟悉和進入相關科研領域,PKU-DAIR 實驗室特別推出了新手入門指南Repo。本倉庫基于課題組的科研積累,提供全面的入門論文、開源文檔和技術指南等分享,旨在幫助初學者快速熟悉數據管理(Data Management, DM) 和 人工智能 (Artificial Intelligence, AI) 等前沿領域,具體包括AI系統、DB+AI、自動化機器學習、AI Agent等方向,搭建堅實的技術基礎。無論你是剛入門的小白,還是希望加深理解的探索者,這里的資源將為你的學習與研究之旅提供有力支持。
資源亮點:
Repo Github鏈接:https://github.com/PKU-DAIR/Starter-Guide
- 科研入門指南
從基礎到進階,掌握高效閱讀論文的技巧,以及如何做好研究的相關知識,幫助你更快融入學術環境,獨立開展研究。具體包含以內容:
- "Crafting Your Research Future", Charles X. Ling and Qiang Yang
- "The Most Common Habits from English papers written by Chinese students", Felicia Brittman
- Advice on how to succeed in graduate school", Marie desJardins
- "Letter to research students" , Duane Bailey
- "Efficient Reading of Papers in Science and Technology", Michael J. Hanson
- "The Task of the Referee", A. J. Smith
- "How to do Research At the MIT AI Lab", MIT AI Lab
- 科研入門指南--如何做好科研, 如何寫好論文?
- 如何讀好學術論文?
- 研究方向一覽
- AI系統方向:涵蓋人工智能的基礎知識、機器學習和深度學習系統框架,以及分布式訓練和推理服務等關鍵技術。具體包含以下子方向:
- AI基礎入門
- ML/DL系統框架
- 分布式訓練
- LLM推理服務
- Diffusion(文生圖、文生視頻)推理服務
2. AutoML方向 :專注于自動化機器學習,涉及超參數優化、網絡結構搜索和模型壓縮等主題,提升機器學習的效率。具體包含以下子方向:
- AutoML與超參數優化
- 網絡結構搜索(NAS)
- 模型壓縮
- 大語言模型與AutoML
3. Database方向 :探索數據庫系統的基礎及其與人工智能的融合,包括經典數據庫、AI4DB和向量數據庫等內容。具體包含以下子方向:
- Classical Database System
- AI4DB
- Vector database
4. AI Agent方向 :研究智能代理的規劃、感知和執行等能力,幫助構建更智能的系統。具體包含以下子方向:
- 綜述
- Agent規劃
- 數據獲取與感知
- 執行與工具使用
- Agent Benchmark
5. Data-Centric ML方向:關注數據驅動的機器學習方法,包括ML、LLM的基礎知識、算法和針對特定領域的應用。具體包含以下子方向:
- Data Centric ML Basic
- LLM and VLM Basic
- Data Centric LLM and VLM Algorithms
- Data Centric LLM and VLM Systems
- Data-Centric Domain-Specific LLMs
6. 擴散模型方向:介紹擴散模型的基本原理和應用,包括圖像和視頻生成、3D/4D生成技術。具體包含以下子方向:
- 擴散模型基礎
- 擴散模型加速
- 文生圖/視頻
- 3D/4D生成
7. AI for Science方向:結合人工智能與科學研究,涵蓋蛋白質建模、小分子建模和生物數據分析等重要領域。具體包含以下子方向:
- 綜述
- 蛋白質建模
- 小分子建模
- DNA/RNA/Cell
8. Graph方向 :研究圖神經網絡及其在數據中心學習和圖學習中的應用,推動圖數據處理的發展。具體包含以下子方向:
- GNN基礎
- 異構圖GNN
- 以數據為中心的圖學習
- GNN加速
- GNN與LLM結合
我們希望通過這些豐富的資源,幫助有志科研的同學盡快找到自己的方向和興趣,在科研道路上更順利地前行。
歡迎大家積極關注我們的Repo,提出寶貴的意見和issue,也歡迎加入我們課題組共同進行探索和創新,在科研的旅途中不斷成長!期待在知識的海洋中與你相遇,共同迎接未來的挑戰與機遇!
實驗室簡介
北京大學數據與智能實驗室(Data And Intelligence Research Lab at Peking Univeristy,PKU-DAIR實驗室)由北京大學計算機學院崔斌教授領導,長期從事數據庫系統、大數據管理與分析、人工智能等領域的前沿研究,在理論和技術創新以及系統研發上取得多項成果,已在國際頂級學術會議和期刊發表學術論文100余篇,發布多個開源項目。課題組同學曾數十次獲得包括CCF優博、ACM中國優博、北大優博、微軟學者、蘋果獎學金、谷歌獎學金等榮譽。PKU-DAIR實驗室持續與工業界展開卓有成效的合作,與騰訊、阿里巴巴、蘋果、微軟、百度、快手、中興通訊等多家知名企業開展項目合作和前沿探索,解決實際問題,進行科研成果的轉化落地。
評論 0