PKU-DAIR實(shí)驗(yàn)室新手科研入門指南Repo重磅上線!
北京大學(xué)數(shù)據(jù)與智能實(shí)驗(yàn)室(Data And Intelligence Research Lab at Peking Univeristy,PKU-DAIR )致力于數(shù)據(jù)庫(kù)系統(tǒng)、大數(shù)據(jù)管理與分析以及人工智能等領(lǐng)域的前沿研究。團(tuán)隊(duì)長(zhǎng)期在理論和技術(shù)創(chuàng)新上不斷探索,已在國(guó)際頂級(jí)學(xué)術(shù)會(huì)議或期刊發(fā)表論文200余篇,并推出多個(gè)開(kāi)源項(xiàng)目,與多家知名企業(yè)開(kāi)展了卓有成效的合作。
為幫助新手快速熟悉和進(jìn)入相關(guān)科研領(lǐng)域,PKU-DAIR 實(shí)驗(yàn)室特別推出了新手入門指南Repo。本倉(cāng)庫(kù)基于課題組的科研積累,提供全面的入門論文、開(kāi)源文檔和技術(shù)指南等分享,旨在幫助初學(xué)者快速熟悉數(shù)據(jù)管理(Data Management, DM) 和 人工智能 (Artificial Intelligence, AI) 等前沿領(lǐng)域,具體包括AI系統(tǒng)、DB+AI、自動(dòng)化機(jī)器學(xué)習(xí)、AI Agent等方向,搭建堅(jiān)實(shí)的技術(shù)基礎(chǔ)。無(wú)論你是剛?cè)腴T的小白,還是希望加深理解的探索者,這里的資源將為你的學(xué)習(xí)與研究之旅提供有力支持。
資源亮點(diǎn):
Repo Github鏈接:https://github.com/PKU-DAIR/Starter-Guide
- 科研入門指南
從基礎(chǔ)到進(jìn)階,掌握高效閱讀論文的技巧,以及如何做好研究的相關(guān)知識(shí),幫助你更快融入學(xué)術(shù)環(huán)境,獨(dú)立開(kāi)展研究。具體包含以內(nèi)容:
- "Crafting Your Research Future", Charles X. Ling and Qiang Yang
- "The Most Common Habits from English papers written by Chinese students", Felicia Brittman
- Advice on how to succeed in graduate school", Marie desJardins
- "Letter to research students" , Duane Bailey
- "Efficient Reading of Papers in Science and Technology", Michael J. Hanson
- "The Task of the Referee", A. J. Smith
- "How to do Research At the MIT AI Lab", MIT AI Lab
- 科研入門指南--如何做好科研, 如何寫好論文?
- 如何讀好學(xué)術(shù)論文?
- 研究方向一覽
- AI系統(tǒng)方向:涵蓋人工智能的基礎(chǔ)知識(shí)、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)系統(tǒng)框架,以及分布式訓(xùn)練和推理服務(wù)等關(guān)鍵技術(shù)。具體包含以下子方向:
- AI基礎(chǔ)入門
- ML/DL系統(tǒng)框架
- 分布式訓(xùn)練
- LLM推理服務(wù)
- Diffusion(文生圖、文生視頻)推理服務(wù)
2. AutoML方向 :專注于自動(dòng)化機(jī)器學(xué)習(xí),涉及超參數(shù)優(yōu)化、網(wǎng)絡(luò)結(jié)構(gòu)搜索和模型壓縮等主題,提升機(jī)器學(xué)習(xí)的效率。具體包含以下子方向:
- AutoML與超參數(shù)優(yōu)化
- 網(wǎng)絡(luò)結(jié)構(gòu)搜索(NAS)
- 模型壓縮
- 大語(yǔ)言模型與AutoML
3. Database方向 :探索數(shù)據(jù)庫(kù)系統(tǒng)的基礎(chǔ)及其與人工智能的融合,包括經(jīng)典數(shù)據(jù)庫(kù)、AI4DB和向量數(shù)據(jù)庫(kù)等內(nèi)容。具體包含以下子方向:
- Classical Database System
- AI4DB
- Vector database
4. AI Agent方向 :研究智能代理的規(guī)劃、感知和執(zhí)行等能力,幫助構(gòu)建更智能的系統(tǒng)。具體包含以下子方向:
- 綜述
- Agent規(guī)劃
- 數(shù)據(jù)獲取與感知
- 執(zhí)行與工具使用
- Agent Benchmark
5. Data-Centric ML方向:關(guān)注數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法,包括ML、LLM的基礎(chǔ)知識(shí)、算法和針對(duì)特定領(lǐng)域的應(yīng)用。具體包含以下子方向:
- Data Centric ML Basic
- LLM and VLM Basic
- Data Centric LLM and VLM Algorithms
- Data Centric LLM and VLM Systems
- Data-Centric Domain-Specific LLMs
6. 擴(kuò)散模型方向:介紹擴(kuò)散模型的基本原理和應(yīng)用,包括圖像和視頻生成、3D/4D生成技術(shù)。具體包含以下子方向:
- 擴(kuò)散模型基礎(chǔ)
- 擴(kuò)散模型加速
- 文生圖/視頻
- 3D/4D生成
7. AI for Science方向:結(jié)合人工智能與科學(xué)研究,涵蓋蛋白質(zhì)建模、小分子建模和生物數(shù)據(jù)分析等重要領(lǐng)域。具體包含以下子方向:
- 綜述
- 蛋白質(zhì)建模
- 小分子建模
- DNA/RNA/Cell
8. Graph方向 :研究圖神經(jīng)網(wǎng)絡(luò)及其在數(shù)據(jù)中心學(xué)習(xí)和圖學(xué)習(xí)中的應(yīng)用,推動(dòng)圖數(shù)據(jù)處理的發(fā)展。具體包含以下子方向:
- GNN基礎(chǔ)
- 異構(gòu)圖GNN
- 以數(shù)據(jù)為中心的圖學(xué)習(xí)
- GNN加速
- GNN與LLM結(jié)合
我們希望通過(guò)這些豐富的資源,幫助有志科研的同學(xué)盡快找到自己的方向和興趣,在科研道路上更順利地前行。
歡迎大家積極關(guān)注我們的Repo,提出寶貴的意見(jiàn)和issue,也歡迎加入我們課題組共同進(jìn)行探索和創(chuàng)新,在科研的旅途中不斷成長(zhǎng)!期待在知識(shí)的海洋中與你相遇,共同迎接未來(lái)的挑戰(zhàn)與機(jī)遇!
實(shí)驗(yàn)室簡(jiǎn)介
北京大學(xué)數(shù)據(jù)與智能實(shí)驗(yàn)室(Data And Intelligence Research Lab at Peking Univeristy,PKU-DAIR實(shí)驗(yàn)室)由北京大學(xué)計(jì)算機(jī)學(xué)院崔斌教授領(lǐng)導(dǎo),長(zhǎng)期從事數(shù)據(jù)庫(kù)系統(tǒng)、大數(shù)據(jù)管理與分析、人工智能等領(lǐng)域的前沿研究,在理論和技術(shù)創(chuàng)新以及系統(tǒng)研發(fā)上取得多項(xiàng)成果,已在國(guó)際頂級(jí)學(xué)術(shù)會(huì)議和期刊發(fā)表學(xué)術(shù)論文100余篇,發(fā)布多個(gè)開(kāi)源項(xiàng)目。課題組同學(xué)曾數(shù)十次獲得包括CCF優(yōu)博、ACM中國(guó)優(yōu)博、北大優(yōu)博、微軟學(xué)者、蘋果獎(jiǎng)學(xué)金、谷歌獎(jiǎng)學(xué)金等榮譽(yù)。PKU-DAIR實(shí)驗(yàn)室持續(xù)與工業(yè)界展開(kāi)卓有成效的合作,與騰訊、阿里巴巴、蘋果、微軟、百度、快手、中興通訊等多家知名企業(yè)開(kāi)展項(xiàng)目合作和前沿探索,解決實(shí)際問(wèn)題,進(jìn)行科研成果的轉(zhuǎn)化落地。
評(píng)論 0