工作職責(zé)
1.建立并優(yōu)化數(shù)據(jù)處理流程,為模型開發(fā)準(zhǔn)備所需數(shù)據(jù)。
2.將多模態(tài)大型模型的開發(fā)環(huán)境構(gòu)建為 Docker 容器和/或 Python 虛擬環(huán)境,并安裝所需的系統(tǒng)及 Python 軟件包
3.調(diào)整多模態(tài)大型模型的架構(gòu)、損失函數(shù)及訓(xùn)練策略,以滿足目標(biāo)應(yīng)用對(duì)模型的需求。
4.訓(xùn)練或微調(diào)多模態(tài)大型模型,監(jiān)控訓(xùn)練過程,并根據(jù)關(guān)鍵性能指標(biāo)調(diào)整訓(xùn)練超參數(shù)。
5.利用現(xiàn)成的模型評(píng)估工具對(duì)模型性能進(jìn)行評(píng)測,分析評(píng)估結(jié)果,并確定后續(xù)改進(jìn)方案。
6.對(duì)模型進(jìn)行剪枝和量化,在保證模型準(zhǔn)確率的前提下降低內(nèi)存占用并提升模型吞吐量。
7.使用主流模型部署工具在生產(chǎn)環(huán)境中部署模型。
崗位要求
1.擁有碩士學(xué)位及2年以上相關(guān)工作經(jīng)驗(yàn),或具有博士學(xué)位。
2.熟悉 Transformers、PyTorch、Python、Bash、Docker 及 Git 等工具。
3.具備開發(fā)大型語言模型及多模態(tài)大型語言模型(例如視覺語言模型)的實(shí)戰(zhàn)經(jīng)驗(yàn)。
4.熟悉視覺語言模型、大規(guī)模推理模型、強(qiáng)化學(xué)習(xí)及 AI 智能體的最新進(jìn)展。
5.精通提示工程,擅長設(shè)計(jì)針對(duì)大型語言模型及多模態(tài)大型模型的提示。
6.具備優(yōu)秀的問題解決能力及溝通能力。