崗位職責(zé):
1. 技術(shù)規(guī)劃與團(tuán)隊(duì)管理
a. 制定大模型預(yù)訓(xùn)練與后訓(xùn)練方向的技術(shù)路線,統(tǒng)籌團(tuán)隊(duì)研發(fā)計(jì)劃,確保技術(shù)目標(biāo)與業(yè)務(wù)需求對齊;
b. 領(lǐng)導(dǎo)團(tuán)隊(duì)完成大模型架構(gòu)設(shè)計(jì)、數(shù)據(jù)策略制定、訓(xùn)練優(yōu)化及后訓(xùn)練調(diào)優(yōu)(如微調(diào)、蒸餾、提示工程等)全流程工作;
c. 負(fù)責(zé)團(tuán)隊(duì)技術(shù)能力建設(shè),培養(yǎng)核心人才,提升團(tuán)隊(duì)在分布式訓(xùn)練、模型壓縮、多模態(tài)融合等領(lǐng)域的技術(shù)深度。
2. 跨模態(tài)技術(shù)協(xié)作
a. 與語音、視覺、自然語言處理(NLP)等技術(shù)團(tuán)隊(duì)協(xié)同,推動(dòng)大模型在多模態(tài)場景中的技術(shù)融合與創(chuàng)新;
b. 主導(dǎo)跨團(tuán)隊(duì)技術(shù)方案設(shè)計(jì),解決多模態(tài)數(shù)據(jù)對齊、聯(lián)合訓(xùn)練、模型適配等關(guān)鍵問題;
3. 技術(shù)攻堅(jiān)與效率優(yōu)化
a. 主導(dǎo)大規(guī)模預(yù)訓(xùn)練的效率優(yōu)化,包括分布式訓(xùn)練加速、顯存優(yōu)化、計(jì)算資源調(diào)度等,降低訓(xùn)練成本;
b. 研究后訓(xùn)練技術(shù)(如強(qiáng)化學(xué)習(xí)、領(lǐng)域適配、模型輕量化),提升模型在垂直場景中的性能與泛化能力;
c. 推動(dòng)模型推理性能優(yōu)化,結(jié)合硬件特性設(shè)計(jì)高效部署方案。
4. 前沿探索與行業(yè)賦能
a. 跟蹤大模型與多模態(tài)領(lǐng)域的前沿技術(shù)(如 Agent 技術(shù)、MoE 架構(gòu)、多模態(tài)對齊等),推動(dòng)創(chuàng)新技術(shù)落地;
b. 參與行業(yè)技術(shù)交流,輸出技術(shù)影響力,推動(dòng)團(tuán)隊(duì)成果在學(xué)術(shù)或工業(yè)界的應(yīng)用。
任職需求:
1.基礎(chǔ)要求
a.計(jì)算機(jī)科學(xué)、人工智能、機(jī)器學(xué)習(xí)等相關(guān)專業(yè)碩士及以上學(xué)歷,5 年以上 AI 領(lǐng)域研發(fā)經(jīng)驗(yàn),2 年以上團(tuán)隊(duì)管理經(jīng)驗(yàn);
b.精通大模型技術(shù)棧(如 Transformer、LLaMA、GPT 系列等),熟悉預(yù)訓(xùn)練與后訓(xùn)練全流程方法論;
c.熟悉多模態(tài)技術(shù)(語音、視覺、語言至少精通其一),具備跨領(lǐng)域技術(shù)整合經(jīng)驗(yàn);
d.精通 PyTorch/TensorFlow 等框架,具備大規(guī)模分布式訓(xùn)練(如 Megatron、DeepSpeed)實(shí)戰(zhàn)經(jīng)驗(yàn);
e.熟悉模型壓縮、加速技術(shù)(如量化、剪枝、知識(shí)蒸餾),有端側(cè)部署經(jīng)驗(yàn)者優(yōu)先。
2.能力要求
a.具備優(yōu)秀的技術(shù)規(guī)劃與項(xiàng)目管理能力,能高效協(xié)調(diào)跨團(tuán)隊(duì)資源;
b.對技術(shù)趨勢敏感,能快速判斷技術(shù)價(jià)值并推動(dòng)團(tuán)隊(duì)落地;
c.出色的溝通能力與團(tuán)隊(duì)領(lǐng)導(dǎo)力,能夠激發(fā)團(tuán)隊(duì)創(chuàng)新潛力。