崗位職責(zé)
1、負(fù)責(zé)部門內(nèi)相關(guān)模型算法研發(fā)工作【含:新模型算法引入/改造、模型算法移植/適配到新硬件設(shè)備、模型算法適配相關(guān)項(xiàng)目邏輯】;推動(dòng)模型算法工程化落地,完成模型推理優(yōu)化、服務(wù)化部署(API 接口開發(fā))及與業(yè)務(wù)系統(tǒng)集成,解決部署過程中的延遲、吞吐量等核心問題;
2、負(fù)責(zé)部門模型算法基礎(chǔ)框架維護(hù)和開發(fā)工作;搭建模型全生命周期監(jiān)控體系,跟蹤數(shù)據(jù)分布漂移、模型效果衰減等情況,制定迭代優(yōu)化策略,保障模型長(zhǎng)期穩(wěn)定運(yùn)行
3、負(fù)責(zé)解決現(xiàn)有項(xiàng)目模型/算法相關(guān)問題;協(xié)同產(chǎn)品、數(shù)據(jù)、工程團(tuán)隊(duì)拆解業(yè)務(wù)需求,輸出標(biāo)準(zhǔn)化技術(shù)文檔,推動(dòng)跨部門項(xiàng)目高效推進(jìn)
任職要求
1、3 年以上機(jī)器學(xué)習(xí) / 深度學(xué)習(xí)研發(fā)經(jīng)驗(yàn),至少 1-2 年通用行業(yè)小模型(工業(yè)行業(yè) 優(yōu)先)全流程開發(fā)落地經(jīng)驗(yàn),主導(dǎo)過至少 1 個(gè)小模型項(xiàng)目從 0 到 1 上線
2、精通 Python,掌握 C++ 者優(yōu)先,熟練使用 PyTorch/TensorFlow 深度學(xué)習(xí)框架及 Hugging Face Transformers、LangChain 等工具鏈;?
3、具備 CUDA 編程、并行計(jì)算調(diào)優(yōu)能力,熟悉 DeepSpeed 等訓(xùn)練框架,了解 vLLM、TensorRT、ONNX 等推理優(yōu)化工具;?
掌握 Docker、K8s 容器化技術(shù),具備模型服務(wù)化部署(Flask/FastAPI)及與業(yè)務(wù)系統(tǒng)集成經(jīng)驗(yàn);
注:帶領(lǐng)過算法小團(tuán)隊(duì)完成技術(shù)攻堅(jiān)的優(yōu)先錄用;有大模型研發(fā)經(jīng)驗(yàn)的優(yōu)先錄用;
更新于 2026-01-28
查看更多崗位職責(zé)