工作職責】1、負責多模態(tài)大模型數(shù)據(jù)語料(文本、圖像、視頻、語音等)生產和處理,包括但不限于數(shù)據(jù)分布研究、數(shù)據(jù)獲取、數(shù)據(jù)規(guī)范化、數(shù)據(jù)質量檢測、打標等,確保訓練數(shù)據(jù)的有效性,可用性;2、負責優(yōu)化和改進現(xiàn)有的數(shù)據(jù)清洗和質檢打標流程,提高效率和準確性;3、負責大模型相關數(shù)據(jù)工具鏈的開發(fā)實現(xiàn)及應用維護等;【崗位要求】1、本科及以上學歷,計算機相關專業(yè)或數(shù)學專業(yè),2年以上開發(fā)經驗;2、扎實的編程基礎,精通PYTHON,熟悉一種或多種深度學習框架(Pytorch/TensorFlow)作為加分項;3、熟悉 Linux 常用命令,掌握在 Linux 下搭建環(huán)境及開發(fā)部署測試,熟悉docker鏡像操作和部署;4、在大模型、算法、數(shù)據(jù)挖掘、語音、圖像處理等一個或多個領域有扎實的理論基礎和豐富的實戰(zhàn)經驗優(yōu)先;一、Python 開發(fā)(算法方向) 1、統(tǒng)本學歷,2年以上Python語言開發(fā)經驗 2、有圖像處理、音頻處理、視頻處理、Pytorch、大模型、模型部署、AI算法中的任意一種經驗即可; 3、有扎實的編程基礎,熟悉Linux環(huán)境,熟悉Linux常用命令