大模型算法工程師
5-7.5萬元/月該職位于3日內(nèi)新發(fā)布
大模型算法
5-7.5萬元/月崗位方向:
1、軟硬件結(jié)合的推理性能優(yōu)化(推理引擎+融合算子+國產(chǎn)GPU)
2、大模型訓推并行計算優(yōu)化(EP、PP、TP、DP等)
職位描述:
1)負責大模型訓練和推理過程的性能優(yōu)化,通過量化、蒸餾、剪枝、軟硬件(TPU、GPU)、并行計算設(shè)計等方式提升性能,節(jié)省成本。
2)設(shè)計和開發(fā)深度學習模型,專注于卷積神經(jīng)網(wǎng)絡(CNN)、循環(huán)神經(jīng)網(wǎng)絡(RNN)、Transformer等架構(gòu),使用TensorFlow、PyTorch等框架進行大語言模型和多模態(tài)模型開發(fā)、訓練和調(diào)優(yōu),提升訓練和推理效率。
3)結(jié)合深度學習技術(shù)及大語言模型、多模態(tài)技術(shù),設(shè)計和優(yōu)化AI應用效果和效率。
崗位要求:
1)碩士及以上學歷,計算機科學、人工智能相關(guān)專業(yè)。
2)熟悉主流ML框架(TensorFlow、Keras、PyTorch、scikit-learn等),深入理解深度學習原理,精通深度學習框架(TensorFlow、PyTorch),有一定的NLP、CV或強化學習領(lǐng)域的實踐經(jīng)驗。熟悉分布式訓練技術(shù),如DeepSpeed、Megatron、TensorFlowDistributed、PyTorchDistributed。精通AI推理引擎(vLLM、LM-Deploy、TensorRT-LLM、TensorFlowServing、TorchServe、ONNXRuntime等)。
3)熟悉模型優(yōu)化技巧,能夠在多種硬件平臺(CPU、GPU、TPU等)上調(diào)優(yōu)模型。熟悉生成模型(如GPT、LLaMA、Qwen)和強化學習,有實際的生成模型微調(diào)經(jīng)驗,對多模態(tài)模型在訓練和推理過程中的資源優(yōu)化有深入理解,確保多模態(tài)模型在業(yè)務場景中的高效應用。
4)熟悉常用的多模態(tài)模型(如CLIP、Blip等)的原理和應用,能夠在文本、圖像、音頻等多種數(shù)據(jù)源之間進行融合和生成。具備多模態(tài)數(shù)據(jù)的處理和特征提取能力,能夠根據(jù)業(yè)務需求進行數(shù)據(jù)預處理、嵌入和模型微調(diào)。熟悉向量檢索技術(shù),能夠支持跨模態(tài)的內(nèi)容檢索和匹配,為多模態(tài)AI應用提供技術(shù)支持。
加分項:
1)熟悉推理加速技術(shù)(vLLM、TensorRT、OpenVINO、CUDA)。
2)熟悉Docker、Kubernetes等容器技術(shù)者優(yōu)先。

深圳南山區(qū)南山區(qū)科技園
