亚洲天堂精品日韩一区-麻豆国产精品一二三区-日韩深夜福利在线观看-国产传媒视频在线免费观看

魚泡網(wǎng)首頁推薦職位搜索職位搜索公司校招意外險(xiǎn)特種作業(yè)證下載APP

登錄注冊(cè)后可以:

直接與老板/牛人聯(lián)系

更精準(zhǔn)匹配求職意向

獲取更多的求職信息

大模型推理優(yōu)化工程師

2.7-3.5萬元/月

該職位于3日內(nèi)新發(fā)布

職位詳情
微信掃碼分享
投訴

大模型算法

2.7-3.5萬元/月
經(jīng)驗(yàn)不限

崗位職責(zé)

1、配合模型應(yīng)用和模型訓(xùn)練同事,上線大模型推理服務(wù),推動(dòng)大模型相關(guān)算法的落地;

2、持續(xù)跟進(jìn)前沿技術(shù),優(yōu)化大模型推理性能,提升線上模型服務(wù)吞吐量,降低模型推理延遲,控制推理機(jī)器成本;

3、開發(fā)和優(yōu)化大模型推理系統(tǒng),提升模型推理系統(tǒng)的性能,穩(wěn)定性,可觀測(cè)性,易用性等;

4、使用GPU編程和系統(tǒng)優(yōu)化手段實(shí)現(xiàn)高性能的推理優(yōu)化算法,并將其落地于大模型推理系統(tǒng)中。

崗位要求

1、計(jì)算機(jī)科學(xué)、人工智能等相關(guān)教育背景,本科以上學(xué)歷;

2、熟悉Python,掌握常見的LLM推理加速框架,如vllm/onnx/TensorRT/TensorRT-LLM/sglang等,能夠根據(jù)業(yè)務(wù)需求優(yōu)化;

3、熟悉CPU/GPU下性能優(yōu)化基本原理和方式方法,有服務(wù)端GPU程序加速經(jīng)驗(yàn);

4、熟悉分布式推理常用加速方法,有分布式系統(tǒng)開發(fā)經(jīng)驗(yàn)或大模型分布式部署經(jīng)驗(yàn)者優(yōu)先;

5、有國產(chǎn)芯片適配經(jīng)驗(yàn)優(yōu)先;

6、具備嚴(yán)謹(jǐn)細(xì)致的工作態(tài)度,較強(qiáng)的團(tuán)隊(duì)協(xié)作能力。

郝女士實(shí)名IP:北京

北京朝陽區(qū)利星行中心H座

工商信息

法定代表人:

張貂峰

成立日期:

2014-03-19

查看全部

項(xiàng)目地點(diǎn)
北京朝陽區(qū)利星行中心H座
點(diǎn)擊查看地圖

相關(guān)推薦查看更多 >

朝陽區(qū)

搜索
請(qǐng)選擇城市
熱門城市ABCDEFGHJKLMNPQRSTWXYZ
全國