中高級數(shù)據(jù)挖掘工程師
1.3-2.3萬元/月發(fā)布時間: 2025-07-05 11:32
數(shù)據(jù)挖掘
1.3-2.3萬元/月工作職責(zé):
致力于解決科學(xué)領(lǐng)域大模型訓(xùn)練數(shù)據(jù)瓶頸的過程中,參與或主導(dǎo)語料合成、挖掘、評測等方面的算法開發(fā)。直接推動科學(xué)領(lǐng)域大模型的精確訓(xùn)練,為各類科學(xué)領(lǐng)域模型的優(yōu)化和應(yīng)用提供堅實的數(shù)據(jù)支撐。
1.語料數(shù)據(jù)的挖掘與評估,構(gòu)建智能篩選與評估系統(tǒng),基于語義相關(guān)性與內(nèi)容質(zhì)量,提升數(shù)據(jù)的精準(zhǔn)性與專業(yè)性。
2.智能問答生成、構(gòu)建覆蓋不同場景的高質(zhì)量評測數(shù)據(jù)集與度量指標(biāo)。
3.數(shù)據(jù)治理與風(fēng)險控制,構(gòu)建數(shù)據(jù)治理體系,涵蓋元數(shù)據(jù)管理、數(shù)據(jù)標(biāo)準(zhǔn)制定、安全合規(guī)。識別數(shù)據(jù)使用風(fēng)險,制定應(yīng)對預(yù)案。
4.跨團隊協(xié)作與規(guī)范制定,協(xié)同數(shù)據(jù)開發(fā)、業(yè)務(wù)分析團隊,確保數(shù)據(jù)需求與質(zhì)量目標(biāo)對齊。
任職要求:
1.計算機科學(xué)、人工智能、軟件工程等相關(guān)專業(yè),本科及以上學(xué)歷;
2.熟悉知識圖譜構(gòu)建、問答生成與信息檢索等相關(guān)技術(shù),有深度學(xué)習(xí)或相關(guān)領(lǐng)域2年以上工作經(jīng)驗;
3.精通Python及相關(guān)數(shù)據(jù)處理、算法實現(xiàn)框架(如TensorFlow、PyTorch等)
4.熟練掌握SQL/NoSQL數(shù)據(jù)庫(MySQL/Clickhouse/Redis/ElasticSearch等)及分布式存儲技術(shù);
5.較強的學(xué)習(xí)能力和創(chuàng)新能力,良好的團隊合作精神,能在快速變化的技術(shù)環(huán)境中不斷提升自己的專業(yè)水平
6.有垂直領(lǐng)域大模型預(yù)訓(xùn)練、SFT及性能評估與改進的優(yōu)先

杭州余杭區(qū)之江實驗室新園區(qū)(西南門)
