工作地點(diǎn):海淀區(qū) | |
招聘人數(shù):1 人 | |
工作地點(diǎn):海淀區(qū) | |
招聘人數(shù):1 人 | |
崗位職責(zé):1.開源大模型框架部署及微調(diào);2.大模型技術(shù)團(tuán)隊(duì)的規(guī)劃及培訓(xùn);3..能夠交付大模型的課程技能要求:1.重點(diǎn)本科及以上學(xué)歷。2.熟練掌握一種或多種主流深度學(xué)習(xí)框架,如 TensorFlow、PyTorch 等。3.深入理解 Transformer、BERT、GPT、Llama 等語言模型的結(jié)構(gòu)和原理,熟悉大模型的訓(xùn)練機(jī)制,如預(yù)訓(xùn)練、微調(diào)訓(xùn)練等。4.熟練掌握 Python、Java等編程語言中的一種或多種。5.了解自然語言處理的基本概念、原理和方法,熟悉常見的 NLP 任務(wù)和算法,如文本分類、情感分析、機(jī)器翻譯、命名實(shí)體識別等。6.掌握機(jī)器學(xué)習(xí)的基本算法和原理,能夠根據(jù)實(shí)際問題選擇合適的算法進(jìn)行模型訓(xùn)練和優(yōu)化。7.熟悉視覺、語言等多模態(tài)數(shù)據(jù)的處理和融合方法,了解相關(guān)的模型和技術(shù)。8.大模型應(yīng)用開發(fā)經(jīng)驗(yàn)優(yōu)先。9.模型訓(xùn)練與調(diào)優(yōu)經(jīng)驗(yàn),熟悉分布式訓(xùn)練框架,如 DeepSpeed、Megatron 等,具備在大規(guī)模數(shù)據(jù)集上進(jìn)行模型訓(xùn)練的能力,有 LLM中的預(yù)訓(xùn)練、SFT、RLHF等相關(guān)訓(xùn)練經(jīng)驗(yàn)者優(yōu)先。
學(xué)歷要求:本科 | 工作經(jīng)驗(yàn):1年以下 |
年齡要求:不限 | 性別要求:不限 |
語言要求:普通話 |
公司性質(zhì):其它 | 公司規(guī)模:100-499人 |
所屬行業(yè):教育/培訓(xùn),技術(shù)培訓(xùn) |
東方瑞通1998年創(chuàng)辦于北大燕園,是國內(nèi)最早的IT高級技術(shù)培訓(xùn)企業(yè)之一??偛吭O(shè)在北京,并在上海、廣州、天津、武漢、濟(jì)南、青島、深圳、西安設(shè)有分公司。公司網(wǎng)站:
教育/培訓(xùn),技術(shù)培訓(xùn)
100-499人
其它
北京市海淀區(qū)中關(guān)村大街18號B座12層1230、1232、1236室