職位描述
該職位已進行加V認證,請放心投遞
職位描述:
1. 主導大模型系統(tǒng)架構設計:
負責RAG系統(tǒng)的整體架構設計,包括存儲層、檢索層、推理層與緩存層的技術選型與實現(xiàn)。
構建高可用、低延遲的分布式推理服務框架,支持向量數(shù)據(jù)庫集成(如Milvus、Elastic)、知識庫管理與多模態(tài)檢索優(yōu)化。
設計并實現(xiàn)Agent工作流編排框架,支持工具調(diào)用(MCP協(xié)議)、任務規(guī)劃與自動化執(zhí)行。
2.模型部署與性能優(yōu)化:
負責大模型(LLM/VLM)的本地化部署、量化壓縮、動態(tài)批處理與推理加速,優(yōu)化GPU/CPU異構算力利用率。
3. AI服務平臺開發(fā):
基于Java/Go/Python構建高并發(fā)、可擴展的AI微服務,與現(xiàn)有業(yè)務系統(tǒng)深度集成,實現(xiàn)模型訓練-部署-監(jiān)控的全鏈路管理。
4.技術領導與跨團隊協(xié)作:
指導中級工程師,制定技術方案,并主導技術攻關。與產(chǎn)品、算法、基礎設施團隊協(xié)作,定義需求并推動工程落地。
職位要求:
1.計算機科學、人工智能或相關領域本科及以上學歷,5年以上大型服務端開發(fā)經(jīng)驗,3年以上AI系統(tǒng)相關項目經(jīng)驗
2.有牽頭大型AI工程項目經(jīng)驗,具備一定的團隊管理或技術領導經(jīng)驗
3. 具備扎實的 Java 編程基礎,熟悉常用的 Java 開發(fā)框架,包括不限于Spring,SpringMvc、SpringBoot、Spring Cloud,有高并發(fā)分布式系統(tǒng)開發(fā)經(jīng)驗
4. 熟悉常用數(shù)據(jù)庫,包括不限于Mysql、MongoDB、ES、Redis等,熟悉常用的消息中間件
5. 熟悉python/GO開發(fā)語言,能進行一般的python/Go項目開發(fā)
6. 能夠快速理解業(yè)務需求,具備良好的溝通能力,將業(yè)務需求準確轉化為技術方案
7. 善于學習和總結,有團隊合作精神和較強執(zhí)行力,較強的問題解決能力、跨團隊溝通能力和技術規(guī)劃能力。
【加分項】
?1. 精通Transformer架構、RAG技術棧、向量數(shù)據(jù)庫優(yōu)化與多模態(tài)檢索策略者優(yōu)先。
?2. 掌握vLLM/SGLang/TensorRT-LLM推理框架中至少一種模型部署方法,掌握模型量化、算子融合、投機采樣等優(yōu)化技術者優(yōu)先。
3. 對AI技術前沿(如Agent、多模態(tài))有持續(xù)跟蹤熱情者優(yōu)先。
工作地點
地址:武漢洪山區(qū)武漢-洪山區(qū)小米武漢總部武漢小米總部
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務必提高警惕。
職位發(fā)布者
hrHR
小米科技有限責任公司
-
通信/電信/網(wǎng)絡設備/增值服務
-
1000人以上
-
私營·民營企業(yè)
-
北京市海淀區(qū)清河中街68號華潤五彩城寫字樓

應屆畢業(yè)生
本科
2026-02-08 16:34:43
3290人關注
注:聯(lián)系我時,請說是在江蘇人才網(wǎng)上看到的。
