日韩第一精品,五月天丁香亚洲,欲望之翼中文字幕电影完整版未删减百度云,沉默的冰山电影完整版在线观看,2024久久精品,俺来俺去www,黑人性hd

APP下載
機會在手,求職信息實時掌握
    Alternate Text
    APP下載
    Alternate Text
    微信公眾號
    Alternate Text
    小程序
當前位置:首頁> 列表 >職位詳情
數(shù)據(jù)采集工程師-上海
面議 應屆畢業(yè)生 學歷不限
  • 全勤獎
  • 節(jié)日福利
  • 不加班
  • 周末雙休
職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
1 項目背景
針對外文語料數(shù)據(jù)采集工作,目前已經(jīng)對預訓練數(shù)據(jù)采集、全站數(shù)據(jù)采集或者文
件文檔下載類的需求已經(jīng)開發(fā)了采集系統(tǒng)或者采集平臺進行需求覆蓋。但是由于需求種類多樣還有較多類型的采集需求(定向采集,數(shù)據(jù)字段高定,目標站點反爬比較嚴重等)數(shù)據(jù)系統(tǒng)與平臺無法進行覆蓋需求,需要鋪設較多開發(fā)人員進行單站點或者單需求進行數(shù)據(jù)采集研發(fā)工作。
2 預算與人員資質(zhì)要求
? 需求人數(shù):2人
? 期望到崗時間:2025年11月初
? 崗位級別:中級采集工程師
? 教育背景與工作經(jīng)驗
o 本科及以上學歷,計算機相關專業(yè)
o 2年以上數(shù)據(jù)采集工作經(jīng)驗
? 核心技能
o 精通 JavaScript 逆向工程
o 有主流站點 Web端大規(guī)模數(shù)據(jù)采集經(jīng)驗
o 具備多類型驗證碼處理能力:包括滑塊、點選、GooglereCAPTCHA、
旋轉驗證碼等
o 熟悉 APP 脫殼、逆向、反編譯及自動化相關技術
o 具備 AST 反混淆 JavaScript 代碼及 JSVMP 算法還原能力
? 附加技能(優(yōu)先考慮):具有風控應對經(jīng)驗(如 Akamai 并發(fā)、Cloudflare 等
反爬蟲策略處理經(jīng)驗)
3 崗位描述
3.1負責大模型相關數(shù)據(jù)采集,包括不限于海內(nèi)外文本,圖片,音視頻數(shù)據(jù);
3.2負責對目標網(wǎng)站或APP進行反爬突破、協(xié)議破解和提取關鍵數(shù)據(jù);
3.3負責反爬蟲策略研究,代理、驗證碼識別等采集支撐服務建設;
3.4 參與大規(guī)模數(shù)據(jù)處理流程的設計與開發(fā),包括但不限于數(shù)據(jù)采集、清洗、轉
換、存儲等過程。
4 服務范圍與內(nèi)容
4.1 服務目標
協(xié)助開展各類數(shù)據(jù)采集業(yè)務(包括但不限于預訓練數(shù)據(jù)采集、全站數(shù)據(jù)采
集、文件文檔下載等),針對多樣化的需求種類,特別是定向采集、高定數(shù)
據(jù)字段以及目標站點反爬嚴重等情況,提供定制化解決方案。具體包含但不
限于以下內(nèi)容:
1. 大模型相關數(shù)據(jù)采集
o 海內(nèi)外文本、圖片、音視頻等數(shù)據(jù)采集
o 保證數(shù)據(jù)多樣性及高質(zhì)量
2. 反爬蟲策略研究與實施
o 深度分析目標網(wǎng)站或APP
o 突破反爬措施(協(xié)議破解、代理使用、驗證碼識別等)
o 提供反爬支撐服務建設
3. 大規(guī)模數(shù)據(jù)處理流程設計與開發(fā)
o 數(shù)據(jù)采集、清洗、轉換、存儲的全流程實現(xiàn)
o 確保數(shù)據(jù)準確性與可用
聯(lián)系方式
注:聯(lián)系我時,請說是在江蘇人才網(wǎng)上看到的。
工作地點
地址:徐匯區(qū)上海庫帕思科技有限公司A
?? 點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務必提高警惕。
top
投遞簡歷
馬上投遞
更多優(yōu)質(zhì)崗位等你來挑選   加入本站,發(fā)現(xiàn)更好的自己
投遞簡歷
馬上投遞
提示
該職位僅支持官方網(wǎng)站投遞
關閉 去投遞
會員中心 提示:訂單支付,立即生效
天數(shù): 0
共計: 0
支付方式:
微信支付
支付寶支付
確認 取消