職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
崗位職責
1. 負責設計、開發(fā)和維護高效、穩(wěn)定的爬蟲系統(tǒng),滿足公司各類數據采集需求,涵蓋市場數據、行業(yè)動態(tài)、競品信息等;
2. 綜合運用Python、Java、Node.js等編程語言進行爬蟲程序開發(fā),根據不同網站的結構和反爬策略,選擇合適的技術方案,確保代碼具備良好的質量、性能和可擴展性;
3. 深入分析網頁結構,熟練運用HTML、CSS、JavaScript知識,精準解析和提取目標數據,處理復雜的動態(tài)網頁內容,如AJAX加載、JavaScript渲染數據等;
4. 與數據分析師、算法工程師等團隊緊密協(xié)作,理解數據需求,提供精準、完整的數據抓取解決方案,保障數據的準確性和及時性,為公司的業(yè)務決策和算法訓練提供有力支持;
5. 實時監(jiān)控爬蟲運行狀態(tài),及時發(fā)現并解決性能瓶頸、數據丟失、反爬限制等問題,通過優(yōu)化代碼、調整抓取策略等方式,持續(xù)提升爬蟲的抓取效率和穩(wěn)定性;
6. 研究并應對各類反爬機制,如IP封鎖、驗證碼識別、用戶行為檢測等,運用代理池、驗證碼識別技術、模擬用戶行為等手段,實現有效的反反爬策略,確保爬蟲能夠穩(wěn)定運行;
7. 定期維護和更新現有爬蟲系統(tǒng),根據網站結構變化和業(yè)務需求調整,及時優(yōu)化抓取邏輯,保證數據的持續(xù)獲取和有效性;
8. 編寫詳細、規(guī)范的技術文檔,記錄爬蟲系統(tǒng)的設計架構、開發(fā)流程、關鍵代碼邏輯以及維護要點,方便團隊成員進行技術交流和后續(xù)維護。
任職要求
1、計算機科學、軟件工程、數學等相關專業(yè)本科及以上學歷;
2、4年以上爬蟲開發(fā)工作經驗,具備多個完整爬蟲項目的開發(fā)和維護經驗;
3、有過處理反爬策略的成功案例,如繞過驗證碼、突破IP封鎖等,能夠分享有效的反反爬經驗和技術手段;
4、熟練掌握Python、Java、Node.js中至少兩種編程語言;精通HTML、CSS、JavaScript;熟悉HTTP/HTTPS協(xié)議;擁有數據庫使用經驗,熟練掌握SQL(如MySQL、Oracle)和NoSQL(如MongoDB、Redis)數據庫的基本操作,能夠設計合理的數據存儲結構;熟悉分布式爬蟲技術,如Scrapy - Redis等框架,能夠構建大規(guī)模、高性能的分布式爬蟲系統(tǒng),提升數據采集效率;
5、具備較強的問題分析和解決能力,能夠快速定位和解決爬蟲開發(fā)過程中遇到的各種技術難題,如數據抓取異常、性能優(yōu)化等,善于通過調試工具和技術手段進行問題排查;
6、對新技術保持敏銳的學習熱情和好奇心,能夠快速掌握并應用新的爬蟲技術和工具,適應不斷變化的技術環(huán)境和業(yè)務需求。
工作地點
地址:南昌南昌縣南昌-高新區(qū)江西濟民可信集團有限公司(總部)
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務必提高警惕。
職位發(fā)布者
HR
江西濟民可信集團有限公司
-
制藥·生物工程
-
1000人以上
-
私營·民營企業(yè)
-
高新開發(fā)區(qū)高新七路888號

應屆畢業(yè)生
本科
2026-01-29 04:23:33
2510人關注
注:聯系我時,請說是在江蘇人才網上看到的。
