一、主要職責
1.為Scilit數據庫進行數據倉庫的設計、開發(fā)、維護工作,推動數據工程技術棧革新,整合MDPI公司級數倉體系,構建豐富穩(wěn)定的數據資產,推動Scilit的數據產品化;
2.協(xié)同相關方,將產品/數據分析/算法需求轉化為數據工程需求,構建數據Pipeline和ETL任務,增進相關合作方的數據使用便利;
3.建立和提高數據模型的準確性、易用性、靈活性、可擴展性,提升查詢效率,為可視化報表開發(fā)、數據分析、工程項目和算法開發(fā)等下游數據應用提供良好的數據條件;
4.承擔大規(guī)模復雜指標的快速計算和維護任務,根據業(yè)務和數據分析需求,開發(fā)、倉儲和維護分析表(寬表),優(yōu)化其查詢效率;
5.收集、清洗、整理Scilit數據,提升Scilit數據質量、數據可用性和數據效率,使得數據準確、一致、完整、有效、及時。搭建數據質量校驗、報警、自動整理機制;
6.建立數據字典,將常用維度和指標的技術口徑文檔化。
二、職位要求
1.熟練運用書面和口語英語交流數倉技術,可以勝任同國際化團隊協(xié)同工作;
2.計算機、信息技術、信息管理、數據管理、數據科學等相關專業(yè)本科及以上學歷;
3.熟練使用數據工程工具,例如:
? SQL類工具,如MySQl和PostgreSQL等
? Python數據類工具:如pandas, polars, DuckDB, PyArrow, Great Expectation等
? Data Lake相關工具:Delta Like, Parquet, Amazon S3, Apache Iceberg 等
? Airflow等數據調度工具
4.具備較好的維度建模方法論,獨立負責過數倉架構設計和優(yōu)化,熟練ETL、數倉分層、性能調優(yōu),了解MySQL數據庫模型和數據結構;
5.熟悉一門或多門面向對象的編程語言:Python/Java/Scala/C ;
6.熟悉從數據生產到數據消費的全鏈路,具有將技術和優(yōu)秀的業(yè)務理解相結合的能力,發(fā)掘機會、解決問題;
7.兩年以上對口行業(yè)經驗,優(yōu)秀者工作年限可適當放寬;
8.邏輯清晰嚴謹,對數據敏感,跨團隊協(xié)作能力、溝通能力強。
加分項:
? 熟悉以下技術:
* PHP Symfony
* 元數據管理,如DataHub
* 圖數據庫和圖數據分析
* 其它:Apache Solr, Shell, Git
* Streamlit
* Docker
? 有學術出版、文獻計量學和科學計量學、作者消歧等相關知識、技能和經驗;
? 了解數據分析/機器學習/NLP,或有將數據分析/算法和業(yè)務洞察能力結合的經驗。
三、薪資福利
1. 薪酬待遇:20-40K;
2. 基礎福利:六險一金,帶薪年假,年度體檢,節(jié)日福利,活動經費,豐富茶歇,營養(yǎng)晚餐等;
3. 進階福利:子女福利,團隊獎勵,培訓津貼,崗位津貼;
4. 職業(yè)發(fā)展:導師培養(yǎng),技能培訓,管理培訓。
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務必提高警惕。
-
媒體·出版·文化傳播
-
1000人以上
-
私營·民營企業(yè)
-
北京市海淀區(qū)中關村南四街18號紫金數碼園4號樓201室
-
試劑研發(fā)助理 6000元以下1年以上 本科南京長健生物科技有限公司
-
研發(fā)項目管理(TPM) 15000-16000元應屆畢業(yè)生 本科宸鴻科技(廈門)有限公司
-
業(yè)務代表-蘇州市區(qū)吳江 6000元以上應屆畢業(yè)生 不限元氣森林(北京)食品科技集團有限公司
-
五險 業(yè)務 雙休 5000-10000元應屆畢業(yè)生 中技世通儀器檢測服務有限公司
-
制造部副部長 面議應屆畢業(yè)生 不限中廣核博繁新材料(南通)有限公司
-
營銷主任(江蘇吳江)(J13466) 9000-12000元應屆畢業(yè)生 大專廣州立白企業(yè)集團有限公司

應屆畢業(yè)生
本科
最近更新
287人關注
注:聯系我時,請說是在江蘇人才網上看到的。
