我們的團隊
OUR TEAM
CAREERS
1、負責大模型訓練所需的數(shù)據(jù)標注工作,確保數(shù)據(jù)質(zhì)量并提升模型性能;
2、根據(jù)業(yè)務需求,設計和制定數(shù)據(jù)標注規(guī)則和標準,確保標注方案的規(guī)范性和高效性;與產(chǎn)品、開發(fā)及機器學習團隊緊密合作,支持模型預訓練、微調(diào)及評估過程中的數(shù)據(jù)需求;
3、跟蹤最新大模型及標注技術的發(fā)展趨勢,優(yōu)化數(shù)據(jù)標注方法,提高標注效率與效果;
4、協(xié)助搭建并完善數(shù)據(jù)標注流程,探討半自動標注及模型輔助標注的可行性;
5、參與標注數(shù)據(jù)集的質(zhì)量評估,發(fā)現(xiàn)并解決數(shù)據(jù)標注中的問題,確保數(shù)據(jù)集的一致性和準確性。
任職要求:
1、技術能力:熟悉主流大模型(如 GPT、BERT、Qwen、LLaMA、GLM等)的基本原理及數(shù)據(jù)需求;
2、對標注工具及流程有深入理解,有大型數(shù)據(jù)集標注經(jīng)驗優(yōu)先;
3、了解常見的數(shù)據(jù)預處理及管理工具,熟悉數(shù)據(jù)標注過程中的挑戰(zhàn)及優(yōu)化方案;
4、熟悉數(shù)據(jù)標注相關的自動化技術或工具者優(yōu)先。
工作經(jīng)驗與知識:
1、有機器學習、深度學習基礎,了解模型訓練與優(yōu)化對數(shù)據(jù)標注的要求;
2、有實際數(shù)據(jù)標注項目經(jīng)驗,能夠獨立完成高質(zhì)量標注;
3、熟悉標注質(zhì)量控制的方法,有數(shù)據(jù)質(zhì)量評估經(jīng)驗。
能力素質(zhì):
1、有較強的分析和解決問題能力,耐心細致,對數(shù)據(jù)工作充滿熱情;
2、具有團隊合作精神,能積極與需求方溝通并高效完成任務; 愿意學習并掌握最新的標注技術或相關領域工具。
加分項:
有模型壓縮(量化、蒸餾、剪枝等)相關知識; 熟悉常見深度學習框架(如 PyTorch)或數(shù)據(jù)處理工具;在標注過程中使用過機器學習輔助的標注工具或流程優(yōu)化方法。
1、參與產(chǎn)品功能開發(fā)和單元測試。
2、對現(xiàn)有程序進行維護和優(yōu)化,修復測試中發(fā)現(xiàn)的程序缺陷,確保平臺安全穩(wěn)定運行。
3、參與代碼走讀、協(xié)同測試人員開展測試工作。
4、配合研發(fā)經(jīng)理完成相關任務目標。
5、項目需求的開發(fā)。
1、本科及以上學歷,4年及以上Java開發(fā)經(jīng)驗。
2、扎實的編程基礎,精通java開發(fā)語言,具備oop編程思想,熟悉設計模式和算法。
3、熟練掌握jvm,緩存,分布式架構、消息中間件等核心技術,擁有分布式、高并發(fā)的系統(tǒng)開發(fā)經(jīng)驗。
4、良好的組織建模能力,熟悉NoSQL、Cache原理,具備設計復雜業(yè)務系統(tǒng)的能力。
5、良好的設計能力、溝通能力,技術思路清晰,結(jié)構化思維清晰,有較強的性能優(yōu)化及問題排查、解決能力,善于解決復雜問題。
6、有強烈的責任心,優(yōu)秀的表達能力,較強的學習和理解能力,思路清晰,有強烈的團隊意識強。
7、熟悉業(yè)界典型的云架構、docker、kubernetes等技術者最佳。
8、有Python或C++開發(fā)經(jīng)驗者優(yōu)先考慮。
1. 負責基于Hadoop、spark、flink、ElasticSearch平臺的離線/實時數(shù)據(jù)處理、數(shù)據(jù)計算、數(shù)據(jù)開發(fā);
2. 負責病種分庫系統(tǒng)建設開發(fā)、數(shù)據(jù)治理、分析、處理、編碼等工作;
3. 負責病種分庫系統(tǒng)高可用性、高可擴展性、高并發(fā)的持續(xù)優(yōu)化;
4. 負責搜索引擎ElasticSearch數(shù)據(jù)加工及分詞優(yōu)化工作。
1、具備扎實的離散數(shù)據(jù)、數(shù)據(jù)結(jié)構、線性代數(shù)、概率論等基礎知識;
2、有3年以上的Python、spark、ElasticSearch實際開發(fā)經(jīng)驗;
3、熟悉Python、scala進行spark代碼開發(fā)工作;
4、精通SQL語句,對數(shù)據(jù)敏感,有較強的邏輯分析能力,對大數(shù)據(jù)處理和分析技術有豐富的經(jīng)驗和強烈熱情;
5、有數(shù)據(jù)中臺實際開發(fā)經(jīng)驗、較強的日常故障診斷和性能調(diào)優(yōu)能力;
6、對基于Hadoop集群高并發(fā)、高可用、高可擴展性體系系統(tǒng)有一定的理解;
7、有DataWorks、MaxComputer實戰(zhàn)經(jīng)驗者優(yōu)先;
8、有Spark GraphX實戰(zhàn)經(jīng)驗者優(yōu)先;
9、有機器學習、數(shù)據(jù)分析等相關工作經(jīng)驗優(yōu)先;
10、熟悉微服務技術架構、Docker技術的優(yōu)先;
11、熟悉Kafka、Zookeeper、spark、Flink底層源碼者優(yōu)先;
12、性格開朗,善于交流,有良好的團隊合作精神和協(xié)調(diào)溝通能力
有意者請將簡歷發(fā)至:shaoyan@eimageglobal.com
咨詢電話:15858139132(人事部-邵女士)
簡歷中請注明:
1.您所申請的職位
2.您目前或期望的薪資范疇
3.請在Email主題中注明:應聘者姓名--應聘部門--應聘職位
OUR TEAM