【高级spark工程师】-招聘求职信息-拉勾招聘

推荐职位排序方式：默认最新
月薪：
不限
- 不限
- 2k以下
- 2k-5k
- 5k-10k
- 10k-15k
- 15k-25k
- 25k-50k
- 50k以上
工作性质：
不限
- 不限
- 全职
- 兼职
- 实习

Spark大数据组件专家（南京/深圳办公） (MJ013721)
[北京·中关村] 14:45发布

40k-60k·15薪经验5-10年 / 本科

SHEIN

电商平台 / C轮 / 2000人以上

（此岗位需要在南京或者深圳办公）岗位职责： 1.大数据新技术规划、调研、选型及推广落地。 2.负责大数据组件内核开发优化，推进组件容器化，进行组件二次开发与适配等工作。 3.日常负责大数据框架组件的性能优化，稳定性保障，异常监控及线上问题对接解决。 4.参与平台功能研发，提供业务系统化的解决方案。任职标准： 1.至少6年以上相关经验，有扎实的计算机编程基础，精通java/scala,熟悉jvm的原理和调优。 2.精通spark/hive/flink组件原理和内核优化，有超大规模数据计算的架构设计和优化经验。 3.掌握大数据行业趋势，熟悉Kubernetes/Docker，有组件容器化相关经验。 4.具备较强的问题解决能力，能独立分析和攻坚复杂的技术难题。 5.有公有云使用经验者优先。 6.有良好的服务意识、沟通能力和团队协作精神。
Spark大数据组件专家（南京/深圳办公） (MJ013721)
[上海·北新泾] 08:51发布

40k-60k·15薪经验5-10年 / 本科

SHEIN

电商平台 / C轮 / 2000人以上

（此岗位需要在南京或者深圳办公）岗位职责： 1.大数据新技术规划、调研、选型及推广落地。 2.负责大数据组件内核开发优化，推进组件容器化，进行组件二次开发与适配等工作。 3.日常负责大数据框架组件的性能优化，稳定性保障，异常监控及线上问题对接解决。 4.参与平台功能研发，提供业务系统化的解决方案。任职标准： 1.至少6年以上相关经验，有扎实的计算机编程基础，精通java/scala,熟悉jvm的原理和调优。 2.精通spark/hive/flink组件原理和内核优化，有超大规模数据计算的架构设计和优化经验。 3.掌握大数据行业趋势，熟悉Kubernetes/Docker，有组件容器化相关经验。 4.具备较强的问题解决能力，能独立分析和攻坚复杂的技术难题。 5.有公有云使用经验者优先。 6.有良好的服务意识、沟通能力和团队协作精神。
数据分析师-国际支付
[上海·杨浦区] 14:45发布

22k-44k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、负责国际支付业务的数据分析、指标体系建设、业务迭代分析及AB实验分析等工作； 2、通过基础数据建设，能够清晰、完整的刻画国际支付业务的业务现状； 3、通过专项数据分析形成数据洞察及优化迭代建议，数据驱动国际支付业务发展。职位要求： 1、本科及以上学历，统计学、数学、计算机等相关专业； 2、熟练使用SQL/Hive/Python/Spark等语言工具进行数据分析工作； 3、扎实的统计学、数据挖掘等理论和技术基础，熟练掌握因果推断、统计与概率论等数学工具，熟悉聚类分析、关联分析、逻辑回归、决策树等数据挖掘/机器学习模型算法； 4、有较强的逻辑思维能力，对数据敏感，具备很强的数据分析和解决问题的能力，有较好的产品意识，对产品和数据有独立的思考和洞察，有较强的数据驱动的意识； 5、具备较强的学习能力，有强烈的求知欲和进取心，主动及时关注学习业界最新技术； 6、有较强的责任心和主人翁意识，具备良好的沟通表达能力，积极乐观并有良好的团队协作能力； 7、在支付、金融、信贷等领域有相关的数据工作经验及行业经验者优先。
数据仓库工程师-抖音房产业务平台
[北京·海淀区] 14:45发布

25k-50k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、以抖音系全域数据为依托，参与构建海量数据下符合房产业务特性的数据仓库建设； 2、负责数据模型的架构设计、开发以及海量数据下的性能调优、复杂业务场景下的需求交付； 3、参与构建围绕安全、质量、效率、成本等方向的数据管理能力建设，并推动某细分横向场景的落地； 4、深入业务，理解并合理抽象业务需求，发挥数据价值，与业务团队紧密合作。职位要求： 1、熟悉数据仓库体系架构、数据建模方法、数据治理等知识，有较强的SQL/ETL开发能力； 2、对数据价值探索充满热情，较强的业务理解和抽象能力，能快速分析和理解问题； 3、掌握大数据技术栈，包括Hadoop/Hive/Spark/OLAP引擎等； 4、思维逻辑清晰，良好的自驱力、沟通能力和解决问题能力； 5、扎实的数据结构、数据库原理等基础知识，理工科本科以上学历，3年以上数据仓库建模经验； 6、具备流量数据体系建设&实时数据体系建设经验优先； 7、具备房产服务相关行业经验优先。
高级广告算法工程师
[深圳·南山区] 09:26发布

35k-70k 经验5-10年 / 硕士

大宇无限

内容资讯,内容社区,社交媒体 / C轮 / 150-500人

岗位职责 1、基于用户行为建模，优化媒体端广告流量变现效率和用户体验； 2、结合多模态学习（文本、图像、音视频等），优化广告内容推荐和审核机制； 3、参与广告投放相关的核心算法研发，包括 CTR/CVR 预估、RTA、流量预估等优化工作；岗位要求 1、计算机、数学、统计学相关专业本科及以上学历，互联网 5 年及以上工作经验； 2、逻辑思维和数据分析能力强，善于分析和解决复杂问题； 3、优秀的编码能力，熟练掌握 Java/Python，熟悉 Hive、Spark 等大数据工具； 4、熟悉深度学习框架，具备 TensorFlow/PyTorch 实际项目经验； 5、熟悉广告业务，有广告系统算法（CTR/CVR 预估、RTA）经验优先；加分项： 1、具备多模态广告创意理解经验，如广告素材智能分类、视频广告审核相关经验优先； 2、熟悉端侧推理优化，有 MNN、Paddle Lite、TensorFlow Lite、NCNN 等轻量级深度学习框架经验优先；
反作弊工程师
[北京·海淀区] 09:26发布

25k-40k·14薪经验3-5年 / 本科

搜狐集团

移动互联网,广告营销 / 上市公司 / 2000人以上

岗位职责： 1.负责广告流量反作弊系统的规划&建设，包括但不限于相关数据收集、风控规则&算法挖掘与落地、风险等级建设与报警等； 2.基于业务需求以及日常问题识别，制定业务场景反作弊策略和解决方案，确保各业务场景反作弊效果； 3.探索反作弊场景的算法模式，例如半监督/无监督/自监督/小样本学习/强化学习/对比学习等，并且将之应用到反作弊业务场景中； 4.在流量质量评估的基础上，反哺广告投放、用户增长等业务场景；任职资格： 1. 熟练使用python、sql、java等语言，工程落地能力强； 2. 有良好的业务sense，熟悉数据分析、数据挖掘，能够自主挖掘有效的反作弊规则； 3. 熟悉反作弊相关机器学习算法，有实际业务落地经验者优先； 4. 熟悉大数据工具Hadoop、Spark、kafka、flink等的使用； 5. 具备良好的理解能力和沟通能力，数据敏感度高，善于将业务问题转化为技术问题。
QQ音乐推荐算法工程师
[北京·朝阳门] 09:26发布

25k-50k 经验10年以上 / 硕士

腾讯音乐娱乐集团

工具类产品,内容社区,音频｜视频媒体 / 上市公司 / 2000人以上

岗位职责： 1.负责腾讯音乐集团相关产品推荐算法的设计实现与优化； 2.负责完善现有推荐系统的基础算法及并行计算框架； 3.负责音乐平台业务的基于用户/音乐特性的数据挖掘及推荐策略设计实现； 4.负责能够根据业务数据变化不断设计并调整算法策略来提升算法质量，并最终提升用户体验。岗位要求： 1.硕士及以上学历； 2.计算机，统计，信息，数学等相关专业毕业优先； 3.扎实可靠的编程能力，精通C/C++/GO至少一门编程语言； 4.熟悉业内推荐算法及数据挖掘领域的技术热点和进展，对互联网在线音乐的推荐系统架构设计有深入了解； 5.了解Hadoop/Spark生态相关技术优先； 6.具备规模分布式数据存储与计算开发经验者优先； 7.沟通能力佳，表达能力出众者，音乐爱好者优先。
PTBU-搜索算法工程师/高级搜索算法工程师
[广州·天河区] 08:50发布

25k-50k 经验5-10年 / 硕士

酷狗音乐

音频｜视频媒体,短视频 / 上市公司 / 500-2000人

岗位职责： 1. 搜索排序方向：包括粗排、精排、混排，构建特征工程、多目标学习、在线模型推理、以及垂类优化等任务； 2. Query理解方向：包括纠错、改写、意图、词权重、紧密度、丢词、成分分析等任务； 3. 曲库建设方向：包括歌曲分类体系建设，标签挖掘，向量化建设等； 4. 用户画像方向：包括属性挖掘，兴趣体系建设，行为模式挖掘等； 5. NLP研究方向：包含分词、实体识别、标签提取、文本分类、模型预训练、语义向量等任务。岗位要求： 1. 计算机、机器学习和数学等相关专业，硕士及以上学历； 2. 3年以上搜推广相关工作经验； 3. 有丰富的c++/java/python等主流编程语言经验，扎实的算法与数据结构功底，优秀的机器学习基础，良好的数学与统计基础； 4. 熟悉hive，spark等大数据处理工具，有丰富的数据处理与挖掘经验； 5. 至少熟练掌握一种深度学习框架； 6. 有以下一项或多项将优先考虑：1）有丰富NLP落地经验，有大规模数据建模经验，熟悉搜索、推荐、广告业界前沿算法；2）有完整数据体系建设经验，包括用户画像、物品画像、数据质量评估与监控等；3）有优秀论文发表者优先。
数据挖掘专家(数仓+模型)
[上海·张江] 14:15发布

20k-35k·15薪经验1-3年 / 本科

信也科技

金融 / 上市公司 / 2000人以上

岗位职责： 1、参与数据仓库规划、架构及研发，包括离线、实时的数据模型规划，参与ETL实施，建设稳定高效的数据体系。 2、参与数据治理相关工作，负责数据质量、数据一致性及稳定性保障等建设。 3、深度理解业务需求，构建并维护业务数据模型，包括不限于用户模型、业务预测模型、业务评估模型等，提升数据模型的准确性和稳定性，推动业务高效发现问题及业务决策。 4、挖掘业务需求，基于对机器学习的理解，从业务和技术等维度上，提出模型优化策略及不同场景下的数据解决方案，选择有效的算法解决可能遇到的数据、场景相关问题，提升模型的性能和稳定性； 5、参与数据产品与应用的数据研发，发掘数据价值，以数据驱动业务不断发展。 6、跟踪模型或方案产生的业务影响，与各业务部门紧密合作，推动数据化决策。任职资格： 1、**本科及以上学历，统计学、数学、经济学、金融等相关专业，并在数据挖掘相关工作上有1-3年工作经验。 2、精通Python、SQL，熟悉常用数据统计、分析和建模方法；熟练掌握SQL/HQL/Spark SQL开发及优化技能，快速ETL实施能力，对SLA有较深刻的认识及强烈的责任心。(Must) 3、熟悉Azkaban等任务调度工具。(Must) 4、精通数据仓库理论体系，对分层设计、维度建模等有深刻的认识和实战经验，熟悉不同建模方法的优劣。(Must) 5、积极主动贴近业务，有良好的沟通协调能力和团队合作精神，数据敏感度高，能够快速理解业务模型及数据模型； 6、优秀的分析问题和解决问题的能力，对解决具有挑战性的问题充满激情； 7、有数据分析能力优先。(Plus)
推荐算法工程师（酷我业务线）
[北京·朝阳门] 1天前发布

35k-45k·14薪经验3-5年 / 本科

腾讯音乐娱乐集团

工具类产品,内容社区,音频｜视频媒体 / 上市公司 / 2000人以上

岗位职责: 1.负责酷我音乐各业务场景推荐策略优化及算法研发； 2.通过理解用户行为，结合数据挖掘技术，快速迭代并优化用户体验，以及各项数据指标； 3.能够有效学习并落地工业界前沿推荐算法，对业务增长起到推动作用。任职要求: 1.计算机、数学或相关专业本科以上学历，三年以上工作经验； 2.熟悉常用机器学习算法、深度学习算法，并在推荐系统/搜索/广告等有理论基础和实践经验； 3.熟悉TensorFlow、pytorch常见深度学习框架，熟悉Spark，Hive等大数据处理工具； 4.具有良好的工程实现能力，熟练掌握C/C++、Java、Python等至少一种编程语言； 5.有较好的学习能力、沟通能力、团队协作能力，积极主动，愿意接受挑战。
大数据开发工程师
[上海·徐汇区] 14:45发布

20k-30k·15薪经验3-5年 / 本科

关爱通

电商,企业服务 / 未融资 / 150-500人

岗位职责： 1.负责ETL相关开发工作，深度参与数据仓库的建设与优化，保障数据存储的高效性与稳定性，支撑公司战略级数据项目的落地。 2.主导复杂数据处理流程的开发与优化，基于 Python 编写高性能的数据处理脚本，结合 spark、pandas、duckdb等进行大规模数据清洗、转换与分析，实现数据挖掘与机器学习模型开发，推动数据价值的深度挖掘。 3.设计和维护基于 Airflow 的工作流调度系统，实现数据处理任务的自动化调度与监控，确保数据处理任务按时、准确执行，提升数据开发与运维效率。 4.与业务部门紧密协作，深入理解业务需求，将业务逻辑转化为数据解决方案，通过数据驱动业务决策，助力业务增长。 5.研究大数据领域的前沿技术，持续优化数据开发技术栈与流程。任职资格： 1.具备 3 年及以上大数据开发相关工作经验，拥有丰富的大数据项目实战经验，能够独立承担复杂数据开发任务。 2.熟练掌握 Python 编程，具备基于 Python 的大数据开发工作经验，能够运用 Python 进行高效的数据处理与算法实现。 3.熟悉数仓建设方法论 1)熟悉etl分层建设方法 2）熟悉主题建设方法，能独立抽象主题，建设主题，并且物理化和性能调优 3）熟悉常用的BI系统建设方法，理解实现原理，理解各个工具使用场景 4.精通大数据开发相关技术栈，包括但不限于 Hadoop、Spark、Hive 等，能够熟练运用这些技术进行数据处理与分析。 5.熟练掌握 Airflow，能够基于 Airflow 进行工作流设计、调度与监控；熟练使用相关技术进行数据处理与分析并能够运用其实现常见的数据挖掘与机器学习算法。 6.熟练掌握sql和调优。 7.熟练掌握python。加分项 1.具备统计学、数学建模等相关知识，能够运用统计方法进行数据分析与模型构建。 2.有分布式系统开发、数据可视化开发经验者优先。薪资待遇 ****，我们提供具有竞争力的薪酬体系与广阔的职业发展空间，期待优秀的你加入！
大模型开发工程师
[北京·西北旺] 14:45发布

15k-30k·13薪经验3-5年 / 本科

亚信科技

软件服务｜咨询,IT技术服务｜咨询 / 上市公司 / 2000人以上

岗位职责负责自然语言处理（NLP）相关算法的研究、设计与实现，包括但不限于文本分类、情感分析、实体识别、语义理解、机器翻译、问答系统等。参与大规模语料库的预处理、特征提取、模型训练与优化，提升算法性能与效果。跟踪学术界与工业界最新NLP技术动态，探索并落地前沿算法，解决实际业务问题。与产品、数据团队紧密合作，理解业务需求，设计并开发高效的NLP解决方案。负责NLP模型的部署与性能优化，确保算法在高并发、低延迟场景下的稳定性。编写技术文档，分享技术经验，推动团队技术能力的提升。任职资格计算机科学、人工智能、数学、统计学或相关专业本科及以上学历，硕士或博士优先。熟悉自然语言处理基础理论，掌握常见的NLP算法与模型，如BERT、Transformer、LSTM、CRF等。具备扎实的编程能力，熟练掌握Python，熟悉常用深度学习框架（如TensorFlow、PyTorch）。熟悉NLP相关工具库（如NLTK、spaCy、Hugging Face Transformers等），并具备实际项目经验。具备良好的数学基础，熟悉概率论、线性代数、优化算法等知识。有大规模数据处理经验，熟悉Hadoop、Spark等分布式计算框架者优先。具备较强的学习能力与问题解决能力，能够独立完成算法研究与开发任务。良好的团队合作精神与沟通能力，能够与跨部门团队高效协作。
AI大模型开发
[广州·白云区] 14:45发布

25k-35k 经验5-10年 / 本科

亚信科技

软件服务｜咨询,IT技术服务｜咨询 / 上市公司 / 2000人以上

岗位职责负责自然语言处理（NLP）相关算法的研究、设计与实现，包括但不限于文本分类、情感分析、实体识别、语义理解、机器翻译、问答系统等。参与大规模语料库的预处理、特征提取、模型训练与优化，提升算法性能与效果。跟踪学术界与工业界最新NLP技术动态，探索并落地前沿算法，解决实际业务问题。与产品、数据团队紧密合作，理解业务需求，设计并开发高效的NLP解决方案。负责NLP模型的部署与性能优化，确保算法在高并发、低延迟场景下的稳定性。编写技术文档，分享技术经验，推动团队技术能力的提升。任职资格计算机科学、人工智能、数学、统计学或相关专业本科及以上学历，硕士或博士优先。熟悉自然语言处理基础理论，掌握常见的NLP算法与模型，如BERT、Transformer、LSTM、CRF等。具备扎实的编程能力，熟练掌握Python，熟悉常用深度学习框架（如TensorFlow、PyTorch）。熟悉NLP相关工具库（如NLTK、spaCy、Hugging Face Transformers等），并具备实际项目经验。具备良好的数学基础，熟悉概率论、线性代数、优化算法等知识。有大规模数据处理经验，熟悉Hadoop、Spark等分布式计算框架者优先。具备较强的学习能力与问题解决能力，能够独立完成算法研究与开发任务。良好的团队合作精神与沟通能力，能够与跨部门团队高效协作。有NLP相关领域论文发表或开源项目贡献者优先
0281S7-大数据开发工程师
[深圳·福田区] 14:45发布

10k-20k 经验1-3年 / 本科

平安人寿

金融业 / 上市公司 / 2000人以上

工作职责 1、负责大数据相关系统的开发、测试、部署及上线工作，参与代码评审，确保开发质量； 2、参与业务部门临时数据分析需求，合作开展专项数据分析工作； 3、协助运营人员处理生产问题并提供技术支持，解答业务部门反馈的数据问题及各类咨询； 4、参与公司数据分析需求调研、评估、系统分析及架构设计工作。任职要求 1、本科及以上学历，计算机、数学、统计学、管理信息类相关专业； 2、熟悉关系型数据库如Oracle、Postgresql等的使用、可熟练编写SQL实现业务逻辑，了解SQL性能调优； 3、熟悉Hadoop生态圈组件，包括但不限于Hive、Spark、HBase、Kylin、Flink、ES、Kafka等； 4、具备良好数据分析及处理能力，熟悉常见的数据处理工具，如ETL、BI工具、Python等； 5、具有较强的责任心和服务意识，良好问题分析及处理能力。
ETL开发工程师(J13474)
[北京·通州区] 14:45发布

15k-25k 经验3-5年 / 本科

大家信科有限责任公司

科技金融 / 不需要融资 / 2000人以上

工作职责: 1.数据同步与ETL开发：负责设计、开发、测试和维护数据同步、抽取、转换和加载（ETL）流程，确保数据高效、准确、稳定地从源系统流向目标系统。 2.数据同步通道部署与运维：负责使用OGG、DSG等数据同步工具进行通道的部署、配置、监控、调优和故障处理，保障数据同步通道的稳定运行。 3.日常数据开发与运维：使用Python、Java等编程语言进行日常数据开发任务（如脚本编写、自动化任务开发）和数据运维工作（如数据质量检查、任务监控、问题排查）。 4.数据库开发与操作：熟练编写和优化SQL脚本，基于Greenplum、Oracle、MySQL、PostgreSQL等主流数据库进行数据查询、分析、转换和存储过程开发等。 5.数据运维程序开发：根据业务需求，开发数据清洗、转换、入库等相关的运维程序和工具，提升数据处理效率和自动化水平。 6.数据质量保障：参与数据清洗规则的制定与实施，确保入库数据的准确性、完整性和一致性。任职资格: 1.工作经验： - 3年以上数据开发相关工作经验。 - 具备以下经验优先： 1）有使用 OGG (Oracle GoldenGate) 或 DSG 等数据同步工具的实际部署、配置或运维经验。 2）了解ETL工具（如 Informatica, DataStage, Kettle 等）或调度工具（如 Airflow, DolphinScheduler 等）。 2.技术能力： - 熟练掌握 Python 和 Shell 脚本编程，能够独立完成开发任务。 - 精通 SQL 语言，具备复杂查询、性能调优、存储过程编写等能力。 - 熟练使用至少两种主流数据库（Greenplum, Oracle, MySQL, PostgreSQL）进行开发、管理和优化，理解其核心架构与特性。 - 了解至少一种国产或新兴数据库（如 OceanBase, TiDB, 人大金仓(KingbaseES)）的基本原理和使用方式。 - 熟悉 Linux 操作系统（如 CentOS, RedHat, Ubuntu 等），掌握常用命令、系统管理、环境配置和脚本执行。 - 加分项 (非必需，但优先考虑)： 1）具备一定的 Java 开发能力。 2）熟悉数据仓库建模理论（如维度建模）。 3）有大数据生态组件（如 Hive, Spark, HDFS 等）的使用经验。 4）了解容器化技术（Docker, Kubernetes）。 3.其他要求： - 具备良好的学习能力、分析问题和解决问题的能力。 - 工作认真负责，有较强的责任心和团队协作精神，能承受一定的工作压力。 - 具备良好的沟通能力，能够清晰表达技术方案和问题。