Ai&云&data
【岗位地点】
工作地:北京,阿里巴巴朝阳科技园
联系人:*************************
阿里云-计算平台-开源大数据EMR OLAP团队
【部门介绍】
阿里云计算平台拥有大数据计算分析(MaxCompute/Hologres/EMR产品系列)、AI/ML服务(PAI、灵骏)、实时/流计算(Flink、DataHub)、体系化数据调度平台(DataWorks)等产品体系,服务整个阿里巴巴集团、淘宝天猫、蚂蚁金服、菜鸟物流等所有子公司的业务需求,拥有海量的业务数据、超大规模的计算资源、非常丰富的业务场景。
阿里云开源大数据OLAP团队是阿里巴巴大数据技术体系的核心团队。我们围绕包括StarRocks、Milvus、ClickHouse、Trino等开源大数据技术打造核心的Serverless产品。在存储计算分离、云原生、分布式计算框架等方向进行持续研发与创新;以极致的性价比、超大规模、丰富的场景支持,帮助客户释放海量数据的商业价值。当前产品服务着阿里云的大规模客户和海量数据,在实时数仓、日志分析、广告精准推荐等关键业务中有着广泛运用,技术与业务挑战。团队有数十位开源大数据组件PMC/Committer。
【岗位职责】
负责阿里云智能EMR Serverless StarRocks等OLAP产品研发,主要集中在下面几个方向:
基于开源OLAP引擎StarRocks、Doris、Trino等技术,提供OLAP场景下的Serverless产品化服务;
参与 StarRocks 湖仓一体架构研发,优化数据湖(Paimon/Iceberg)与 OLAP 引擎的高性能协同机制
提供一站式大数据应用开发平台,包括大数据安全体系,数据治理,作业调度,交互式查询,专项领域监控,通过机器学习算法帮助用户智能诊断复杂问题;
参与关键场景的技术攻关,提升存算分离架构的稳定性,支撑阿里集团业务以及海量公有云客户
参与构建面向AI场景的 Data for AI 增强层,实现向量化查询与ML模型的高效交互,构建大模型训练数据的实时供给管道
参与开源社区,有希望获得 Committer/PMC 席位
EMR OLAP团队登顶TPC-H榜单第一
https://mp.weixin.qq.com/s/3xeCurNSh_ccWe469mgK3A
【岗位要求】
1)计算机、通信、数学等相关专业,具备良好的计算机技术基础;
2)3年以上系统软件,如操作系统,大数据系统,OLAP 等大规模系统软件开发经验。
3)精通 Linux下C++语言,精通至少一门脚本语言,如 Shell,Python 等。
4)熟悉Java/C++/Scala/Go/Rust等至少一种编程语言,熟悉主流JAVA框架包括Spring/Netty/MyBatis等,具备扎实的数据结构和算法基础;
5)有极客精神,代码质量稳定可靠,超强的 Debug 能力,敏锐的洞察力和超强的分析能力。
6)良好的沟通能力和团队合作精神,能够胜任 Review 团队代码,Review 社区代码等,做事主动积极,有技术热情和激情面对挑战。
7)熟悉StarRocks/Clickhouse/Doris/Trino/Spark/Flink/Hive等任一项主流开源技术技术者优先
拉勾安全提示