阿里云 DataLakeAnalytics 团队招人啦!

团队介绍

我们是阿里巴巴集团数据库事业部的OLAP 平台团队,我们专注于提供全球领先的全栈式大规模OLAP产品,目前在阿里集团、公共云、专有云提供了分析型数据库AnalyticDB、时间序列数据库HiTSDB, 数据湖分析引擎: DataLakeAnalytics 等多个产品,得到了大规模应用。每天数据写入记录数在万亿级,查询请求十亿级。

岗位描述

Data Lake Analytics团队,如果你追求技术,你是幸运的,因为在这里,你接触的面很广,云计算的各层技术,从IaaS、PaaS、DBasS、SaaS到FaaS,从网络、存储、计算到虚拟化,或用、或优化、或设计、或开发,你不会out!数据库的多个方面,从JDBC protocol、SQL parser、optimizer、MPP runtime execution到meta store等等,你迟早都会碰到!此外,还有机会和炫酷的硬件加速团队合作推进极致性价比的硬件加速技术实施与落地。在这里你会接触到以下方面的工作:

  • 负责面向多数据源的大规模计算引擎平台的设计、开发;
  • 提升平台资源利用率和性能;
  • 负责基础技术的积累、前沿技术、业界标准规范研究和落地
  • 系统性能调优,精简硬件资源需求,例如降低计算开销,提高响应QPS等;
  • 研究与合作硬件加速技术在多数据源计算平台的技术落地。

岗位要求:

  • 有4年以上分布式计算框架的开发、优化经验并在生产环境得到大规模应用;
  • 对Hadoop ecosystem、Spark ecosystem、Presto ecosystem、Flink ecosystem以及类似分布式系统中的至少一个有深入研究;
  • 精通JAVA或者C/C++,有linux下丰富的应用性能诊断和优化经验;
  • 有强烈的上进心和求知欲,善于学习新事物,对技术充满激情 ;
  • 具有较强的团队合作能力,勇于面对和解决挑战性问题。

优先考虑:

  • 数据库内核开发或机器学习平台开发背景;
  • 有开源社区贡献者优先,Hadoop/Hive/Hbase/Spark/Beam/Yarn 源码熟悉;
  • linux内核经验 、JVM经验;
  • 有Cloud native、Serverless、DevOps等云上技术实施和项目开发经验

欢迎发送简历到 mingming.xumm at alibaba-inc.com, 来信必复。

上一篇:基于 DataLakeAnalytics 的数据湖实践


下一篇:使用Airflow来调度Data Lake Analytics的任务