Revolut 正在寻找 Python 软件工程师(AutoDL)- 捷克 | LinkedIn
关于 Revolut 人们值得拥有更多金钱。更多的可见性,更多的控制,更多的自由。自 2015 年以来,Revolut 一直致力于实现这一点。我们的产品阵容——包括支出、储蓄、投资、兑换、旅行等——帮助我们的 7000 多万名客户每天都能获得更多的金钱。
加载中...
Retailogists是一家处于零售咨询与技术交汇点的快速成长型初创公司,结合深厚的零售领域专业知识与大数据、全栈工程和AI/ML的技术卓越。我们的客户范围从快速扩展的数字品牌到大型多门店零售商。我们是一支灵活的科技咨询和建设团队,正在寻找一位Senior Spark工程师,专注于分布式数据处理。如果调整一个运行异常的Spark作业是你下午的愉快时光,我们希望与你交谈。作为我们的Spark专家,你将扮演数据平台重型层的领导角色:管道,将大量零售数据移动、转换和重塑,用于内部工具和面向客户的产品。目前大部分运行在AWS Glue上,你将是我们需要快速、可靠且成本高效的那个人。职责包括:设计、构建和维护大规模Spark管道(AWS Glue PySpark和/或Scala)。调整Spark作业的性能和成本——分区、分组、连接、缓存、执行程序大小等。调试和稳定生产Spark工作负载,包括溢出、偏斜和OOM问题。在S3基于的数据湖(Parquet、Iceberg、Delta或Hudi)上构建批处理和增量ETL/ELT模式。将Glue与整个AWS数据栈(S3、Athena、Lake Formation、Step Functions、EMR)集成。建立Spark代码的工程标准——测试、模块化、重用性和Glue作业的CI/CD。与分析师、数据科学家和客户团队合作,将生产数据放在需要的地方。我们寻找(必备条件):5年以上专业数据工程经验,重点在Spark。深入的Spark经验:你理解执行模型、Catalyst优化器和如何阅读Spark UI找到真正的瓶颈。在AWS Glue上的强大生产经验——Glue作业、Glue Catalog、爬虫、书签和相关怪癖。PySpark熟练(Scala是加分项)。熟悉列式格式和现代数据湖表格式(Parquet、Iceberg、Delta或Hudi)。坚实的SQL基础。nice to have:云数据仓库(Redshift、Snowflake、BigQuery)经验;熟悉dbt和语义层建模;熟悉BI工具(Metabase、Looker Studio、Power BI等);分析工程或BI工作流背景;编排经验(Airflow、Step Functions、Dagster);零售或电子商务数据经验。
5年以上专业数据工程经验,重点在Spark。深入的Spark经验:你理解执行模型、Catalyst优化器和如何阅读Spark UI找到真正的瓶颈。在AWS Glue上的强大生产经验——Glue作业、Glue Catalog、爬虫、书签和相关怪癖。PySpark熟练(Scala是加分项)。熟悉列式格式和现代数据湖表格式(Parquet、Iceberg、Delta或Hudi)。坚实的SQL基础。
注册并登录后即可查看
关于 Revolut 人们值得拥有更多金钱。更多的可见性,更多的控制,更多的自由。自 2015 年以来,Revolut 一直致力于实现这一点。我们的产品阵容——包括支出、储蓄、投资、兑换、旅行等——帮助我们的 7000 多万名客户每天都能获得更多的金钱。
关于Revolut 人们值得从他们的钱中获得更多。自2015年以来,Revolut一直在致力于实现这一点。我们的产品阵容——包括支出、储蓄、投资、兑换、旅行等——帮助我们的7000多万客户每天都能从他们的钱中获得更多。
加入Modus Create团队,担任分析工程师!关于我们:Modus成立于2011年,是一个全球性的远程团队...
AI数据工程师。您将构建AI系统依赖的数据基础——清洁的管道、结构良好的知识库,以及使RAG真正起作用的检索层。远程(葡萄牙)- 全职 · 每周40小时...