ID:20889
李磊   数据工程师  
公司信息:小米
工作经验: 12年
薪资价格:200/天
所在区域: 北京
浏览次数:182次
登录次数:19次
最近登录:2024-12-12
认证情况:
掌握技能: Python  
立即预约
立即收藏
沟通需求
程序员接单发单

微信扫码,联系客服沟通需求

个人介绍
1. 熟悉使⽤ Java、Scala 编程语⾔;
2. 熟悉 JVM,了解基本的 JVM 调优;、
3. 熟悉常⽤的大数据工具;
4. 熟悉常⻅的数据结构和算法;
5. 熟悉 Spark、Flink、Hbase、Kafka 等⼤数据组件;
6. 阅读过 Spark 核⼼源码,熟悉 Spark 任务提交、存储系统、Spark SQL 等组件的流程与实现。
7. 阅读过 Flink 核⼼源码,熟悉 Flink 任务提交、Graph ⽣成过程、State 管理等组件的流程与实现。
项目经验
1. ⼈群标签开发 
项⽬描述:标签管理是 DMP 平台的主要功能之⼀,通过对上游数据基于 Spark、Flink 进⾏加⼯,⽣成⼈群标签 供⼴告主进⾏圈选,⽤于⼴告定向。 
责任描述: 
1. 负责 OTT 设备所有标签开发以及⼿机设备的⽤户⾏为标签开发,使⽤ Spark 处理上游⽤户画像宽表,每⽇定 时调度,产出离线标签,封装成 Bitmap,存⼊ HBase 中; 
2. 使⽤ Flink 处理⽤户⾏为打点⽇志,产出实时标签,写⼊ Redis 中,供⼴告引擎在线读取; 
主要成果:
产出基础属性、设备属性、⽤户⾏为、兴趣娱乐、消费能⼒ 5 类共 25 个标签。 
 2. 离线任务优化 
项⽬描述:
针对 DMP 平台原有以 Spark Client ⽅式提交的离线任务进⾏优化。 
责任描述: 
1. 独⽴完成服务的架构设计、开发
2. 以 DB 为队列,通过建⽴⼀个调度表存放任务信息,通过接⼊⼀层 dispatcher 服务消费 DB 中的任务,以 Spark Cluster 的⽅式提交任务,并通过 YARN 接⼝实时检测任务的执⾏状态及时进⾏失败重试; 
主要成果:⽬前已接⼊ 5 类 DMP 离线任务,⽇均任务 1500+,优化前平均等待时间 150 分钟+,优化后平均等 待时间 40 分钟+,缩短 110 分钟,效率提升近 2/3 
 算法实时特征 
1. ⽤户 APP 实时使⽤特征 
项⽬描述:对⽤户使⽤ APP 的下载、安装、更新、打开等实时事件进⾏处理,⽣成实时序列、统计量特征,写⼊ 特征管理平台,供算法团队使⽤。 
责任描述: 
通过消费上游设备事件埋点⽇志,处理⽤户⾏为⽇志,利⽤ Flink 的 ProcessFunction + Timer 实现每分钟更 新⽤户过去⼀⼩时的实时时间,⽣成不同维度的特征序列写⼊特征管理平台。 
主要成果:处理上游 5W 条/S ⽇志信息,向下游输出 100W 条/S 特征,产出各种维度组合特征 60 个
发布需求
点击发布需求,客服审核通过后会展示订单,程序员会在任务下报名,招聘专员也会在1小时内与您联系,帮助您精准找到符合要求的程序员!
接单发单客服
程序员接单客服微信
添加客服微信,接单发单快人一步!
相关程序员推荐
山青 高级后端工程师 10年经验
积极参与需求评审并提出功能优化建议,较强的业务分析拆分能力。 有组织带领小型团队协同开发经验。 精通 Java ,熟悉 Python,熟悉 Google Cloud 生态圈技术 熟练掌握主流开发架,spring,springMVC,springboot,springcloud,mybatis,mybatisplus,dubbo,nacos 等主流框架。 熟练掌握 MySQL,Redis,熟悉 Mogodb,Elaseticsearh 等主流数据库。 熟悉 Google Cloud 环境下 BigQuery 数据库,CloudStorage 存储,以及 firebase Analytics 之间的配 合使用,数据转化。 熟悉 kubernetes 容器化部署等操作流程,docker 容器部署流程,编写脚本等等。 熟悉 RabbitMQ,Kafka, RocketMQ 等中间件。 了解日常运维操作,服务器相关配置。
leon 5年经验
本人擅长Python、Golang等后端Wev开发;擅长多种数据库操作;擅长小程序、网络、算法相关的项目开发;并且有一群靠谱且技术过硬的小伙伴;本人崇尚合作精神,是一个遵守规则的人。
柠檬草的味道 0年经验
计算机技术爱好者,有python编程,爬虫,前端页面,小程序开发,算法设计等相关经验,本科论文经验丰富,曾有曼彻斯特硕士论文经验。
curen 5年经验
全栈程序员,毕设,商单都可以来咨询
问心 0年经验
java 后端开发,vue 前端开发,python 爬虫
立即预约
意见反馈