ID:20889
李磊   数据工程师  
公司信息:小米
工作经验: 12年
薪资价格:200/天
所在区域: 北京
浏览次数:232次
登录次数:19次
最近登录:2025-03-28
认证情况:
掌握技能: Python  
立即预约
立即收藏
沟通需求
程序员接单发单

微信扫码,联系客服沟通需求

个人介绍
1. 熟悉使⽤ Java、Scala 编程语⾔;
2. 熟悉 JVM,了解基本的 JVM 调优;、
3. 熟悉常⽤的大数据工具;
4. 熟悉常⻅的数据结构和算法;
5. 熟悉 Spark、Flink、Hbase、Kafka 等⼤数据组件;
6. 阅读过 Spark 核⼼源码,熟悉 Spark 任务提交、存储系统、Spark SQL 等组件的流程与实现。
7. 阅读过 Flink 核⼼源码,熟悉 Flink 任务提交、Graph ⽣成过程、State 管理等组件的流程与实现。
项目经验
1. ⼈群标签开发 
项⽬描述:标签管理是 DMP 平台的主要功能之⼀,通过对上游数据基于 Spark、Flink 进⾏加⼯,⽣成⼈群标签 供⼴告主进⾏圈选,⽤于⼴告定向。 
责任描述: 
1. 负责 OTT 设备所有标签开发以及⼿机设备的⽤户⾏为标签开发,使⽤ Spark 处理上游⽤户画像宽表,每⽇定 时调度,产出离线标签,封装成 Bitmap,存⼊ HBase 中; 
2. 使⽤ Flink 处理⽤户⾏为打点⽇志,产出实时标签,写⼊ Redis 中,供⼴告引擎在线读取; 
主要成果:
产出基础属性、设备属性、⽤户⾏为、兴趣娱乐、消费能⼒ 5 类共 25 个标签。 
 2. 离线任务优化 
项⽬描述:
针对 DMP 平台原有以 Spark Client ⽅式提交的离线任务进⾏优化。 
责任描述: 
1. 独⽴完成服务的架构设计、开发
2. 以 DB 为队列,通过建⽴⼀个调度表存放任务信息,通过接⼊⼀层 dispatcher 服务消费 DB 中的任务,以 Spark Cluster 的⽅式提交任务,并通过 YARN 接⼝实时检测任务的执⾏状态及时进⾏失败重试; 
主要成果:⽬前已接⼊ 5 类 DMP 离线任务,⽇均任务 1500+,优化前平均等待时间 150 分钟+,优化后平均等 待时间 40 分钟+,缩短 110 分钟,效率提升近 2/3 
 算法实时特征 
1. ⽤户 APP 实时使⽤特征 
项⽬描述:对⽤户使⽤ APP 的下载、安装、更新、打开等实时事件进⾏处理,⽣成实时序列、统计量特征,写⼊ 特征管理平台,供算法团队使⽤。 
责任描述: 
通过消费上游设备事件埋点⽇志,处理⽤户⾏为⽇志,利⽤ Flink 的 ProcessFunction + Timer 实现每分钟更 新⽤户过去⼀⼩时的实时时间,⽣成不同维度的特征序列写⼊特征管理平台。 
主要成果:处理上游 5W 条/S ⽇志信息,向下游输出 100W 条/S 特征,产出各种维度组合特征 60 个
发布需求
点击发布需求,客服审核通过后会展示订单,程序员会在任务下报名,招聘专员也会在1小时内与您联系,帮助您精准找到符合要求的程序员!
接单发单客服
程序员接单客服微信
添加客服微信,接单发单快人一步!
相关程序员推荐
小耀 大数据开发实习生 1年经验
• 具备较强的学习能力、抗压能力、自制力。 • 擅长团队协作、策划,有良好的团队合作精神和协调沟通能力; • 具有较强执行力和责任心,能够独立或协同他人高质量按期完成任务 • 熟悉 java、Scala 、MySQL 等编程语言,有良好编码习惯,乐于研究学习新的技术和知识。
袁宇 0年经验
接本科水平订单; 可使用C/C++、Python编程,OpenCV图像处理,QT开发上位机,STM32单片机开发; 可使用SolidWorks进行建模,CAD绘制图纸,Protues/Multisim电路仿真; 参加多项工科类竞赛,均为教育部认可A类竞赛;
蓝桉 技术支持 1年经验
专业:数据科学与大数据技术。全国大学生数学建模天津赛区一等奖,数据挖掘数据清洗数据处理,机器学习
问心 0年经验
java 后端开发,vue 前端开发,python 爬虫
小白 3年经验
我是一名有经验的Python开发者,特別是对于网络爬虫、游戲開發和AI有深入的了解,具有3年的工作經驗。
立即预约
意见反馈