ID:20364
吕志强 php研发工程师 7年经验
2023-05-12
个人介绍:1.熟悉MVC架构,熟悉OOP面向对象编程思想 2.熟悉thinkphp,lysine,laravel框架 3.熟悉elasticsearch搜索引擎的基本使用 4.熟悉linux操作系统及linux下的基础操作和编程 5. 熟练使用git版本控制软件 6. 熟悉html jquery  css smarty前端开发技术     7. 熟悉shell脚本的简单编程 8. 熟悉redis,memcached ,熟悉mysql 9.熟悉Apache或Nginx服务器管理配置
项目经验:车型库 1. 自建车型库,数据源从汽车之家上抓取 2. 将数据存入elasticearch搜索引擎,能够存入大量数据并方便快速精确地找出所需数据 3. 抓取其他网站的车型经销商,车型价格数据,并与车型库的数据进行相关匹配与清洗,与之前公司的数据进行关联,方便前端工程师接口调用获取相关数据更准确。 4. 统计检测师对车型库筛选这个功能进行操作时的打点行为,为后续提高检测师的工作效率打下基础,基本是每周统计一次。 5. 给检测师从车型库筛选出来的车型提供其他网站同一车型的价格信息,方便检测师估价。 cms后台管理系统 1. 参与企业版(主要是给欧莱雅,诺和诺德等大客户用的)3.0项目,开发审核功能,将询价单到生成订单的过程重新整理优化。 2. 公司内部cms后台开发,增加了用户权限,统计订单数量以及更多功能模块,优化了询价单,需求单的下单审核流程。用lysine框架参与了部分重构工作 3. 公司主要网页的优化与功能开发。 到喜啦app "发现"模块即婚品,所有数据均是通过php脚本采集的淘宝数据。通过添加适当的http请求头模拟用户正常浏览网页的方式采集数据,避免被网站封IP。 通过调用solr提供的接口,传递参数获取数据,前端采用瀑布流的方式布局获取接口数据,避免一次性加载所有图片造成的速度过慢以及流量消耗。通过婚品的权重值,对婚品进行筛选排序等操作。
 
 

技      能: PHP  
¥200 / 8小时
立即预约
ID:22727
程梅 大数据开发工程师 12年经验
2023-05-09
个人介绍:1、熟悉数仓建模,做过大型项目的数仓开发经验。 2、精通sql,做过很多复杂的sql指标运算,包括MR、spark作业调优。 3、熟悉bi工具,可以做报表展示。 4、熟悉spark,可以用spark计算指标。 5、熟悉python,掌握常用的python方法,负责过数据治理功能的开发,包括但不限于(数据产出监控,数据质量监控,hdfs和yarn运行资源的监控,自动化开发工具等) 6、掌握数据治理理论,包括元数据管理和数据管理,数据地图,数据血缘开发等。
项目经验:一、网盘核心数仓表全链路迭代 项目背景:出于公司降本指标,核心指标稳定性问题频发,故迭代升级历史核心任务链路(包括:sql 链路调优,spark 性能参数调优,表功能迭代)。 主要职责: 1、调研需要迭代的指标数量,分析各个计算链路存在问题,并设计优化方案。 2、优化上游调用表链路,拉取更合理的分区,以及 sql 调整减少 shuffle ,调整 spark 参数提高性能,并通过 sapark web 观察 stage 的实际产出效能,调整 executor 、core partition 数量,以及内存的大小等参数来提高效能,并尽量精确节约计算资源降低成本。 3、测试优化后的链路是否通路,并校验数据的准确性,并对比优化前后的成本和效能。 项目业绩: 1、提高了任务链路例行成功率,做到除系统故障外几乎0失败。 2、 降低了计算资源成本35%,提高了计算效率20%。 二、网盘部门计算资源治理系统开发 背景:部门确少全局的资源和任务监管系统,很多队列存在资源浪费和作业不规范的情况,故 ,开发网盘队列资源和作业相关的监管系统,实现全局治理计算资源。 项目职责: 个人开发 1、通过对 队列资源信息的抓取,实现队列稳定性相关的监控。 2、通过一些策略对队列任务进行管控,保证队列资源的稳定性和规范性 3、 提取队列上的作业的核心信息入库并通过可视化展示查询。(包括各个时间作业运行时间,是否触发报警,各个作业运行在哪个队列,消耗多少内存以及 core ,并统计资源占用 top榜,各个时间段的队列资源占比,以及各个时间各队列作业数量统计等相关维度展示) 项目业绩: 大盘上实现了网盘队列和作业的稳定性和规范性。 通过该监控系统,节约大盘计算资源成本 20%。 可以全盘监控和统计网盘运行作业的信息,对后续网盘业务链路迭代提供了数据基础。 三、网盘埋点数据用户pv uv 留存的全链路开发和可视化 1、协同 PM 确认数据口径和需求指标。 2、 从数据库和埋点数据进行采集 etl 处理入 ods层。 3、对数据纬度进行加工聚合,行转列降维成 dws 层宽表,方便 ads 指标取数。 4、 对各个埋点类型的用户(包括 tool、card 、资源位、小飞机、电商、push 等多渠道)进行分类统计 展现 pv,uv 点击 pv,uv 和留存,留存率,ads 层指标。 5、将指标数据通过开发 shell 倒库脚本导入到数据库。 6、 通过 bi 可视化展示收益指标
技      能: 其他  
¥1400 / 8小时
立即预约
ID:21977
杨鑫 C++开发 13年经验
2023-04-23
个人介绍:1.C++ MFC 桌面应用开发。 2.Opencv图像算法研发,图像处理等; 3.OCR在c++项目中的部署和项目落地使用; 4.python深度学习网络部署,主要是在机器视觉方向,如OCR,语义分割,目标识别等。 5.tensorflow或darknet训练网络,训练好的模型用c++进行项目部署。 目前在公司担任图像算法工程师,主要方向是OCR,汉字识别,手写体识别的算法研究加上实际部署等工作,公司主要是做windows桌面开发的产品,精通MFC桌面应用开发。
项目经验:项目一: 目标:对任一张打印的电子表格进行识别和电子化处理 实现方式:1.识别表格有多少行,每行的栏数有几个,进行表格版式的电子版复现;2.识别表格中的内容,包括印刷体的汉字、数字和手写体的数字。3.对不清晰和有噪点的纸张进行一定的预处理。 实现方法:1.用opencv加载已经训练好的文字识别模型;2.进行表格版式的识别;3.文字定位;4.文字识别。 结果:已在公司内部项目中实际使用,效果较好。 项目二: 目标:对一本案卷中不同的类型的文档进行分类 实现方式:1.对文档进行标题定位+识别;2.不能识别文字的使用SVM分类器来分类;3.对特定格式的文档进行特定判断。 结果:已在公司内部项目中实际使用,效果较好。
技      能: C++  
¥1100 / 8小时
立即预约
立即预约
意见反馈