华鹏|北京虾皮信息科技有限公司(Shopee)|算法工程师|要接单-程序员接单平台

ID：22731

华鹏算法工程师

公司信息：北京虾皮信息科技有限公司(Shopee)

工作经验： 5年

薪资价格：200/天

所在区域：苏州

浏览次数：289次

登录次数：32次

最近登录：2025-06-05

认证情况：

掌握技能：

其他

立即预约

立即收藏

沟通需求

微信扫码，联系客服沟通需求

个人介绍

编程语言：python
深度学习：熟悉分类、检测、分割等领域的主流算法，熟悉pytorch、mxnet训练框架，熟悉算法调研->数据准备->模型训练->模型评估->模型发布->模型部署等完整流程
性能优化：熟悉onnx、tensorrt、triton等推理部署开发工具
常用库：openmmlab、paddledet、opencv等
软技能：具备较强的分析解决实际问题的能力以及良好的沟通、学习和协作能力

项目经验

异源路网结点相似度计算
1. 基于规则的结点相似度计算只考虑与结点直接关联的信息，泛化性较差；基于图神经网络的结点相似度计算只考虑了结构相似性而丢失了空间信息；基于图像分类模型可以综合考虑结点的结构和空间位置信息，此外，鉴于传统CNN模型捕捉全局信息能力较差，而结点相似度计算需要建模长距离的依赖关系，因此选择vit模型，accuracy从90%提高至96.1%
2. 鉴于输入图片的通道为异源路网信息，其各通道重要性并不相同，通过添加通道注意力机制，accuracy从96.1%提高至96.5%
3. 鉴于正负样本分布不均衡的问题，通过动态采样、focal loss等方式将accuracy提高至97%，最终帮助线匹配accuracy从85%提高到91%
 车牌识别算法落地
背景：丰富算法组人工智能平台的应用能力
1. 传统车牌识别需要预先将车牌中的字符分割、然后再对分割出的字符进行分类，鲁棒性较差，因此选用LPRNet
2. 鉴于实际场景下的车牌存在多种的形变情况，通过在LPRNet中加入STN模块，accuracy从92%提高到92.7%
3. 鉴于实际场景中多存在双行车牌的情况，通过将LPRNet分层并将上下层拼接以进行最后预测使其自适应单双行车牌识别，accuracy从92.7%提高到93.6%
 表格重建算法落地
1. 目前业内表格重建解决方案主要分为1）基于分割网络提取表格线然后构建单元格 2）基于端到端的生成html/xml序列 这两种方案，而html/xml序列方案基于大量的表格数据，且目前主要为英文场景下的数据集，难以迁移到中文场景、中文识别率低，遂采用分割方案(基于unet模型)
2. 鉴于单元格合并频率较高而通过表格线之间的关系生成规则的方法较为复杂难以覆盖所有合并的情况，遂在常见场景下表格线提取准确率为99%的基础上应用轮廓提取方案以获得表格单元格坐标
3. 鉴于单元格内无字区域较多且常有多行文本现象而传统opencv方案鲁棒性较差，遂采用文字检测坐标与单元格坐标匹配方案提高了单元格内容accuracy15%
 身份证信息识别算法落地 
1. 独立解决图片中身份证位置不固定影响的文字识别准确率不高的问题，通过正倒分类、倾斜矫正等使文字识别accuracy提高5%
2. 参与解决图片质量不佳、模型误差导致的文字识别率下降问题，通过利用监督信息对结果校正，使文字识别accuracy提高4%
3. 参与解决身份证数据被水印污染的问题，通过加入gan网络去水印将文字检测mAP提高了3.7%

发布需求

点击发布需求，客服审核通过后会展示订单，程序员会在任务下报名，招聘专员也会在1小时内与您联系，帮助您精准找到符合要求的程序员！

发布需求

接单发单客服

添加客服微信，接单发单快人一步！