编程语言:python 深度学习:熟悉分类、检测、分割等领域的主流算法,熟悉pytorch、mxnet训练框架,熟悉算法调研->数据准备->模型训练->模型评估->模型发布->模型部署等完整流程 性能优化:熟悉onnx、tensorrt、triton等推理部署开发工具 常用库:openmmlab、paddledet、opencv等 软技能:具备较强的分析解决实际问题的能力以及良好的沟通、学习和协作能力
个人介绍
项目经验
异源路网结点相似度计算 1. 基于规则的结点相似度计算只考虑与结点直接关联的信息,泛化性较差;基于图神经网络的结点相似度计算只考虑了结构相似性而丢失了空间信息;基于图像分类模型可以综合考虑结点的结构和空间位置信息,此外,鉴于传统CNN模型捕捉全局信息能力较差,而结点相似度计算需要建模长距离的依赖关系,因此选择vit模型,accuracy从90%提高至96.1% 2. 鉴于输入图片的通道为异源路网信息,其各通道重要性并不相同,通过添加通道注意力机制,accuracy从96.1%提高至96.5% 3. 鉴于正负样本分布不均衡的问题,通过动态采样、focal loss等方式将accuracy提高至97%,最终帮助线匹配accuracy从85%提高到91% 车牌识别算法落地 背景:丰富算法组人工智能平台的应用能力 1. 传统车牌识别需要预先将车牌中的字符分割、然后再对分割出的字符进行分类,鲁棒性较差,因此选用LPRNet 2. 鉴于实际场景下的车牌存在多种的形变情况,通过在LPRNet中加入STN模块,accuracy从92%提高到92.7% 3. 鉴于实际场景中多存在双行车牌的情况,通过将LPRNet分层并将上下层拼接以进行最后预测使其自适应单双行车牌识别,accuracy从92.7%提高到93.6% 表格重建算法落地 1. 目前业内表格重建解决方案主要分为1)基于分割网络提取表格线然后构建单元格 2)基于端到端的生成html/xml序列 这两种方案,而html/xml序列方案基于大量的表格数据,且目前主要为英文场景下的数据集,难以迁移到中文场景、中文识别率低,遂采用分割方案(基于unet模型) 2. 鉴于单元格合并频率较高而通过表格线之间的关系生成规则的方法较为复杂难以覆盖所有合并的情况,遂在常见场景下表格线提取准确率为99%的基础上应用轮廓提取方案以获得表格单元格坐标 3. 鉴于单元格内无字区域较多且常有多行文本现象而传统opencv方案鲁棒性较差,遂采用文字检测坐标与单元格坐标匹配方案提高了单元格内容accuracy15% 身份证信息识别算法落地 1. 独立解决图片中身份证位置不固定影响的文字识别准确率不高的问题,通过正倒分类、倾斜矫正等使文字识别accuracy提高5% 2. 参与解决图片质量不佳、模型误差导致的文字识别率下降问题,通过利用监督信息对结果校正,使文字识别accuracy提高4% 3. 参与解决身份证数据被水印污染的问题,通过加入gan网络去水印将文字检测mAP提高了3.7%
接单发单客服
添加客服微信,接单发单快人一步!
相关程序员推荐
dqzboy 高级运维工程师 7年经验
我是一名拥有超过7年运维经验的工程师,专注于容器技术、K8s集群管理以及DevOps流程。在互联网企业中,我负责过多个项目的方案规划和搭建维护,具备丰富的技术敏感度和故障排查经验。我熟悉阿里云、腾讯云、AWS等主流云服务平台,并对新兴技术保持浓厚兴趣,成功在多个项目中实现技术落地。
leon 5年经验
本人擅长Python、Golang等后端Wev开发;擅长多种数据库操作;擅长小程序、网络、算法相关的项目开发;并且有一群靠谱且技术过硬的小伙伴;本人崇尚合作精神,是一个遵守规则的人。
王于辰 全栈开发工程师 3年经验
擅长写vue springboot 项目以及微信小程序 uniapp
码农 5年经验
五年后端开发经验,一年前端开发经验,精通php开发语言,精通uniapp,vue2,做过许多类型的项目,分销商城类,erp类,展示类,同城陪玩,企业管理,家教,充电桩,合同签约,借贷,租房,医疗器材等