编程语言:python 深度学习:熟悉分类、检测、分割等领域的主流算法,熟悉pytorch、mxnet训练框架,熟悉算法调研->数据准备->模型训练->模型评估->模型发布->模型部署等完整流程 性能优化:熟悉onnx、tensorrt、triton等推理部署开发工具 常用库:openmmlab、paddledet、opencv等 软技能:具备较强的分析解决实际问题的能力以及良好的沟通、学习和协作能力
个人介绍
项目经验
异源路网结点相似度计算 1. 基于规则的结点相似度计算只考虑与结点直接关联的信息,泛化性较差;基于图神经网络的结点相似度计算只考虑了结构相似性而丢失了空间信息;基于图像分类模型可以综合考虑结点的结构和空间位置信息,此外,鉴于传统CNN模型捕捉全局信息能力较差,而结点相似度计算需要建模长距离的依赖关系,因此选择vit模型,accuracy从90%提高至96.1% 2. 鉴于输入图片的通道为异源路网信息,其各通道重要性并不相同,通过添加通道注意力机制,accuracy从96.1%提高至96.5% 3. 鉴于正负样本分布不均衡的问题,通过动态采样、focal loss等方式将accuracy提高至97%,最终帮助线匹配accuracy从85%提高到91% 车牌识别算法落地 背景:丰富算法组人工智能平台的应用能力 1. 传统车牌识别需要预先将车牌中的字符分割、然后再对分割出的字符进行分类,鲁棒性较差,因此选用LPRNet 2. 鉴于实际场景下的车牌存在多种的形变情况,通过在LPRNet中加入STN模块,accuracy从92%提高到92.7% 3. 鉴于实际场景中多存在双行车牌的情况,通过将LPRNet分层并将上下层拼接以进行最后预测使其自适应单双行车牌识别,accuracy从92.7%提高到93.6% 表格重建算法落地 1. 目前业内表格重建解决方案主要分为1)基于分割网络提取表格线然后构建单元格 2)基于端到端的生成html/xml序列 这两种方案,而html/xml序列方案基于大量的表格数据,且目前主要为英文场景下的数据集,难以迁移到中文场景、中文识别率低,遂采用分割方案(基于unet模型) 2. 鉴于单元格合并频率较高而通过表格线之间的关系生成规则的方法较为复杂难以覆盖所有合并的情况,遂在常见场景下表格线提取准确率为99%的基础上应用轮廓提取方案以获得表格单元格坐标 3. 鉴于单元格内无字区域较多且常有多行文本现象而传统opencv方案鲁棒性较差,遂采用文字检测坐标与单元格坐标匹配方案提高了单元格内容accuracy15% 身份证信息识别算法落地 1. 独立解决图片中身份证位置不固定影响的文字识别准确率不高的问题,通过正倒分类、倾斜矫正等使文字识别accuracy提高5% 2. 参与解决图片质量不佳、模型误差导致的文字识别率下降问题,通过利用监督信息对结果校正,使文字识别accuracy提高4% 3. 参与解决身份证数据被水印污染的问题,通过加入gan网络去水印将文字检测mAP提高了3.7%
接单发单客服

添加客服微信,接单发单快人一步!
相关程序员推荐
少风 视觉工程师 4年经验
应用类视觉需求可联系我
接外包 0年经验
本人已经工作五年
1.熟练使用U3d引擎
2.熟练使用c#、xLua、Shader Graph
3.各种插件
4.熟悉数据结构与算法
5.熟练使用设计模式
袁宇 0年经验
接本科水平订单;
可使用C/C++、Python编程,OpenCV图像处理,QT开发上位机,STM32单片机开发;
可使用SolidWorks进行建模,CAD绘制图纸,Protues/Multisim电路仿真;
参加多项工科类竞赛,均为教育部认可A类竞赛;