ID:22740
林鹏 爬虫工程师 4年经验
2025-06-15
个人介绍:最常用的编程语言是 Python,网络基础知识:了解 HTTP 请求和响应的基本知识,包括请求头、响应状态码、Cookie 等。HTML 和 CSS:了解基本的 HTML 标签和 CSS 样式会使用 XPath 或 CSS 选择器能更高效地定位和提取数据。数据库知识:熟悉常见的数据库系统,如 MySQL、PostgreSQL 或 MongoDB,能够将爬取到的数据存储到数据库中。反爬虫机制和反反爬虫策略:了解常见的反爬虫机制,如验证码、请求频率限制等,以及相应的应对策略。代码调试和错误处理:能够熟练使用调试工具和技巧,排查和处理代码中的错误和异常情况。
项目经验:爬取淘宝网站的数据 确定目标:明确你要爬取的具体信息,例如商品名称、价格、销量等。 发送请求:使用编程语言发送 HTTP 请求,获取淘宝网站的页面内容。你可以使用 Python 的 requests 库或者其他类似的库来发送 GET 请求。 解析网页:使用解析库(如 Beautiful Soup 或者 XPath)来解析网页的 HTML 结构,提取出需要的数据。 数据处理:对提取到的数据进行清洗和处理,例如去除多余的标签、过滤无用的信息等。 存储数据:将清洗和处理后的数据存储到数据库中,你可以使用 MySQL、MongoDB 或其他数据库系统。 循环操作:如果要爬取多个页面或多个商品的数据,可以设置循环来发送多次请求并处理每个页面的数据。 反爬虫处理:淘宝网站具有反爬虫机制,你可能需要处理一些反爬虫的问题,例如设置请求头、模拟浏览器行为、使用代理 IP 等。
技      能: 其他  
¥1000 / 8小时
立即预约
ID:22572
冯芳 高级研发工程师 15年经验
2025-06-15
个人介绍:1. 熟悉linux平台,精通python和C++,lintcode 200+,工程能力强; 2. 具有扎实的计算机视觉理论基础,有opencv编程的项目经验,熟悉颜色空间,形态学,特征提取,模糊等相关算法; 3. 熟悉LR、决策树、贝叶斯、聚类等机器学习算法; 4. 熟悉pytorch框架,对目标检测和GAN网络有深入研究,熟悉yolo系列以及ssd,r-fcn,mask r-cnn,RetinaNet,Cascade r-cnn等目标检测方法,熟悉mobilenet系列, shufflenet系列,pspnet,fcn,deeplab等图像分割方法;了解LSTM及Attention机制; 5. 熟悉模型蒸馏、剪枝、量化等模型压缩方法,熟悉img2col、winograd等常见卷积优化方法。并有将模型压缩并部署在移动端的经验。
项目经验:手机端实时图像分割 2018.12 - 2019.6 项目简介:在移动端对图片中的天空、水、山、人、建筑、墙、背景进行分割 主要工作:使用包含2W张图片的ADE20K数据集和Cityscapes数据集,结合了旋转、翻转、crop、增强对比度等多种数据增强方法扩大数据集;分割模型选用轻量但高效的ESPNetv2,对网络结构进行了修改,对ESPNetV2添加了多尺度分支,并使用了focal loss作为loss函数进一步优化效果。最终平均mIOU达到了58%。进行模型剪枝和int8量化后,使用ncnn和CoreML转框架并分别迁移到安卓和苹果移动端,在骁龙660上的延迟可以达到100ms,iphone 7上可以达到50ms。 视频超分辨率 2019.2 - 2019.7 项目简介:提升给定视频的分辨率和清晰度,优化视觉观感 主要工作:实现了一个4倍的超分系统,可将低分辨率视频中的的帧转化为高分辨率的图像帧,并且具有更加丰富的细节。数据集方面采用了包含2k分辨率图像的DIV2K数据集和Flickr2K数据集,并通过随机翻转和90°旋转等数据增强方法进一步扩大数据集。我们的模型基于ESRGAN并对其进行改进,使用网络插值对模型的参数进行初始化,完全移除了BN层。使用了感知损失来优化模型的视觉效果,使生成高分辨率图像的主观视觉得分(MOS)和峰值信噪比(PSNR)获得了较大的提升。使用moviepy将图像从低分辨率到高分辨率的过程制作为一个gif图,以更好的观察在视觉观感方面的提升。
技      能: 其他  
¥200 / 8小时
立即预约
ID:22734
韦红 后端 11年经验
2025-06-14
个人介绍:我具备的技术能力包括:1. 编程语言:熟练掌握Java、C++等多种编程语言,能够快速实现算法和程序。2. 机器学习:熟练运用各种机器学习算法,如逻辑回归、支持向量机、决策树、随机森林、深度学习等,并能够针对实际问题进行建模和优化。3. 数据分析和挖掘:熟练掌握各种数据分析和挖掘工具,如SQL、Hadoop、Spark等,能够从大量数据中提取有价值的信息。4. 系统设计:具备系统设计和架构的能力,能够设计和实现高性能、高可用性的分布式系统。5. 团队协作和沟通:具备良好的团队协作和沟通能力,能够有效地与团队成员和其他利益相关者进行沟通和协作。
项目经验:1. 自然语言处理技术:我研究并掌握了自然语言处理领域的核心技术,包括词法分析、句法分析、语义分析等。我利用这些技术进行语义解析、命名实体识别、情感分析、文本生成等工作,并且取得了较高的准确率和召回率。 2. 机器学习与深度学习技术:我熟练掌握了各种机器学习和深度学习算法,包括逻辑回归、支持向量机、决策树、随机森林、梯度提升、长短时记忆网络(LSTM)、门控循环单元(GRU)等。我利用这些技术解决了大量实际问题,包括图像分类、文本分类、情感分析、推荐系统等。 3. 大型语言模型技术:我参与了大型语言模型的研发工作,对模型的结构和算法进行了深入研究。我掌握了模型训练、参数调整、模型评估等技术,成功实现了大规模预训练模型的训练和应用。 4. 数据挖掘技术:我熟练掌握了数据挖掘领域的各种算法和技术,包括关联规则挖掘、序列模式挖掘、分类、聚类等。我利用这些技术解决了大量实际问题,包括市场营销、金融风控、医疗诊断等。 5. 机器人技术:我掌握了机器人领域的核心技术,包括机器人控制、导航、感知、人机交互等。我利用这些技术开发了各种机器人应用,包括服务机器人、工业机器人、医疗机器人等。
技      能: 其他  
¥700 / 8小时
立即预约
立即预约
意见反馈