说到图像识别相信大家已经非常熟悉了,这一技术早就深深融入我们生活的方方面面,小到人脸解锁、支付、打卡、酒店入住,摄像头中的违规驾驶识别,网购明星同款时的以图搜图,大到自动驾驶汽车中的驾驶辅助,医疗影像的辅助诊断,图像视频的分析、编辑、再创造等等...
有人会问,你说的这些不都是图像分类、目标检测的应用么?但这背后远远不止这些,还有度量学习和图像检索等,现在更有集合各种功能的【通用图像识别系统】,让你拥有一套系统就可以轻松拥有各行各业的解决方案,将上述应用场景一网打尽!
赶紧Star收藏住:
https://github.com/PaddlePaddle/PaddleClas
那这个项目到底有什么过人之处,图像识别又比图像分类、目标检测强在哪里呢?
拿[商品识别]举个栗子,如果你用单纯的图像分类和目标检测,你会发现:
商品类别数以万计:根本没法事先把所有类别都放入训练集!训练集都不完备怎么训练算法?
样本类别极不均衡:每类商品的数量分布参差不齐,有的类别只有1、2张图片!这样的类别即使投入算法训练,识别准确率也是非常非常低的。
品类更新极快:各个商家不停的推出新的品类,每增加新的产品都要辛辛苦苦重新训练模型!
而使用图像识别,不仅能将以上问题完美解决!而且上手极快,简单易懂。准备好需要识别的物体图片后,只需三步,多类别、小样本、数据不均衡通通不再是问题!并且它除了商品识别,还可以进行车辆、人脸、Logo、行人识别!!!让我们一起想识别什么就识别什么!(是自由的感觉没错了!)
并且这个图像识别系统的4个核心构成模块,都是经过精心打磨。无论是单独使用亦或是串联开发,都有非凡的效果:
主体检测:采用高精准超轻量的PP-YOLOv2检测算法,快速对图像进行主体检测,提升识别效率。
骨干网络:精选6个系列Backbone,覆盖最精巧的移动端模型和高精准的服务端模型,支持对结构进行快速修改,满足不同使用场景的需求。
度量学习:集成ArcMargin, CenterLoss, TriHard等业界最领先的度量学习方法,并能任意组合,轻松训练出鲁棒的图像特征。
检索系统:集成百度自研的Möbius算法,高效完成向量检索,并能随时更新检索库,一次训练长期使用。
开发者不仅可以单独或自主组装使用这四个模块,还可以直接采用构建好的车辆识别、LOGO识别、商品识别、动漫识别四个系统。只需要补充好检索库,就可以直接投产使用了!
这么强大、用心的项目 ,你还在等什么?!还不赶紧