Loading... # 引言 最近有个构思,因为上学的时候加了好多群,有一些发优惠券的那种电商群,每天都发一些商品优惠券,推销商品的图片,但是这些图片太多了,想要删除,但是又有好多群里的图片想要保留,所以构思了这个小工具,后期用于其它用途也是可以的。 # 准备工作 1. python 2. pip 3. paddleocr # 代码 ```python from paddleocr import PaddleOCR, draw_ocr ocr = PaddleOCR(use_angle_cls=True, lang="ch") img_path = "d:\\demo.png" try: result = ocr.ocr(img_path) kword = [] for items in result: for item in items: kword.append(item[1][0]) print("[#]",[img_path, ''.join(kword)]) print(result) except Exception as e: print('[!] orc error by', e, "filePath: ", img_path) ``` # 成品图 识别度验证 ![image.png](https://www.zunmx.top/usr/uploads/2023/02/3503916125.png) 完整版输出,包含坐标信息 ![image.png](https://www.zunmx.top/usr/uploads/2023/02/1489128271.png) 可以通过绘图模块,来把指定区域画上边框。 # 缺陷 有些图片可能文字太过绚丽,存在识别不准确的可能。 有些图片可能没有文字,导致检测不到。 # 进阶 把图片放到数据库中,然后写个前端页面,手动删除包含关键字的图片。 ![image.png](https://www.zunmx.top/usr/uploads/2023/02/331010118.png) 用vue做个页面,php写个后端,查询数据库和返回图片文件的接口。 ![image.png](https://www.zunmx.top/usr/uploads/2023/02/3179310955.png) © 允许规范转载 打赏 赞赏作者 支付宝微信 赞 如果觉得我的文章对你有用,请随意赞赏