本期推荐的是一个开源的增值税发票OCR 识别项目——invoice。
Invoice是一个基于opencv的增值税发票OCR识别项目,使用flask微服务架构。可以识别的发票类型包括:增值税电子普通发票,增值税普通发票,增值税专用发票;可识别字段为:发票代码、发票号码、开票日期、校验码、税后金额等。
环境
- python3.5/3.6
- 依赖项安装:
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
- 有GPU环境的可修改安装 requirements.txt 对应版本的 tensorflow-gpu ,config.py 文件中控制GPU的开关
模型架构
YOLOv3 + CRNN + CTC
模型
模型下载地址:https://pan.baidu.com/s/1bjtd3ueiUj3rt16p2_YQ2w
将下载完毕的模型文件夹models放置于项目根目录下
服务启动
python3 app.py
端口可自行修改,服务调用地址:http://…: [端口号]/invoice-ocr,例:http://127.0.0.1:11111/invoice-ocr
示例
测试工具使用postman
- 增值税电子普票
- 增值税专用普票
- 增值税普通普票