作品名称“AI天眼查”——基于深度学习的企业实体识别和资质查询APP
作品分类移动应用开发
参赛院校北京理工大学
团队成员梁瑛平、韩沛、赵信达
奖项等级三等奖
竞赛年份2021
该项目基于深度学习的文字识别与自然语言处理技术,实现了识别商铺广告牌图片中的文字,并且从识别出的文字中提取出商铺名称的功能,以此帮助用户随时检查店铺信息。此系统涉及文字检测、文字识别、命名实体识别三种基本算法,基于PaddlePaddle深度学习平台进行算法实现。其中,文本检测模型为4.1M大小,字符识别模型也只占4.5M大小,整个APP大小小于20MB,检测精度达到95%以上,支持中英文混杂和长文本、倾斜文本等,实现了超轻量、高精度的模型部署。软件设计实现了PC端软件开发设计和Android端APP开发设计,并且使用轻量级模型推理框架Paddle-Lite实现移动端的推理加速。 其中AI算法的各个模块分别为: 1.文字检测模块:该模使用超轻量级算法Differentiable Binarization实现文字检测,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。 2.文字识别模块:该模使用CTC+CRNN算法实现图像中不定长度的字符识别,主干网络使用MobileNet进行模型轻量化,并且加速模型在移动端的部署。 3.实体识别模块:将识别出的字符串转换为词向量表示,然后使用训练好的BiLSTM模型对识别出的字符串列表进行主体得分评估,选取Top-1作为识别主体。 模型部署模块:使用Paddle-Lite轻量化推理框架实现模型压缩和推理加速,并进行移动端的部署,并以此开发了PC端软件以及Android端APP应用。