视障者智能阅读辅助系列产品

行业:专用仪器仪表制造

成熟度:正在研发

项目简介

该科技成果在信息技术的辅具集成应用、嵌入式系统的低功耗设计、印刷文字的复杂版面分析等方面形成了主要技术创新点。


创新点1:集成创新,研制出基于拍照式、可便携、多功能的阅读辅具,为视障者无障碍获取信息提供了有效的手段。该成果根据盲人和低视力者阅读特点和功能需求,研究了拍照方式的印刷文字信息获取、处理、识别技术,嵌入式环境下字符识别及语音合成技术,盲用定位导航技术,综合应用这些技术,通过设计高效、低功耗的嵌入式系统,研制出基于拍照式、可便携,多功能的阅读辅具。本成果集成了文本图像获取模块、图像处理模块、文字识别模块、语音合成模块、发音模块、存储管理模块和电源控制模块,能够准确、快速、方便地将获取的文本图像信息转化成语音信息,文字识别正确率达95%以上,朗读语气自然流畅。


创新点2:高效低功耗设计,节能模式的电源管理技术和紧凑型系统设计,解决了智能阅读辅助器具的便携性、高效低功耗特性、通用性等问题。本成果对图像和文本数据传输过程进行了低功耗设计,提出了新的LP-RSA算法,通过提前检测误码数的分布情况,能够快速进行运算和求解,控制不必要参与运算的电路模块休眠状态,节约大量电路翻转带来的功耗。本成果研究了根据时间差确定设备的使用率,通过设备的请求信息计算设备的利用率,当不使用I/O设备时,系统进入低能耗的睡眠状态,当1/0设备处于使用状态时,系统内核考察设备与进程之间的关系,评估设备利用率,当利用率低时,让其进入低能耗状态,用应用程序来响应将来的设备的请求,OS在不降低性能指标的情况下,通过调用相应的进程来实现节能,具有技术创新型。


创新点3:复杂版面分析,研究复杂印刷版面校正、分析、识别方法,解决了提高复杂版面的阅读识别率问题,具有技术创新性。取得多项发明


专利:

***纸张的检测方法(20***99106.X);

基于OCR识别反馈的文本文***方法(2011***59.X);

一种工程实用的快速灰度算法(20***1047.4)


本成果考虑复杂环境因素对文字识别准确率的影响,通过研究新的智能化、高效的图像预处理算法,解决光照不均、倾斜、透视变形、扭曲变形、桶形失真以及背景不均匀等问题,保证该阅读辅具具有稳定的识别率。成果针对拍照采集图像的过程中由于光照不均而造成的文本图像的噪声问题,提出了一种基于文本图像的投影结合分块形态学的快速去噪方法,对文本图像二二值化后进行投影处理,根据对投影结果进行分析来快速去除行列间噪声,根据行列间噪声的多少产生一一个阈值,通过这个阈值采用形态学滤波法进行字符内去噪则,该方法对于光照不均的文本图像的去噪较传统的去噪算法效果更好。成果针对文本文档扭曲造成的扭曲图像OCR识别率低的问题,提出了--种针对扭曲文本文档的自动配准方法,对输入的文本图像提取文本线,根据统计学原理去除误差较大的样本点并使用最小二乘法拟合抛物线,通过拟合的抛物线判断扭曲文本线的扭曲方向计算出拐点,之后通过仿射变换合成恢复较好质量的图像。


科技成果领域:

image.pngimage.png

产品1:该成果产生了一-种基于拍照式的、可便携的、具有纸书阅读、电子图书、语音记事、定位导航、网络下载、语

音播放等多种功能的阅读辅具,如图1所示。该科技成果采用新型硬件设计方案与装置,提高了系统实时处理速度、降低能耗、并满足视障者的特殊操作需求。通过代码优化提高了信息处理速度;通过电源管理设计,降低系统能耗;通过电路的优化设计缩小阅读辅具的尺寸。使用者可以

通过“盲”操作--次性准确采集到整张A4纸上的印刷文字,并且在40秒之内自动完成从印刷文字采集到语音输出的转换流程。研制的便拍照式便携多功能视障者阅读辅助器具,填补了国内空白。


产品2:该科技成果产生的第二款产品是台式助视仪。台式助视仪是一款辅助阅读装置,通过USB接口与电脑连接。具有图文物高倍放大、文字识别、语音朗读、网页放大朗读等功能,是弱视者及老年人的阅读助手,如图2所示。


该产品的主要功能如下:

文字识别:可识别印刷文字并放大显示及朗读,文字放大倍数及语音朗读速度可调、文字可自动滚动显示。5号字体及以上的识别率高于95%,识别速度<5秒。

实物助视:可将实物及文字实时放大显示,显示模式包括彩色图像、灰度图像和二值化图像三种、图像亮度和对比度可调节、并可以保存图像。图像分辨率最高为500万像素。

网页浏览:可将网页放大浏览、并将其中文字识别朗读。朗读范围包括链接文字及文本中的文字(目前需安装IE7以上浏览器版本)。

电子阅读:可以将电子文档(txt、word文件)中的文字放大、自动滚动及朗读。文字和背景颜色以及文字字体可由用户选择。

图片管理:可将事先保存的BMP和JPG图片放大显示以及图片中的文字识别及朗读。


该产品的主要技术指标如下:

被拍物的放大倍数最大为20倍。

鼠标的放大倍数最大为3倍。

所有功能菜单及鼠标右键菜单均大字显示。

所有操作有语音提示。

有鼠标操作(低视力)和键盘操作(盲人)两套操作模式。

极简化操作设计,识别及发声流程“-键OK"。

目前该产品基本成熟,在北京市盲人学校和北京同仁医院进行试用与测试,取得良好的应用效果,获得广泛好评。该产品定位于广大视障弱势群体,产品适应面广,可有效改善和提高视障人士获取信息能力。