无码成人A片在线观看,性欧美videofree高清变态,中文字幕有码无码av,国产无人区卡一卡二扰乱码 ,最近高清日本免费

您現(xiàn)在的位置: 通信界 >> 接入系統(tǒng) >> 技術(shù)正文  
 
基于SoPC的嵌入式文字識別系統(tǒng)設(shè)計[圖]
[ 通信界 / 《電子技術(shù)應(yīng)用》2011年第9期 / www.k-94.cn / 2011/12/6 11:10:45 ]
 

摘要:設(shè)計了一種基于SoPC的嵌入式文字識別系統(tǒng)。在FPGA平臺下,基于SoPC框架搭建軟硬件協(xié)同系統(tǒng),設(shè)計硬件電路完成文字圖像的采集和預(yù)處理,嵌入Linux系統(tǒng),使用其下的識別引擎完成文字圖像的識別。采用Altera公司的SoPC builder構(gòu)建系統(tǒng)框架,Quartus II完成硬件電路的設(shè)計,在宿主機Linux環(huán)境下完成了軟件部分的交叉編譯并嵌入到FPGA平臺。整體設(shè)計在DE2-70開發(fā)板上完成了系統(tǒng)驗證。

計算機文字識別也被稱為光學文字識別[1]OCR(Optical Character Recognition),在智能計算機和辦公自動化領(lǐng)域有著極其重要的應(yīng)用。文字識別的基本原理是通過諸如照相機、掃描儀等圖像輸入設(shè)備獲取文字圖片,經(jīng)過圖像處理后使用光學模式判別等算法分析文字圖片,最后將判斷出的文字編碼儲存起來從而完成文字識別。

文字識別設(shè)備對識別速度要求較高,因此圖像采集和預(yù)處理的速度十分關(guān)鍵。同時對識別率要求高,識別字體種類多,因此選用帶學習功能的軟件引擎非常重要。另外系統(tǒng)需要交互界面和大量外圍設(shè)備的驅(qū)動,因此需要引入操作系統(tǒng)以方便設(shè)計開發(fā)。

1 SoPC系統(tǒng)設(shè)計

系統(tǒng)功能設(shè)計的整體方案如圖1所示。各部分功能介紹如下:

基于SoPC的嵌入式文字識別系統(tǒng)設(shè)計

(1)圖像采集功能,通過外接的攝像頭模塊完成圖像的采集;
     (2)由硬件模塊完成文字圖像預(yù)處理功能,能夠?qū)Σ杉奈淖謭D像進行傾斜糾正[2]、圖像分割[3]、二值化[4]等處理,保證系統(tǒng)的性能和速度,以提高后續(xù)的文字識別率;
     (3)文字圖像識別功能,能夠?qū)⑽淖謭D像中的文字識別出來并保存在TXT中;
     (4)識別結(jié)果的存儲和發(fā)送功能,能夠?qū)⒆R別結(jié)果文件存入SD卡或U盤中,或者通過網(wǎng)絡(luò)發(fā)送給上位機;
     (5)交互界面功能:能夠通過LCD模塊或者外接的VGA設(shè)備等輸出設(shè)備以及鍵盤、觸摸屏或者鼠標等輸入設(shè)備與使用者交互。

整個系統(tǒng)由一塊FPGA和攝像采集、輸入輸出等外圍設(shè)備組成。FPGA硬件模塊完成攝像采集控制和圖像預(yù)處理,CPU作為系統(tǒng)主控控制外設(shè)和硬件模塊的數(shù)據(jù)流。文字識別模塊和外圍設(shè)備驅(qū)動在Linux平臺上進行開發(fā)或移植。

本文采用Altera Cyclone2系列的FPGA,通過Altera提供的SoPC技術(shù),可以將Nios Ⅱ軟核處理器和外圍設(shè)備接口IP通過Avalon總線連接起來,并集成在一塊FPGA上。圖2是系統(tǒng)的SoPC設(shè)計。

基于SoPC的嵌入式文字識別系統(tǒng)設(shè)計

2 系統(tǒng)硬件設(shè)計

文字識別硬件設(shè)計主要包括文字圖像的采集控制和文字圖像的預(yù)處理。文字圖像的預(yù)處理又分為邊緣檢測、傾斜糾正、文字區(qū)域提取、二值化。硬件模塊總體設(shè)計圖如圖3所示。

基于SoPC的嵌入式文字識別系統(tǒng)設(shè)計

對于待識別的文字圖像,影響文字識別準確率的不僅僅是后端引擎的性能,更重要的是文字圖像的質(zhì)量和實際使用的文字圖像,除了光照不均勻且有傾斜外,還會有不少干擾信息。因此,本設(shè)計選取傾斜糾正、文字圖像分割、二值化等預(yù)處理方法來減少干擾因素,保證后續(xù)文字識別的質(zhì)量。本設(shè)計的處理方法概括如下:

(1)圖像邊緣就是圖像中灰度發(fā)生急劇變化的地方。本設(shè)計采用一階導(dǎo)數(shù)的Sobel算子的邊緣檢測算法可以滿足設(shè)計的需要。本設(shè)計中將最后得到的梯度值簡化為水平方向梯度絕對值和垂直方向梯度絕對值之和。求出梯度后采用基本全局門限:當某像素點(x,y)的梯度值大于或等于設(shè)定的門限T時,規(guī)定該點的像素值為1,反之則為0。

(2)文字圖像傾斜糾正包括傾斜角計算和圖像旋轉(zhuǎn),即將拍攝中獲取的傾斜圖像根據(jù)傾斜角度進行旋轉(zhuǎn),最后得到校正后的圖像。本設(shè)計采用基于Hough的變換來計算傾斜角。基本原理是通過找出圖像中通過最多點的直線,即為圖像的傾斜角。變換中,將二維圖像中的點通過極坐標系表示,而平面坐標系中一條直線上的所有點對應(yīng)的極坐標系曲線交于極坐標系中唯一一點(ρ,θ),因此,只需要尋找極坐標系中最大值即可。

(3)文字圖像的分割可以提取文字信息區(qū)域以減少背景等干擾,同時,由于圖像區(qū)域的減少,對于光照不均勻也有一定的改善。本設(shè)計根據(jù)文字圖像的具體特點設(shè)計分割方法,首先將經(jīng)過傾斜糾正的文字圖像通過邊緣檢測算法得到邊緣檢測圖片;后通過逐行和逐列掃描確定行和列的閾值;接著對所有符合閾值的區(qū)域進行分析,相隔較近的區(qū)域進行聯(lián)通,從而確定最終的分割區(qū)域。最后根據(jù)分割區(qū)域?qū)υ瓐D進行圖像分割。

(4)經(jīng)過傾斜糾正和圖像分割后得到的文字圖像仍有光照不均勻和噪聲的影響,因此需要進行二值化處理。對圖像進行二值化不僅能提高文字識別的精度,對后端引擎的識別速度也有不少的幫助?紤]到實際拍攝的圖片光照不均勻的程度較高,使用全局或者混合二值化的效果都不理想,且考慮到硬件實現(xiàn)等因素,本設(shè)計采取局部閾值二值化。

3 系統(tǒng)軟件設(shè)計

本設(shè)計軟件部分基于嵌入式Linux。首先在NiosⅡ處理器中植入嵌入式Linux;然后在Linux內(nèi)核中配置外圍設(shè)備驅(qū)動并加入一些自定義的設(shè)備驅(qū)動;最后基于Linux移植或者開發(fā)交互界面、文字識別引擎等。另外,還需要移植bootloader,系統(tǒng)啟動后,bootloader將Linux內(nèi)核搬到SDRAM中運行,從而實現(xiàn)系統(tǒng)開機自啟動的功能。

整體流程是:首先將bootloader和Linux內(nèi)核下載進入Flash,同時設(shè)定復(fù)位地址為Flash中內(nèi)核bootloader的入口地址。系統(tǒng)啟動時先啟動bootloader,初始化外圍設(shè)備,并通過串口打印輸出信息,同時將Linux內(nèi)核搬運到SDRAM進行解壓。Linux內(nèi)核解壓完成后內(nèi)核啟動。只是Linux初始化所有的外圍硬件設(shè)備,啟動nano-X圖形接口和nano-wm窗口管理器和基于FLTK的交互界面。交互界面上是各種的按鈕選擇,包括圖片瀏覽、圖像采集、文本瀏覽編輯、網(wǎng)絡(luò)連接及文字識別等應(yīng)用程序的按鈕。當按鍵選擇各種功能后會進入相應(yīng)的功能模塊。當程序運行完成后通過選擇返回按鈕再次進入到交互界面的按鍵選擇部分。

4 系統(tǒng)功能驗證

將硬件信息配置進入FPGA,同時通過Flashprogrammer將bootloader和Linux下載到Flash。Linux內(nèi)核啟動完成后,調(diào)用交互界面程序,系統(tǒng)可以通過鼠標鍵盤進行輸入操作,通過VGA輸出交互界面。此外,可通過串口對系統(tǒng)進行調(diào)試并看到打印出來的系統(tǒng)信息。

本設(shè)計通過NiosⅡ控制圖像采集模塊,通過DE2-70開發(fā)板上的開關(guān)可以調(diào)節(jié)曝光,采集回的圖像通過NiosⅡ?qū)懭隨D卡,用來驗證圖像采集模塊的功能。開發(fā)板和攝像頭通過支架固定在文字識別區(qū)域上方。實際采集的效果滿足應(yīng)用需求。

由于受DE2-70開發(fā)板上SDRAM大小的限制,本設(shè)計Tesseract引擎的數(shù)據(jù)文件不能太大。因此先使用默認引擎進行英文的識別,然后用拍攝的幾幅文字圖像對引擎進行訓練;再使用經(jīng)過訓練的引擎對圖像進行識別。最終的圖像識別結(jié)果存入SD卡中。文字識別的效果圖如圖4所示。

基于SoPC的嵌入式文字識別系統(tǒng)設(shè)計

圖4(a)是默認引擎的識別效果圖,圖4(b)是經(jīng)過訓練的引擎識別效果圖。通過對比可以看出,未經(jīng)訓練的識別效果錯誤率高達18.59%,而經(jīng)過訓練的引擎識別效果明顯好于默認引擎識別的結(jié)果,錯誤率僅為7.7%。但是在一些圖像偽影和不連續(xù)處,兩個引擎都出現(xiàn)了不同程度的錯誤。其原因在于目前的文字識別理論還尚未成熟,難以達到百分之百的文字識別精確度。

本文通過硬件電路完成文字圖像采集和文字圖像預(yù)處理,嵌入式軟件完成文字識別,實現(xiàn)了一種基于SoPC的嵌入式文字識別系統(tǒng)。此設(shè)計中構(gòu)建了完整的SoPC系統(tǒng),嵌入了Linux操作系統(tǒng),通過軟硬件協(xié)同充分發(fā)揮各自的優(yōu)點,達到了較好的文字識別效果。

參考文獻

[1] 盛蹇,劉偉.計算機文字識別的發(fā)展及應(yīng)用[J].科技信息,2008(13).
     [2] 王希常,劉江.一種掃描文檔圖像的快速糾偏算法設(shè)計[A].2010 Third International Conference on Education  Technology and Training,2010.
     [3] 瞿燕慧.圖像分割常用算法優(yōu)缺點探析[J].科教新報(教育科研),2010(3).
     [4] GUPATAMR,JACOBSONMR,GARCIAEK.舊式文本的OCR二值化和圖像預(yù)處理研究[J].章晟(譯).圖像識別與自動化,2007(1).

 

作者:《電子技術(shù)應(yīng)用》2011年第9期 合作媒體:《電子技術(shù)應(yīng)用》2011年第9期 編輯:顧北

 

 

 
 熱點技術(shù)
普通技術(shù) “5G”,真的來了!牛在哪里?
普通技術(shù) 5G,是偽命題嗎?
普通技術(shù) 云視頻會議關(guān)鍵技術(shù)淺析
普通技術(shù) 運營商語音能力開放集中管理方案分析
普通技術(shù) 5G網(wǎng)絡(luò)商用需要“無憂”心
普通技術(shù) 面向5G應(yīng)運而生的邊緣計算
普通技術(shù) 簡析5G時代四大關(guān)鍵趨勢
普通技術(shù) 國家網(wǎng)信辦就《數(shù)據(jù)安全管理辦法》公開征求意見
普通技術(shù) 《車聯(lián)網(wǎng)(智能網(wǎng)聯(lián)汽車)直連通信使用5905-5925MHz頻段管理規(guī)定(
普通技術(shù) 中興通訊混合云解決方案,滿足5G多元業(yè)務(wù)需求
普通技術(shù) 大規(guī)模MIMO將帶來更多無線信道,但也使無線信道易受攻擊
普通技術(shù) 蜂窩車聯(lián)網(wǎng)的標準及關(guān)鍵技術(shù)及網(wǎng)絡(luò)架構(gòu)的研究
普通技術(shù) 4G與5G融合組網(wǎng)及互操作技術(shù)研究
普通技術(shù) 5G中CU-DU架構(gòu)、設(shè)備實現(xiàn)及應(yīng)用探討
普通技術(shù) 無源光網(wǎng)絡(luò)承載5G前傳信號可行性的研究概述
普通技術(shù) 面向5G中傳和回傳網(wǎng)絡(luò)承載解決方案
普通技術(shù) 數(shù)據(jù)中心布線系統(tǒng)可靠性探討
普通技術(shù) 家庭互聯(lián)網(wǎng)終端價值研究
普通技術(shù) 鎏信科技CEO劉舟:從連接層構(gòu)建IoT云生態(tài),聚焦CMP是關(guān)鍵
普通技術(shù) SCEF引入需求分析及部署應(yīng)用
  版權(quán)與免責聲明: ① 凡本網(wǎng)注明“合作媒體:通信界”的所有作品,版權(quán)均屬于通信界,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:通信界”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責任。 ② 凡本網(wǎng)注明“合作媒體:XXX(非通信界)”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。 ③ 如因作品內(nèi)容、版權(quán)和其它問題需要同本網(wǎng)聯(lián)系的,請在一月內(nèi)進行。
通信視界
華為余承東:Mate30總體銷量將會超過兩千萬部
趙隨意:媒體融合需積極求變
普通對話 苗圩:建設(shè)新一代信息基礎(chǔ)設(shè)施 加快制造業(yè)數(shù)字
普通對話 華為余承東:Mate30總體銷量將會超過兩千萬部
普通對話 趙隨意:媒體融合需積極求變
普通對話 韋樂平:5G給光纖、光模塊、WDM光器件帶來新機
普通對話 安筱鵬:工業(yè)互聯(lián)網(wǎng)——通向知識分工2.0之路
普通對話 庫克:蘋果不是壟斷者
普通對話 華為何剛:挑戰(zhàn)越大,成就越大
普通對話 華為董事長梁華:盡管遇到外部壓力,5G在商業(yè)
普通對話 網(wǎng)易董事局主席丁磊:中國正在引領(lǐng)全球消費趨
普通對話 李彥宏:無人乘用車時代即將到來 智能交通前景
普通對話 中國聯(lián)通研究院院長張云勇:雙輪驅(qū)動下,工業(yè)
普通對話 “段子手”楊元慶:人工智能金句頻出,他能否
普通對話 高通任命克里斯蒂安諾·阿蒙為公司總裁
普通對話 保利威視謝曉昉:深耕視頻技術(shù) 助力在線教育
普通對話 九州云副總裁李開:幫助客戶構(gòu)建自己的云平臺
通信前瞻
楊元慶:中國制造高質(zhì)量發(fā)展的未來是智能制造
對話亞信科技CTO歐陽曄博士:甘為橋梁,攜"電
普通對話 楊元慶:中國制造高質(zhì)量發(fā)展的未來是智能制造
普通對話 對話亞信科技CTO歐陽曄博士:甘為橋梁,攜"電
普通對話 對話倪光南:“中國芯”突圍要發(fā)揮綜合優(yōu)勢
普通對話 黃宇紅:5G給運營商帶來新價值
普通對話 雷軍:小米所有OLED屏幕手機均已支持息屏顯示
普通對話 馬云:我挑戰(zhàn)失敗心服口服,他們才是雙11背后
普通對話 2018年大數(shù)據(jù)產(chǎn)業(yè)發(fā)展試點示范項目名單出爐 2
普通對話 陳志剛:提速又降費,中國移動的兩面精彩
普通對話 專訪華為終端何剛:第三代nova已成為爭奪全球
普通對話 中國普天陶雄強:物聯(lián)網(wǎng)等新經(jīng)濟是最大機遇
普通對話 人人車李。航衲臧l(fā)力金融 拓展汽車后市場
普通對話 華為萬飚:三代出貴族,PC產(chǎn)品已走在正確道路
普通對話 共享退潮單車入冬 智享單車卻走向盈利
普通對話 Achronix發(fā)布新品單元塊 推動eFPGA升級
普通對話 金柚網(wǎng)COO邱燕:天吳系統(tǒng)2.0真正形成了社保管