siemens x
物聯(lián)網(wǎng)

圖形辨識(shí)與物聯(lián)網(wǎng)之發(fā)展將日趨密切

2025China.cn   2017年07月03日

  前言

  圖形識(shí)別(Pattern recognition,或稱模式識(shí)別),為透過計(jì)算機(jī)運(yùn)算技術(shù)方法達(dá)到圖形的自動(dòng)判讀之技術(shù)。影像在計(jì)算機(jī)中以數(shù)組的形式儲(chǔ)存與運(yùn)算,如三原色光模式(RGB),先將影像以不同色彩分層,以上述方法代表不同顏色后,再以相對(duì)位置分配顏色的強(qiáng)度數(shù)值。此外尚有印刷四分色模式(CMYK)、CIE 1931等色彩空間結(jié)構(gòu)。模型識(shí)別將代表影像的數(shù)組進(jìn)行數(shù)學(xué)算,利用機(jī)率、向量等特征模型,進(jìn)行特征選取或萃取、分類器設(shè)計(jì)以及系統(tǒng)辨識(shí)率測(cè)試,使得信息系統(tǒng)得以自動(dòng)化辨識(shí)輸入影像中的信息,將目標(biāo)信息主體與背景分離并轉(zhuǎn)換成所需之內(nèi)容,以利后續(xù)運(yùn)算。

  《圖一》國際照明協(xié)會(huì)

  《圖二》 識(shí)別辨識(shí)戰(zhàn)斗機(jī)機(jī)型樣本

 

  隨著信息科技的進(jìn)步,信息處理過程日趨復(fù)雜,應(yīng)用范疇也與日俱增,物聯(lián)網(wǎng)(IOT;Internet of Things)時(shí)代的來臨使得圖像處理需求增加,含有影像攝取鏡頭的硬設(shè)備越來越多,并融入各種生產(chǎn)制造、商業(yè)行為甚至日常生活,不同應(yīng)用的信息系統(tǒng)漸漸倚靠自動(dòng)化影像辨識(shí)技術(shù),完成各種新的應(yīng)用。

  當(dāng)今常見的代表性技術(shù)如字符識(shí)別(OCR;Optical Character Recognition),將文字影像進(jìn)行處理,抽取主要表達(dá)特征并將特征模型紀(jì)錄,比對(duì)實(shí)際輸入影像后,依邏輯與機(jī)率轉(zhuǎn)換成字符串形式,供系統(tǒng)進(jìn)行后續(xù)處理,如車牌辨識(shí)系統(tǒng),將各種車輛的影像做為系統(tǒng)輸入,以特征匹配辨識(shí)車牌字符后,即可進(jìn)行如計(jì)費(fèi)、安全控管、疑車追蹤等應(yīng)用。某些系統(tǒng)結(jié)合甚至機(jī)器學(xué)習(xí)等算法,透過訓(xùn)練,能自動(dòng)修正模型提升準(zhǔn)確率。拜計(jì)算機(jī)運(yùn)算之速度快、準(zhǔn)確性高、效率高特性之賜,此技術(shù)能逐步取代人工操作行為,目前常用于醫(yī)療判讀、聲紋辨識(shí)、車輛監(jiān)控計(jì)費(fèi)、個(gè)人安全等信息系統(tǒng),應(yīng)用范疇仍隨著時(shí)間快速擴(kuò)展中。

  《圖三》文字識(shí)別辨識(shí)標(biāo)的不同角度的樣本

 

  圖形辨識(shí)的流程

  圖形辨識(shí)流程可以分為特征表現(xiàn)、特征萃取、分類器設(shè)計(jì)以及系統(tǒng)辨識(shí)率測(cè)試幾個(gè)步驟。在特征表現(xiàn)步驟將數(shù)據(jù)之特征量化取出,再借助特征萃取找出較具分類效果的特征,限縮數(shù)據(jù)維度。再根據(jù)數(shù)據(jù)是否包含先前取得并選取之類別信息以與應(yīng)用面考慮采用分群法或分類法來進(jìn)行分類器設(shè)計(jì),產(chǎn)生分類函數(shù),最后依測(cè)試數(shù)據(jù)來驗(yàn)證該系統(tǒng)準(zhǔn)確率,了解分類函數(shù)是否完善等個(gè)步驟之準(zhǔn)確性,逐一優(yōu)化。

  圖形辨識(shí)的相關(guān)技術(shù)

  圖形偵測(cè)(detection)技術(shù),如線條偵測(cè)、臉部偵測(cè)等,偵測(cè)一個(gè)物體在一個(gè)圖像中的表現(xiàn),線條偵測(cè)即偵測(cè)影像中是否含有符合條件的直線;臉部偵測(cè)則欲在影像中偵測(cè)人臉。Hough Transform(霍式轉(zhuǎn)換)為此技術(shù)之經(jīng)典算法,將圖形轉(zhuǎn)換成特征空間,再由投票選取圖形。圖形辨識(shí)(recognition)則是要判斷影像中物體所屬條件,相對(duì)于偵測(cè),以人臉為例,偵測(cè)的目的為標(biāo)記出人臉位置,辨識(shí)則是能進(jìn)一步的認(rèn)出這是屬于哪個(gè)人物的人臉。圖形偵測(cè)主要鉆研偵測(cè)速度以及對(duì)于噪聲的敏感度,而辨識(shí)則討論復(fù)雜環(huán)境中對(duì)應(yīng)不同結(jié)果的方法。相較于圖形偵測(cè)除定位與判斷欲偵測(cè)的對(duì)象是否存在外,圖形辨識(shí)因能判斷出圖形中存在對(duì)象的其他特性,應(yīng)用更為多廣。

  至于辨識(shí)時(shí)的分類方法,多源自于機(jī)率上的理論,如貝氏定理(Bayes' theorem)、主成分分析(PCA;Principal component analysis)、線性識(shí)別分析(LDA;Latent Dirichlet allocation)、支持向量機(jī)(SVM;Support Vector Machine)、類神經(jīng)網(wǎng)絡(luò)Neural Network等,研究將辨識(shí)對(duì)象進(jìn)行分類并優(yōu)化。

  結(jié)論

  智能家居、數(shù)字安全監(jiān)控、個(gè)人裝置安全控管等議題一直是物聯(lián)網(wǎng)的熱門討論內(nèi)容,車牌辨識(shí)、街道影像系統(tǒng)、移動(dòng)裝置應(yīng)用等熱門技術(shù)亦需要成熟的影像辨識(shí)技術(shù),任何需要針對(duì)圖形中的對(duì)象(如用戶、車輛、文件等)進(jìn)行萃取的系統(tǒng)均能看到圖形辨識(shí)的技術(shù)實(shí)作。因圖形辨識(shí)可應(yīng)用之領(lǐng)域相當(dāng)廣泛,在物聯(lián)網(wǎng)發(fā)展的同時(shí),圖形辨識(shí)的技術(shù)仍同樣在進(jìn)步中,各種圖形辨識(shí)算法均有擅長(zhǎng)的辨識(shí)對(duì)象目標(biāo),優(yōu)良的圖形辨識(shí)算法須結(jié)合不同領(lǐng)域之知識(shí),開發(fā)者熟悉辨識(shí)對(duì)象的各種外顯特性,以及動(dòng)態(tài)行為,并且不斷設(shè)計(jì)修改算法內(nèi)容,方能設(shè)計(jì)出最適宜的辨識(shí)與分類算法,提升準(zhǔn)確率。對(duì)于跨領(lǐng)域之技術(shù)人才如醫(yī)療與信息;工業(yè)設(shè)計(jì)與信息;機(jī)械與信息等,同時(shí)具有辨識(shí)對(duì)象與辨識(shí)算法知識(shí)的人才,將能在這一波躍進(jìn)中提供更多見解、嶄露頭角。

(轉(zhuǎn)載)

標(biāo)簽:物聯(lián)網(wǎng) 我要反饋 
2024世界人工智能大會(huì)專題
即刻點(diǎn)擊并下載ABB資料,好禮贏不停~
優(yōu)傲機(jī)器人下載中心
西克
2024全景工博會(huì)
專題報(bào)道