機器視覺表面缺陷檢測

機器視覺表面缺陷檢測

機器視覺表面缺陷檢測


資料來源: https://mp.weixin.qq.com/s?__biz=MzIxOTczOTM4NA==&mid=2247488162&idx=2&sn=f7247ac8cb35df96cc9b3afd025bee22&chksm=97d7f735a0a07e23690c75a2a8b230e4c21805117bf6f15d525e69f1fdc54bba558249e27796&scene=0&xtrack=1&key=a63109c5a100aa9c29d28d70d02394aad82cd7e0efab630d6cd4c3d3ef81eb940e8402dce46ab961524a8b4467868ee082b841bcedb3c9ec11783b5676c171be4d4b16545c9133b75b7d18bc2e3436c1&ascene=1&uin=MjIwODk2NDgxNw%3D%3D&devicetype=Windows+10&version=62060833&lang=zh_TW&pass_ticket=Kt%2FTySA8%2FBr5BHSl25h02VWS6yV%2BVmtKFwIL4ccXa0QtegGyTNn5GJsXEUPYi9YA


2 表面缺陷檢測圖像處理和分析算法

    2.1 圖像預處理算法
        工業現場採集的圖像通常包含噪聲,圖像預處理主要目的是減少噪聲,改善圖像的質量,使之更適合人眼的觀察或機器的處理。圖像的預處理通常包括空域方法和頻域方法,其算法有灰度變換、直方圖均衡、基於空域和頻域的各種濾波算法等,其中直觀的方法是根據噪聲能量一般集中於高頻,而圖像頻譜則分佈於一個有限區間的這一特點,採用低通濾波方式進行去噪,例如滑動平均窗濾波器、Wiener線性濾噪器等。上述各種濾波方法中,頻域變換複雜,運算代價較高;空域濾波算法採用各種模闆對圖像進行卷積運算。直接灰度變換法通過對圖像每一個像素按照某種函數進行變換後得到增強圖像,變換函數一般多采用線性函數、分段線性函數、指數函數、對數函數等,運算簡單,在滿足處理功能的前提下實時性也較高。近年來,數學形態學方法[ 43 – 44 ]、小波方法[ 45 – 47 ]用於圖像的去噪,取得了較好的效果。

        
        
    2.2 圖像分割算法
        圖像的分割是把圖像陣列分解成若干個互不交迭的區域,每一個區域內部的某種特性或特徵相同或接近,而不同區域間的圖像特徵則有明顯差別。它是由圖像處理到圖像分析的關鍵步驟。現有的圖像分割方法主要分為基於閾值的分割方法、基於區域的分割方法、基於邊緣的分割方法以及基於特定理論的分割方法等。近年來,研究者不斷改進原有的圖像分割方法並把其他學科的一些新理論和新方法用於圖像分割,提出了不少新的分割方法。圖像分割後提取出的目標可以用於圖像語義識別、圖像搜索等領域。

    2.2.1 基於區域的分割算法
        基於區域的分割算法包括閾值分割法、區域生長法和聚類分割法等。

        閾值分割法是一種傳統的圖像分割方法,其基本原理是:通過設定不同的灰度閾值,把圖像像素點分為若干類。因其實現簡單、計算量小、性能較穩定而成為圖像分割中最基本和應用最廣泛的分割方法,其中閾值的選取是圖像閾值分割方法中的關鍵。

        關於閾值的確定方法,目前比較常用的有固定閾值法、自適應閾值法、多區域閾值法等。固定閾值分割算法實時性強,適用於圖像背景和目標灰度值區別明顯的情況;自適應閾值分割算法,適用於目標與背景的灰度值區別不明顯的情況;多區域閾值法,適用於目標與背景在不同區域區別較大的情況。

        Otsu提出了動態門限方法[ 48 ],它以目標和背景之間的方差最大來動態地確定圖像分割門限值,但當目標的相對面積較小時,此方法性能不佳。Pun和Kapur等人提出了利用最大先驗熵選取閾值的方法[ 49 – 50 ],從信息論的角度選擇閾值,在一定程度上克服了上述算法的缺點,但當圖像背景複雜時分割時容易喪失部分信息,且計算量較大。

        Yen等人提出了利用最大相關性原則取代常用的最大熵原則來選取閾值的方法[ 51 ],以及基於一維或2維直方圖的閾值方法[ 52 – 54 ]、最小誤判概率準則下的最佳閾值方法[ 55 ]在其後也被提出。

        區域生長法的基本思想是依據一定的生長準則,將若干個“相似”子區域聚合成較大的區域。它首先對每個需要分割的區域找到一個種子像素作為生長的起點,再將種子像素鄰域中與其具有相同或相似性質的像素根據某種事先確定的準則合併到種子像素所在的區域中;將這些新像素當作新的種子像素繼續像上面的操作,直到再沒有滿足條件的像素可包括進來。此法原理簡單,對於較均勻的連通目標有較好的分割效果;缺點是依賴於初始條件的選取,計算量較大,不適用於實時檢測。

        分裂—合併法也是一種基於區域的分割算法,其基本思想是:根據圖像和各區域的不均勻性,將圖像或區域分裂成新的子區域,再將包含相同內容的區域合併成新的較大區域,最後得到分割圖像。四叉樹分解是一種常用的分裂—合併法,其具體過程是:將圖像分成4塊大小相等的方塊,判斷每個小塊是否滿足一致性標準(如兩區域參數統計特徵結果相同,等等)。若滿足,則不再分解;若不滿足,則再細分成四塊,再用細分塊進行一致性標準檢查,直到滿足一致性標準,結果可能包含大小不同的塊。

        聚類法進行圖像分割是根據圖像在特徵空間的聚集對特徵空間進行分割,再映射到原圖像空間得到分割結果,K均值聚類算法、模糊C均值聚類(FCM)算法[ 56 – 57 ]是常用的聚類算法。

    2.2.2 基於邊緣的分割方法
        基於邊緣的分割方法其實就是根據圖像中局部特性的不連續性而採用某種算法來提取出圖像中的對象與背景間的交界線。

        邊緣處像素的灰度值不連續,這種不連續性可通過求導來檢測。經典的邊緣檢測算法一般採用微分的方法進行計算,常用的一階微分邊緣檢測算子有Robert算子、Sobel算子、Prewitt算子、Kirsch算子等幾種。一階微分算子方法計算簡便、速度快,但定位不准確。二階微分算子主要有Canny算子、Log算子、Laplacian算子,這類算子基於一階導數的局部最大值對應二階導數的零交叉點這一性質,通過尋找圖像灰度的二階導數的零交叉點從而定位邊緣。二階微分算子方法邊緣定位準確,但對噪聲敏感。對於噪聲污染的圖像,在進行微分算子邊緣檢測前一般先要濾波,但濾波的同時也使圖像邊緣產生一定程度的模糊。Marr算子將噪聲濾波與邊緣提取相結合,但當模板較小時抗噪性能不良,模板較大時計算費時。

    2.2.3 基於特定理論的分割方法
        隨著數學和人工智能的發展,出現了一些新的邊緣檢測方法,如數學形態學法、小波變換法、人工神經網絡法、遺傳算法、基於模糊理論的算法等。

        20世紀90年代初,Mallat在圖像多分辨分析理論的基礎上,提出了小波變換局部模極大值邊緣檢測方法[ 58 – 59 ],在噪聲圖像中取得了較好的邊緣檢測效果。後來,人們在Mallat理論框架下,提出了多尺度邊緣檢測方法[ 60 ]。多尺度邊緣檢測方法主要思想在較大的尺度下能對邊緣精確檢測,而在較小的尺度下能對邊緣點精確定位。小波變換的突出優點是其多分辨率,圖像的每個尺度的小波變換都提供了一定的邊緣信息。小波分析在時域和頻域都具有良好的局部化性質,可聚焦到對象的任意細節,是圖像處理領域的熱點。雖然人們提出了多種的邊緣檢測方法[ 61 – 62 ],但邊緣檢測時抗噪性和檢測精度的矛盾仍然是要研究的重點內容之一。

        基於數學形態學邊緣檢測方法[ 63 – 64 ]的基本思想是用具有一定形態的結構元素提取圖像中的對應形狀,以達到對圖像分析和識別的目的。採用多結構元素的數學形態學算法,既能提取細小邊緣,又能很好的抑制噪聲,結構元素選取靈活,但在靈活的同時也導致算法的適應性變差。

        近年來有一些新的研究手段如神經網絡、遺傳算法和小波方法等被引入到圖像分割的閾值選取中[ 65 – 69 ],其效果仍在探索之中。

        雖然有許多圖像分割的方法,這些算法的共性問題在於分割精度與抗噪性的矛盾,同時,高實時性處理算法的研究遠遠滯後於通用圖像處理算法的研究,應用於實際生產中的一些算法在準確性、實時性和可操作性上也還存在較大的困難。至今,圖像分割算法大都是針對具體問題所提出的,雖然每年都有新的圖像分割算法提出,但是並沒有一種通用的算法能適用於所有的圖像分割處理。

    2.3 特徵提取及其選擇算法
        圖像的特徵提取可理解為從高維圖像空間到低維特徵空間的映射,是基於機器視覺的表面缺陷檢測的重要一環,其有效性對後續缺陷目標識別精度、計算複雜度、魯棒性等均有重大影響。特徵提取的基本思想是使目標在得到的子空間中具有較小的類內聚散度和較大的類間聚散度。目前常用的圖像特徵主要有紋理特徵、顏色特徵、形狀特徵等。

    2.3.1 紋理特徵提取
        紋理是表達圖像的一種重要特徵,它不依賴於顏色或亮度而反映圖像的同質現象,反映了表面結構組織排列的重要信息以及它們與周圍環境的聯繫。與顏色特徵和灰度特徵不同,紋理特徵不是基於像素點的特徵,它需要在包含多個像素點的區域中進行統計計算,即局部性;同時,局部紋理信息也存在不同程度的重複性,即全局性。紋理特徵常具有旋轉不變性,並且對於噪聲有較強的抵抗能力。

        根據Tuceryan和Jain的分類,基於的紋理特徵提取方法有統計法、信號分析法、模型法、結構法和幾何法。

        1)統計法。統計方法將紋理看用隨機現象,從統計學的角度來分析隨機變量的分佈,從而實現對圖像紋理的描述。直方圖特徵是最簡單的統計特徵,但它只反映了圖像灰度出現的概率,沒有反映像素的空間分佈信息;灰度共生矩(GLCM)是基於像素的空間分佈信息的常用統計方法;局部二值模式(LBP)具有旋轉不變性和多尺度性、計算簡單;此外,還有行程長度統計法、灰度差分統計法等,因計算量大、效果不突出而限制了其應用。

        (1)直方圖特徵。圖像的直方圖提供了圖像的許多信息和特徵,常用的直方圖特徵有最大值、最小值、均值、中值、值域、熵、方差和熵等。此外,直方圖對比統計特徵,如L1範數、L2範數、Bhattacharyya距離、Matusita距離、歸一化相關係統等,亦常用作統計特徵[ 70 ]。

        直方圖特徵方法計算簡單、具有平移和旋轉不變性、對顏色像素的精確空間分佈不敏感等,所以在表面檢測、缺陷識別得到不少應用。

        (2)灰度共生矩。Haralick等人[ 71 ]提出的灰度共生矩是一種廣泛應用的使用統計特徵來描述紋理的方法。灰度共生矩陣就是從圖像灰度級為的像素出發,統計與其距離為、灰度級為的像素同時出現的概率。一般取0°、45°、90°和135°這4個方向。灰度共生矩陣反映了圖像灰度關於方向、相鄰間隔、變化幅度的綜合信息,所以可以作為分析圖像基元和排列結構的信息。

        GLCM共有14種紋理特徵,文獻[ 72 – 74 ]研究了GLCM統計量的相關性並提出了更有效的紋理特徵量,但是文獻[ 75 ]認為僅有4個特徵,即對比度、相關性、能量(和同質性是不相關的,所以,為減少計算量,提高特徵分類精度,常取這4個特徵作為GLCM特徵。GLCM在圖像的紋理分析中佔有重要的地位,在特徵提取和缺陷檢測等方面有著廣泛的應用。

        (3) 局部二值模式(LBP)。局部二值模式最早由Ojala提出,它引入了紋理基元的思想,是一個簡單但非常有效的紋理運算符。LBP將各個像素與其附近的像素進行比較,並把結果保存為二進制數,即它用二進制位表達局部鄰域點與中心點的關係,所有鄰域點的二進制位用來描述局部結構信息的模式。

        LBP對諸如光照變化等造成的圖像灰度變化具有較強的魯棒性,所以局部二值模式算法已廣泛應用於表面缺陷檢測,同時,在指紋識別、光學字符識別、人臉識別及車牌識別等領域也有應用。由於LBP計算簡單,也可以用於實時檢測。

        目前出現了一些改進的LBP算法。Tan等人[ 76 ]提出了局部三值模式(LTP),即通過設定閾值將鄰域與中心相似的狀態作為中間狀態,從而將擴展局部鄰域關係為三種狀態。在此基礎上,Nanni等人[ 77 ]將局部關係擴展到四種狀態。也有學者將LBP由傳統的2維特徵改進到3維特徵主要用於視頻分析[ 78 – 80 ]。此外,有學者將LBP表達的局部信息與其他信息或算法結合構成聯合特徵量,如Tan等人[ 81 ]聯合LBP特徵和Gabor小波特徵進行人臉的識別,Huang等人[ 82 ]將LBP和SIFT算法結合用於人臉的3維識別。賀永剛[ 83 ]提出了一種多結構的局部二值模式,該算法結合各向同性採樣和各向異性採樣對局部二值模式進行擴展,利用圖像金字塔提取紋理圖像的微結構和宏結構信息。

        (4) 自相關函數法。自相關函數法從圖像的自相關函數提取紋理特徵,即通過對圖像的能量譜函數的計算,提取紋理的粗細度及方向性等特徵參數。對於規則紋理圖像,因其自相關函數具有波峰和波谷,故可用其進行表面檢測,但自相關函數法不適用於不規則紋理圖像。

        2)信號處理法。將圖像當作2維分佈的信號,從而可從信號濾波器設計的角度對紋理進行分析。信號處理方法也稱濾波方法,即用某種線性變換、濾波器(組)將紋理轉到變換域,然後應用相應的能量準則提取紋理特徵。基於信號處理的方法主要有傅里葉變換、Gabor濾波器、小波變換、Laws紋理、LBP紋理等。

        (1)傅里葉變換方法。傅里葉變換是基於頻率的分析方法,20世紀70年代以來,有學者提出通過傅里葉濾波器來描述紋理。傅里葉變換將圖像變換到頻率域上使用頻譜能量或頻譜熵等特徵來表達紋理。Rao和Lohse開展了基於人的感知的紋理研究,指出週期性、方向性以及隨機性是表徵紋理的3個重要因素[ 84 ]。紋理圖像在空間分佈上具有一定的周期性,其功率譜具有離散性和規律性;對於方向性紋理,方向性會在傅里葉頻譜中很好的保持;對於隨機性紋理,頻譜的響應分佈並不限製到某些特定的方向。

        根據相對於頻率中心位置距離的頻譜分佈情況,可以大致判斷紋理圖像的相對粗糙程度。對於粗糙紋理,其紋理基元尺寸較大,圖像的低頻信號較多,功率譜的能量主要集中在離頻率中心位置較近的低頻區域;相反,對於基元尺寸較小的細緻紋理,圖像含有的高頻信息較多,功率譜的能量分佈較為分散,主要集中在距離頻率中心位置較遠的高頻區域。但是,傅里葉變換作為一種全局性的變化,仍有一定的局限性,如不具備局部化分析能力、不能分析非平穩信號等。

        (2) Gabor濾波方法。儘管傅里葉變換在信號頻域分析中有著重要作用,但它只能對整個時間段的信號的頻率進行分析,沒有信號的空間局部信息的刻畫能力,如當需要對局部的圖像紋理細節進行分析時,傅里葉變換無能為力。為克服傅里葉變換不能局部化分析的缺點,短時窗口傅里葉變換(STFT)被提出,它通過在變換時增加一個窗函數來實現,當窗函數是Gaussian函數時,即得到Gabor變換。

        Gabor濾波方法模擬了人類視覺感覺特性,具有很好的頻率選擇性和方位選擇性。使用Gabor濾波器提取紋理特徵的主要過程是:先設計濾波器,再從其輸出結果中提取特徵。濾波器設計包括單個濾波器參數的設計和濾波器組的佈局。濾波器的輸出結果可作為紋理特徵,但維數較高,為此,常採用斯平滑處理、Gabor能量特徵、复矩特徵、獨立成分分析等後處理方法以降低特徵集的數據量[ 85 ]。對於2維數字圖像,研究者們提出了2維Gabor函數形成的2維Gabor濾波器。

        自從Clark等人[ 86 ]首次將Gabor濾波方法用於紋理分析以來,很多研究人員開始用Gabor濾波器進行紋理特徵提取,進行表面缺陷的檢測[ 87 – 91 ]。國內叢家慧等人[ 92 ]利用Gabor濾波器具有頻率選擇和方向選擇的特性,有效提取了帶鋼表面缺陷的紋理特徵,為確定最佳濾波器參數,引入的評價函數使缺陷圖像和無缺陷圖像能量響應差別最大化。張學武等人[ 93 ]使用Gaussian金字塔分解和Gabor濾波器提取缺陷圖像特徵,合成特徵顯著圖基於視覺仿生機理進行銅帶錶面缺陷檢測,實現缺陷的正確分類。

        因窗函數決定空域的局部性,且Gaussian函數經傅里葉變換後仍為Gaussian函數,故Gabor變換在頻域上也是局部的。Gabor濾波器在紋理描述方面有著良好的效果,但存在計算量大的問題[ 94 ]。

        (3) 小波變換方法。傅里葉變換沒有局部分析能力,STFT雖然在一定程度上改善了這種局限性,但採用的的滑動窗函數一經選定就固定不變,故決定了其時頻分辨率固定不變,不具備自適應能力,而小波分析很好的解決了這個問題。小波變換(WT)是法國地質物理學家Morlet於1984年提出的,通過伸縮和平移等運算功能對函數或信號進行多尺度細化分析,達到高頻處時間細分,低頻處頻率細分,能自動適應時頻信號分析的要求,從而可聚焦到信號的任意細節。

        圖像紋理往往表現為多尺度特徵,對圖像進行小波分解後,得到不同分辨率的一系列圖像;不同分辨率的圖像由代表不同方向信息的一系列高頻子帶圖像構成,高頻子帶圖像反映了圖像的紋理特徵。

        傳統的金字塔小波變換僅對低頻部分進行了分解,而紋理圖像的高頻部分可能也含有重要的特徵信息,小波包分解或是樹結構小波分解則可克服這一缺點。小波變換方法提取圖像特徵以進行表面缺陷檢測已有大量的應用[ 95 – 98 ]。

        (4) Laws紋理。Laws模板的紋理描述方法通過使用簡單模板處理紋理圖像,從而對紋理圖像的特徵進行描述。它使用一組小的模闆對紋理圖像卷積,對卷積後的圖像的每一個像素的鄰域進行統計計算,將統計量作為對應像素的紋理特徵。

        3)結構法。結構法是建立在紋理基元理論基礎上的,認為複雜的紋理是由一些在空間中重複出現的最小模式即紋理基元執照一定的規律排列組成。結構方法主要有兩個重要問題:一是紋理基元的確定;二是紋理基元排列規律的提取。最簡單的紋理基元是單個的像素,也可以是圖像的灰度均質區域,此外,Vilnrotter等人[ 99 ]採用邊緣重複數組來提取基元,Hsu等人[ 100 ]利用自相關函數和小波變換係數提取基元,等等。確定基元後需要提取基元的特徵參數和紋理結構參數作為描述圖像紋理的特徵。基元的特徵參數有面積、周長、離心率、矩量等,結構參數則由基元之間的排列規律確定;基元的排列規則是基元的中心坐標及基元之間的空間拓撲關係,可從基元之間的模型幾何中得到,也可以通過基元之間的相位、距離等統計特徵中得到,較複雜的情況可以用句法分析、數學形態學等方法。

        採用結構方法提取圖像紋理特徵以進行表面缺陷檢測的研究並不少見,Wen等人[ 101 ]利用結構法提取圖像的邊緣特徵進行了皮革表面缺陷檢測,Goswami等人[ 102 ]基於激光檢測和形態學對織物疵點進行了檢測,或採用數學形態學操作對鋼板表面缺陷進行了檢測[ 103 ]。但是,結構法只適合於紋理基元較大且排列規則的圖像;對於一般的自然紋理,因其隨機性較強、結構變化大,難以用該方法來準確描述,此時一般要與其他方法聯合使用。

        4)模型法。模型法以圖像的構造模型為基礎,採用模型參數的統計量作為紋理特徵,不同的紋理在某種假設下表現為模型參數取值的不同,如何採用優化參數估計的方法進行參數估計是模型法研究的主要內容。典型的模型法有馬爾可夫隨機場(MRF)模型、分形模型和自回歸模型等。

        (1) MRF模型。隨機場模型法試圖以概率模型來描述紋理的隨機過程,實質上是描述圖像像素對其鄰域像素的統計依賴關係,常見的隨機場模型有Markov模型、Gibbs模型等。

        MRF模型將紋理圖像看用是一個隨機2維圖像場,並且假設像素的灰度級僅與鄰域內像素的灰度級有關,使用局部鄰域的條件分佈描述作為對應隨機場的局部特徵。MRF模型的優點是能將局部特性與全局特性聯繫起來,且有較好的抗噪性能。但基於Markov隨機場模型僅通過局部特徵很難得到全局的聯合分佈,Cohen [ 104 ]將Markov與高斯分佈聯繫起來,提出了使用高斯—馬爾可夫模型(GMRF,在檢驗過程中,被視為假設檢驗的問題源自高斯—馬爾可夫模型。

        (2) 分形模型。分形的概念是美籍數學家Mandelbrot首先提出的。很多自然圖像(如海岸線)其特徵是極不規則、極不光滑的,但所有海岸線在形貌上卻是自相似的,即局部形態和整體形態的相似。具有自相似性的形態廣泛存在於自然界中,Mandelbrot把這些部分與整體以某種方式相似的形體稱為分形。1975年,Mandelbrot創立了分形幾何學。在此基礎上,形成了研究分形性質及其應用的科學,稱為分形理論。

        Pentland [ 105 ]首次用分形有來描述紋理,認為自然界中的分形與圖像的灰度表示之間存在著一定的對應關係,指出分形維數是描述紋理的一個重要特徵。分形模型中如何確定分數維是描述紋理的重要問題,常用的算法有Keller的盒維數、Sarkar等人提出的差分計盒法等。分形模型主要適用於具有自相似性的自然紋理。

        徐科等人[ 106 ]將分形維數作為特徵量,利用Peleg毯覆蓋法計算圖像在不同尺度下的分形維數,通過尺度—分形維數曲線圖估計最優尺度,用於對熱軋帶鋼表面缺陷的自動識別,取得了良好的效果。李慶中等人[ 107 ]基於分形特徵進行水果缺陷快速識別研究,通過該方法提取的紋理特徵不受光照強度變化的影響,且具有平移、旋轉和縮放不變性。

        5)紋理特徵提取算法比較。上述紋理特徵提取方法各有其優缺點,總的看來,可以從以下幾個角度來估計其優勢和不足:計算的複雜度,是否利用了全局信息,是否具有多分辨特徵及是否與人類視覺感受一致。

        統計法方法簡單、易於實現,特別是GLCM方法具有較強的適應性和魯棒性;但缺少圖像的全局信息,紋理尺度間像素的依賴關係難於發現,沒有聯繫人類的視覺模型。模型方法既考慮了紋理局部的隨機性,又考慮了紋理整體的規律性,靈活性較大,而且也研究了紋理的多分辨性;但模型的參數估計有一定的難度,而且計算量較大。信號方法能對紋理進行多分辨描述,能將空域和頻域相結合對紋理進行研究,也符合人類的視覺持徵;但正交小波變換對高頻部分沒有進一步分解,而小波包對非規則紋理圖像的處理效果不佳,且計算量大。結構法只適合於紋理基元較大且排列規則的圖像;對於一般的自然紋理,因其隨機性較強、結構變化大,難以用該方法來準確描述。上述方法各有利弊,研究人員正試圖將不同的方法結合對紋理特徵進行比較研究和融合提取。

    2.3.2 形狀特徵提取
        形狀特徵人類視覺進行物體識別時所需要的關鍵信息之一,它不隨周圍的環境如亮度等因素的變化而變化,是一種穩定信息;相對於紋理和顏色等底層特徵而言,形狀特徵屬於圖像的中間層特徵。在2維圖像中,形狀通常被認為是一條封閉的輪廓曲線所包圍的區域。

        對形狀特徵的描述主要可以分為基於輪廓形狀與基於區域形狀兩類,區分方法在於形狀特徵僅從輪廓中提取還是從整個形狀區域中提取。

        1) 基於區域的形狀特徵。基於區域的形狀特徵是利用區域內的所有像素集合起來獲得用以描述目標輪廓所包圍的區域性質的參數。這些參數既可以是幾何參數,也可以是密度參數,還可以是區域2維變換係數或傅里葉變換的能量譜。基於區域的形狀特徵主要有幾何特徵、拓撲結構特徵、矩特徵等。

        幾何特徵包括區域簡單特徵描述,如面積、周長、質心、分散度、矩形度、長寬比、方向等;還包括基於形狀相似性的特徵,如區域的矩形度、圓形度、球形度、偏心率、面積周長比、細度,還有基於直方圖、基於飽和度、基於形態曲率和多邊形描述的形狀特徵等。

        拓撲結構特徵不受圖像幾何畸變的影響,是一種不依賴於距離變化的全局特徵。常用的拓撲結構特徵是歐拉數,即圖像目標區域連通組元的個數與目標區域的孔數之差,它表明圖像的連通性。

        矩特征利用目標所占區域的矩作為形狀描述參數,其計算要用到目標區域中所有相關的像素點,因此從全局描述了對象的整體特性。特徵矩也可理解為將圖像目標函數投影到一組基函數上,根據基函數的特徵,可將矩分為非正交矩和正交矩。非正交矩主要有幾何矩、複數矩、旋轉矩等。歸一化的中心矩對目標圖像平移、尺度變換具有不變性。Hu基於上述矩組合而成了7個經典不變量,被稱為Hu不變矩[ 108 ],具有平移、旋轉和比例不變性。正交矩又分為連續正交矩和離散正交矩。連續正交矩主要有Zernike矩、偽Zernike矩、Legendre矩、正交Fourier-Mellin矩,離散正交矩主要有Chebyshev矩、Krawtchouk矩[ 109 ]。

        2) 基於輪廓的形狀特徵。基於輪廓的形狀描述符是對包圍目標區域的輪廓的描述,主要有邊界特徵法(邊界形狀數、邊界矩等)、簡單幾何特徵(如周長、半徑、曲率、邊緣夾角)、基於變換域(如傅里葉描述符、小波描述符)、曲率尺度空間(CSS)、數學形態學、霍夫變換、小波描述符等方法。

        基於輪廓的特徵有如下優點:輪廓更能反映人類區分事物的形狀差異,且輪廓特徵所包含的信息較多,能減少計算的複雜度;但是,輪廓特徵對於噪聲和形變比較敏感,有些形狀應用中無法提取輪廓信息。

    2.3.3 顏色特徵提取
        顏色特徵是人類感知和區分不同物體的一種基本視覺特徵,是一種全局特徵,描述了圖像或圖像區域所對應的景物的表面性質。顏色特徵對於圖像的旋轉、平移、尺度變化都不敏感,表現出較強的魯棒性。顏色模型主要有HSV、RGB、HSI、CHL、LAB、CMY等。常用的特徵提取與匹配方法如下:

        1) 顏色直方圖。顏色直方圖(color histogram)是最常用的表達顏色特徵的方法,它能簡單描述一幅圖像中顏色的全局分佈,即不同色彩在整幅圖像中所佔的比例,特別適用於描述那些難以自動分割的圖像和不需要考慮物體空間位置的圖像,且計算簡單,對圖像中的對象的平移和旋轉變化不敏感;但它無法描述圖像中顏色的局部分佈及每種色彩所處的空間位置。

        當顏色特徵並不能取遍所有取值時,在統計顏色直方圖時會出現一些零值,這些零值對計算直方圖的相交帶來很大影響,使得計算的結果不能正確反映兩幅圖像之間的顏色差別。為解決上述問題,可利用累積直方圖法。

        2) 顏色集。顏色直方圖法是一種全局顏色特徵提取與匹配方法,無法區分局部顏色信息。顏色集是對顏色直方圖的一種近似,首先將圖像從RGB顏色空間轉化成視覺均衡的顏色空間(如HSV空間),並將顏色空間量化成若干個柄(bin)。然後,用色彩自動分割技術將圖像分為若干區域,每個區域用量化顏色空間的某個顏色分量來索引,從而將圖像表達為一個二進制的顏色索引集。在圖像匹配中,比較不同圖像顏色集之間的距離和色彩區域的空間關係。因為顏色集表達為二進制的特徵向量,可經構造二分查找樹來加快檢索速度,這對於大規模的圖像集合十分有利。

        3) 顏色矩。顏色矩(color moments)是另一種簡單而有效的顏色特徵提取與匹配方法。該方法的數學基礎在於:圖像中任何的顏色分佈均可以用它的矩來表示。由於顏色分佈信息主要集中在低階顏色矩中,因此僅採用顏色的一階中心矩、二階中心矩和三階中心矩就可以表達圖像的顏色特徵,它們分別表示圖像的平均顏色、標準方差和三次根非對稱性。該方法的另一個優點是它無需對顏色特徵進行向量化。但因為沒有考慮像素的空間位置,該方法仍存在精確度和準確度不足的缺點。

        4) 顏色聚合向量。其核心思想是:將屬於直方圖每一個柄的像素分成兩部分,如果該柄內的某些像素所佔據的連續區域的面積大於給定的閾值,則該區域內的像素作為聚合像素,否則作為非聚合像素。

        在目前圖像處理的硬件條件下,直接對彩色圖像的處理與分析是複雜而又耗時的,因此對彩色圖像的處理通常都是先轉化為灰度圖像,然後再按照灰度圖像處理方法進行處理。

    2.3.4 特徵的選擇
        圖像的特徵提取及其選擇的目的是為了提高後續圖像識別的準確性和魯棒性。圖像的特徵提取實現了從圖像空間到特徵空間的轉換,但是並非所有的特徵都對後續的圖像識別和分類有作用。如果特徵提取的數量多,使得特徵向量有較高的維數,這些高維特徵中很可能存在冗餘信息,從而導致圖像處理結果的精確度下降;圖像特徵維度過高,還會使圖像處理算法的複雜度高導致“維度災難”。因此,對於高維圖像特徵,為了降低所提取圖像特徵維數之間的相關性,需要消除圖像特徵之間的依賴性,即降維處理,也就是從圖像原始特徵中找出真正有用的特徵,以降低圖像處理算法的複雜度,並提高處理速度和結果的精確度,這個處理過程就是特徵的選擇。

        很多特徵選擇問題被認為是NP問題,因此,人們一般只能尋找特定問題的評價標準來保證所選擇的特徵是最優的,這也就造成了目前特徵選擇方法眾多。目前,特徵選擇的方法包括:主成分分析法(PCA)、獨立成分分析法(ICA)、Fisher分析法(FDA)、相關分析法(CFS)、自組織映射法(SOM)、Relief法、遺傳算法、模擬退火法、Tabu搜索法及基於流行的非線性降維方法等。

        PCA由Pearson首先引入,後來由Hotelling進行了發展。PCA是一種數學降維方法,其基本原理通過研究指標參數之間的相關性,尋求幾個綜合指標來代替原來眾多的指標,使這些綜合指標彼此之間互不相關且能盡可能地代表原來的信息量,並具有最大的方差;通過壓縮變量個數,用較少的變量去解釋原始數據中的大部分變量,剔除冗餘信息,即將許多相關性很高的變量轉化成個數較少、能解釋大部分原始數據方差且彼此互相獨立的幾個新變量,即所謂的主成分。

        PCA設法將原來眾多具有一定相關性個指標,重新組合成一組新的互相無關的綜合指標來代替原來的指標。將選取的第一個線性組合即第一個綜合變量方差最大、信息最多,稱為第一主成分;如果第一主成分不足以代表原來個變量的信息,再選取第二個線性組合即第二主成分,依此類推。

        PCA是一種線性組合方法,它能在盡可能好的代表原始數據的前提下,能過線性變換將高維空間的樣本數據投影到低維空間,因其計算簡單且便於分析而應用廣泛。

        如果基於最小MSE來降低特徵向量的維數,則PCA的結果是最優的,但因PCA所獲得的特徵向量的各分量之間是不相關的,故PCA無法滿足特徵向量的各分量之間是統計獨立的。獨立成分分析(ICA),最早應用於盲源信號分離(BBS)。ICA方法最早是由法國的Herault和Jutten於80年代中期提出來的,ICA理論的基本思想是從一組混合的觀測信號中分離出獨立信號,或者盡可能獨立的信號對其他信號進行表徵。

        ICA的主要任務是給定一個維特徵向量,確定一個×的變換矩陣(分離矩陣),使得變換後的向量的各分量滿足互相統計獨立的特性。ICA方法的關鍵是如何快速求取最優的分離矩陣,根據求取分離矩陣的方法,ICA算法有Infomax算法、峰度估計法、快速ICA算法等。

        PCA和ICA所形成的新特徵各分量之間是互不相關或是統計獨立的,從理論上等價於使得二階或高階交叉累積量最小。如果根據二階或高階交叉累積量構造一個準則函數,則特徵優化問題可理解為基於準則函數進行特徵的優化,即通過最小化的準則函數,在概率意義上計算出問題的全局最優解,基於組合優化的特徵選擇就是基於上述原理的,常用的組合優化算法有遺傳算法、模擬退火算法和Tabu搜索算法等。

        遺傳算法(GA)是由美國Michigan大學的Holland教授根據Darwin的生物進化論和Mendel的遺傳變異理論提出的一種基於種群搜索的優化算法。其思想是隨機產生初始種群, 通過選擇(reproduction)、交叉(crossover)和變異(mutation)等遺傳算子的共同作用使種群不斷進化,最終得到最優解。

        基於遺傳算法的缺陷特徵優化的基本思想是:先對待尋優的缺陷特徵參數進行編碼,按一定規模初始化種群,種群中的每一個體就代表了一個可能的解;然後根據適應度值函數計算每一個體的適應度值並依此決定遺傳操作,再按一定的概率對種群進行交叉、變異,直至滿足終止條件結束。

        模擬退火算法是一種求解在規模組合優化問題的隨機性方法,它以優化問題的求解與物理系統退火過程的相似性為基礎,利用metropolis算法並適當控制溫度的下降過程實現模擬退火,從而得到全局最優解。文獻[ 110 ]提出了一種基於自適應模擬退火算法的特徵選擇方法,該方法將模擬退火算法嵌入到自適應遺傳算法的循環體中,避免陷入局部最優解。

        Tabu搜索法最早由美國Glover教授提出,它是對局部領域搜索的一種擴展,是一種全局逐步尋優算法。Tabu搜索法從一個初始可行解出發,選擇一系列的特定搜索方向作為試探,選擇實現讓特定的目標函數值變化最多的搜索。為了避免陷入局部最優解,採用了一種靈活的“記憶”技術,對已經進行的優化過程進行記錄和選擇,指導下一步的搜索方向。為了能夠逃出局部極值和避免循環,算法中設置了禁止表,當搜索的解在禁止表中時,則放棄該解。Tabu搜索法可以靈活地使用禁止表記錄搜索過程,從而使搜索既能找到局部最優解,同時又能越過局部極值得到更優的解。

        PCA和ICA等線性降維方法簡潔直觀、數學推導嚴謹,可較好的發現高維向量空間的線性子空間上的數據集的內部幾何結構,具有廣泛的應用。但線性降維方法難以解決高維空間的非線性流形學習問題。為此,基於流行學習的非線性降維方法也受到了科研者們的廣泛關注,主要有局部線性嵌入(LLE)方法、局部保持映射法(LPP)、Isomap方法等。這些算法首先根據給定的樣本數據集,定義一個描述成數據點相似度的關係矩陣,然後計算這個矩陣的特徵值和特徵向量,選擇合適的特徵向量投影到低維空間,從而得到低維嵌入向量。因所構建的關係矩陣不同,故有不同的算法。

    2.4 表面缺陷目標識別算法
        統計模式識別(statistical pattern recognition)和句法(結構)模式識別(syntactic pattern recognition)是兩種基本的模式識別方法。前者是模式的統計分類方法,即結合統計概率的貝葉斯決策系統進行模型識別的技術,又稱為決策理論識別方法;後者的基本思想是把一個模式描述為較簡單的子模式的組合,子模式又可進一步描述為更簡單的子模式的組合,最終得到一個樹狀結構描述,利用模式與子模式分層結構的樹狀信息完成模式識別任務。數字圖像的識別問題通常適用於統計模式識別,而句法模式識別主要用於遙感圖像識別、文字識別等,目前,基於機器視覺的表面缺陷識別主要涉及統計模式識別。

        統計模式識別按其實現方式又分為有監督學習的模式識別和無監督學習的模式識別。前者是在已知類別標籤的特徵集(即訓練集)基礎上進行分類器構建;後者也稱為聚類,該方法不需要已知類別的訓練集,分類器直接根據特徵向量之間的相似性,將待分類的特徵向量集合分為若干個子集。

    2.4.1 有監督學習的模式識別
        監督模式識別主要有基於概率統計的分類器、線性分類器、人工神經網絡分類器和支持向量機等。

        1) 基於概率統計的分類器。基於概率統計的分類方法主要有基於最小錯誤率的貝葉斯決策、基於最小風險的貝葉斯決策。使用貝葉斯決策首先需要得到有關樣品的總體分佈知識,包括各類先驗概率及類條件概率密度函數,計算出樣品的後驗概率,並以此作為判別函數的必要數據,設計出相應的判別函數及決策面。貝葉斯分類器可給出數學上的嚴格證明,在給出某些變量的條件下使分類的平均損失最小或是分類決策風險最小。儘管貝葉斯決策規則從理論上解決了最優分類器的設計問題,但其實施時樣本特徵空間的類條件概率密度形式一般很難確定,而利用Parzen窗等非參數方法估計分佈又往往需要大量的樣本,所以貝葉斯決策規則更多是具有理論上的指導意義,一般適用於有統計知識的場合,或是能利用訓練樣品估計出參數的場合。

        張宏杰等人[ 111 ]基於貝葉斯圖像模式識別技術的點焊質量評估,利用主成分分析消除圖像特徵間的互相關性,建立了基於最小風險貝葉斯圖像識別技術的焊點質量分類器,有效地評判焊點質量;蘇芳等人[ 112 ]通過貝葉斯理論進行多通道SAR圖像測量級數據融合,充分利用像素的從屬信息並獲得單通道分類無法獲取的分類結果,有效保留各通道有用信息並抑製圖像中的斑點噪聲。

        2) 線性分類器。在實際應用中,往往不去求類條件概率密度,而是利用樣本集直接設計分類器,即給定某個判別函數,利用樣本集確定判別函數中的未知參數,即判別函數分類法。判別函數分類方法按其判別函數的形式可分為線性分類法和非線性分類法。前者主要有Fisher分類算法、感知算法LMSE分類算法等;後者主要有分段線性判別函數法(如近鄰分類法、最小距離法)、基於核的Fisher分類算法、勢函數法和支持向量機方法等。線性分類器算法簡單,在計算機上實現容易,在模式識別中得到了廣泛應用;對於模式識別的非線性問題,則用非線性分類器。

        K最近鄰(KNN)分類算法是最簡單的機器學習算法之一,其核心思想是如果一個樣本在特徵空間中的k個最相鄰的樣本中的大多數屬於某一個類別,則該樣本也屬於這個類別,並具有這個類別上樣本的特性。Lopez等人[ 113 ]使用KNN分類方法提取各通道的顏色特徵進行瓷磚表面質量的分類;Mandriota等人[ 114 ]採用KNN算法結合和小波係數對軌道表面質量進行檢測;Wiltschi等人[ 115 ]則基本最小距離分類方法對鋼板圖像進行表面質量檢測;Pernkopf等人[ 116 ]採用耦合隱馬爾可夫隨機場合進行似然計算,結合貝葉斯網絡分類器進行了鋼坯表面缺陷檢測。

        3) 人工神經網絡。人工神經網絡(ANN)是一種應用類似於大腦神經突觸聯接的結構進行信息處理的數學模型,是在現代神經科學研究成果的基礎上提出的,試圖通過模擬大腦神經網絡處理、記憶信息的方式進行信息處理。

        ANN是由大量處理單元互聯組成的非線性、自適應信息處理系統。1943年,心理學家McCulloch和數理邏輯學家Pitts建立了神經網絡和數學模型,稱為MP模型。60年代,人工神經網絡得到了進一步發展,更完善的神經網絡模型被提出,其中包括感知器和自適應線性元件等。20世紀80年代,美國加州工學院物理學家Hopfield提出了Hopfield神經網絡模型,為神經計算機的研究做了開拓性的工作。不久,Rumelhart, Hinton, Williams發展了BP算法,迄今,BP算法已被用於解決大量實際問題。繼而,Broomhead和Lowe用徑向基函數(RBF)提出分層網絡的設計方法。20世紀90年代初,Vapnik等提出了支持向量機(SVM)和VC(Vapnik-Chervonenkis)維數的概念。目前,已有近40種神經網絡模型。

        人工神經網絡具有非線性、自適應、自組織、自學習能力、非局限性、非凸性和容錯性等一系列特點,故在信息處理、模式識別和智能控制等領域有著廣泛的應用前景。與其他技術的結合取長補短,以及由此而來的混合方法和混合系統,已成為一大研究熱點。目前這方面工作有神經網絡與模糊邏輯、專家系統、遺傳算法、小波分析、混沌、粗糙集理論、分形理論、證據理論和灰色系統等的融合,並取得了一定的成果。

        4) 支持向量機。人工神經網絡方法具有一系列的優點,但有時也存在泛化能力不強、算法耗時較多、往往需要有較多訓練樣本等問題。支持向量機(SVM)是Vapnik根據統計學習理論於1995年提出的,它採用結構風險最小化(SRM)而非經驗風險最小化(ERM)原理,通過將樣本點所在的輸入空間映射到高維的特徵空間,以達到線性可分或者線性近似可分的目的。

        所謂支持向量是指那些在間隔區邊緣的訓練樣本點,支持向量機與神經網絡類似,都是學習型的機制,但與神經網絡不同的是SVM使用的是數學方法和優化技術,而且在傳統的最優化問題中提出了對偶理論,主要有最大最小對偶及拉格朗日對偶。

        支持向量機是一種有堅實理論基礎的小樣本學習方法,其最終決策函數只由少數的支持向量所確定,計算的複雜性取決於支持向量的數目而不是樣本空間的維數。SVM的關鍵在於核函數,低維空間向量集通常難於劃分,解決的方法是將它們映射到高維空間,只要選用適當的核函數,就可以得到高維空間的分類函數,這在某種意義上避免了“維數災難”;而且少數支持向量決定了最終結果,這樣可以剔除大量冗餘樣本,所以算法簡單而且具有較好的魯棒性。支持向量機理論在解決小樣本、非線性及高維模式識別中表現出許多特有的優勢,在表面檢測、模式識別、故障診斷等方面有成功的應用,並表現出很高的有效性和魯棒性。

    2.4.2 無監督學習的模式識別
        無監督學習的模式識別的訓練樣本沒有類別標籤,主要以聚類分組來揭示模式結構,也稱聚類。聚類是一個將數據集劃分為若干組或簇的過程,使得同一類的數據對象之間的相似度較高,而不同類的數據對象之間的相似度較低。

        目前出現了大量的聚類算法,其選擇取決於數據的類型、聚類的目的。主要的聚類算法可以劃分為如下幾類:劃分方法、層次方法、密度方法、網格方法以及模型方法。

        1) 劃分方法。劃分法(partitioning methods)是聚類分析中最為常見的一種方法,其目的是將給定的數據對象集通過劃分操作分成若干分組,每一個分組表示一個聚類。劃分時需要預先指定聚類數目或聚類中心,通過反复迭代運算,逐步降低目標函數的誤差值,當目標函數值收斂時,得到最終聚類結果。常用的劃分法有:K-means、K-medoids、CLARA、CLARANS、K-prototypes等。

        K-means算法是很典型的基於距離的聚類算法,採用距離作為相似性的評價指標,即認為兩個對象的距離越近,其相似度就越大。將K-means方法與其他技術結合可以提高K-means方法的聚類能力,文獻[ 117 ]結合遺傳算法一定程度上解決了全局最優或近似最優解的問題;文獻[ 118 ]將免疫算法與K-means聚類相結合,提出了基於免疫規劃的K-means聚類分析方法;文獻[ 119 ]利用用窗口技術提高了K-means方法的聚類分析能力;文獻[ 120 ]在聚類分類數據中應用禁忌搜索技術;此外,文獻[ 121 ]提出了一種模糊K-prototypes算法,該算法融合了K-means和K-modes對數值型和分類型數據的處理方法,能夠處理混合類型的數據;文獻[ 122 ]中將模糊數學理論與K-means算法融合,對K-means算法進行了有效改進。

        2) 層次方法。層次法(Hierarchical Methods)也稱為樹聚類算法,層次聚類是將數據對象集分解成幾級逐級進行聚類,遞歸地對給定的數據對象集進行合併或分解,直到滿足限制條件為止,其聚類結果最終以類別樹的形式顯示。層次方法根據分解方式的不同可以分為凝聚式(agglomerative)和分裂式(division)。層次算法不需要預先指定聚類的數目,但是在凝聚或分裂的層次聚類算法中,用戶可以預先定義希望得到的聚類數目作為算法的結束條件,當該條件達到滿足時,算法將終止。其代表算法有:BIRCH、CURE、CHAMELEO N、 ROCK、SBAC和BUBBLE等。

        層次聚類的優點體現在算法能得到不同粒度的多層次聚類結構,缺陷在於沒有全局優化的目標函數,合併或分裂點的選擇比較困難,對噪聲、孤立點數據比較敏感,不適於非凸型分佈的數據對象集等。為此,研究者們給出了一些改進算法,如將層次聚類和其他的聚類分析技術進行集成,形成多階段聚類等。

        3) 密度方法。密度方法(density-based methods)的指導思想是,只要一個區域中的點的密度大於某個閾值,就把它加到與之相近的聚類中去,即通過數據密度(單位區域內的實例數)來發現任意形狀的類簇。該方法與其他方法的一個根本區別是:它不是基於距離的,而是基於密度的,這樣就能克服基於距離的算法只能發現“類圓形”的聚類的缺點。其代表算法有:DBSCAN、OPTICS、DENCLUE、GDBSCAN、FDC算法等。

        基於密度的聚類算法的優點是一遍掃描,並可以很好的過濾噪聲和孤立點數據,發現任意形狀、不定個數的類;其缺點是算法複雜度較高,對於密度分佈不均的數據集聚類效果不佳。

        4) 網格方法。基於網格的方法採用一個網格數據結構,該結構具有多分辨率,通過這個數據結構可以將對數據對象的處理轉化為對網格空間的處理。這種方法首先將數據空間劃分成為有限個單元的網格結構,然後通過算法對網格空間進行分割進而實現聚類的目的。此聚類算法常常與其他方法相結合,特別是與基於密度的聚類方法相結合。其代表算法有:在高維數據空間中基於網格和密度相結合的聚類方法(CLIQUE算法),基於小波變換的聚類方法(Wave-Cluster算法),利用存儲在網格中的統計信息的STING算法。

        基於網格的方法的主要優點是執行速度快,它的時間複雜度僅依賴於量化空間中每一維上的單元數目;但該算法因網格單元的數目隨著維數的增加而呈指數的增長故不適於高維數據,而且高效率以聚類結果的精確性為代價。

        5) 圖論算法。圖論分裂聚類算法的主要思想是:構造一棵關於數據的最小生成樹,通過刪除最小生成樹的最長邊來形成類.基於圖論的聚類算法主要包括RANDOMWALK、CHAMELEON、AUTOCLUST等。

        6)模型算法。基於模型的方法給每一個聚類假定一個模型,然後去尋找能夠很好的滿足這個模型的數據集。這樣一個模型可能是數據點在空間中的密度分佈函數或者其他。該方法基於目標數據集由一系列的概率分佈所決定這一假設,通過構造反映數據對象空間分佈的密度函數來進行聚類。該算法通常分為兩種:基於統計學的方法和基於神經網絡的方法。前者主要有以分類樹的形式創建層次聚類的COBWEB算法及其擴展COBWEB算法;後者主要有競爭學習型和自組織特徵映射型(SOM)等[ 123 ]。

        以上傳統的聚類方法都具有各自的優點,在各自的適用領域取得了較大的成功。但是,這些聚類方法也存在以下問題:在進行聚類之前都需要事先確定要得到的聚類的數目,然而在現實數據中,聚類的數目往往是未知的;處理大規模數據和高維數據的能力、計算效率、有效的消除噪聲的影響等方面都有待於提高;此外,有的聚類算法對輸入參數的取值十分敏感,而且參數的取值沒有成熟的理論依據,只能依靠用戶的經驗來確定。除上述聚類方法外,學者們還研究了其他大量的聚類方法,下面列出了幾類:

        1)模糊聚類方法。1969年,Ruspini首次提出了模糊聚類算法(FCM)。FCM是一種以隸屬度來確定每個數據點屬於某個聚類程度的算法,能保留初始圖像的更多信息。然而,FCM沒有考慮圖像上下文中的空間信息,對噪聲較敏感。學者們圍繞FCM算法開展了大量研究,比如,李潔等人[ 124 ]採用ReliefF算法[ 125 ]確定各維特徵的權重,提出了基於特徵加權的模糊聚類新算法NFWFCA;Cai等人[ 126 ]結合局部空間和灰度信息,提出快速通用FCM聚類算法FGFCM,該算法計算簡單,適合大幅灰度圖像和有噪聲和無噪聲的多種類型圖像;唐利明等人[ 127 ]結合變分水平集方法和模糊聚類,提出了一個基於變分水平集的圖像聚類分割模型,該模型引入了一個基於圖像局部信息的外部模糊聚類能量和一個新的關於零水平集的正則化能量,使得該模型對噪聲圖像的聚類分割更具魯棒性;王雪等人[ 128 ]提出一種多相水平集模型協同空間模糊C-均值聚類(SFCM)的圖像多目標分割算法,即SFCM-MLS算法,用空間模糊聚類獲取圖像多目標粗分割結果,然後用粗分割結果定義多相水平集模型的初始水平集函數對圖像做精 割,SFCM-MLS算法對初始位置不敏感,提高了圖像多目標分割的準確性。

        2)迭代自組織數據分析算法。迭代自組織數據分析算法(ISODATA)的主要思想是首先根據最小距離準則獲得初始聚類,再判斷初始聚類結果是否符合要求。若不符合,則將聚類集進行分裂和合併處理,得到新的聚類中心,再判斷聚類結果是否符合要求。如此反复迭代直到完成聚類操作。ISODATA與K-MEANS一樣,聚類中心的位置通過樣本均值的迭代運算決定,但ISODATA聚類中心數目不是固定的,而且反復修正,在迭代過程中可將一類一分為二,也可以兩類合併,即“自組織”。ISODATA具有啟發性、計算並不復雜,適用於識別緻密聚類。時靜潔等人[ 129 ]將ISODATA與蟻群算法(ACO)算法相結合,建立相關模型對有機化合物的黏度進行QSPR研究,解決了小樣本、非線性和維數災難等問題。

        3)模擬退火聚類算法。模擬退火算法(SA)最初由Metropolis等人於20世紀80年代初提出,其思想源於物理中固體物質退火過程與一般組合優化問題之間的相似性,通過模擬高溫物體退火過程的方法來找到優化問題的全局最優或近似全局最優解。SA是一種啟發式隨機搜索算法,具有並行性和漸近收斂性,目前已廣泛應用於圖像識別、機器學習、神經網絡等優化問題。如張引、潘雲鶴[ 130 ]採用模擬退火技術求解最大似然聚類用於圖像分割,解決了用迭代方法求解最大似然聚類只能得到局部最優解的問題.獲得的圖像分割效果優於迭代方法和著名的Otsu方法;Neethirajan等人[ 131 ]基於模擬退火算法對儲糧害蟲進行了識別分類。

        4)粗糙集方法。粗糙集理論是波蘭科學家Pawlak提出的,它是一種新型的處理模糊和不確定知識的數學工具,揭示潛在的規律能有效地分析和處理不精確、不一致、不完整等各種不完備信息,並能從中發現隱含的知識和揭示潛在的規律[ 132 – 133 ]。它提供了一套比較完備的從小樣本數據中尋找規律的系統方法,用其可找到描述正常模型的最小預測規則集,其不僅有利於提高檢測速度,而且可應用於系統的實時檢測。

        目前,粗糙集理論已經在數據的決策和分析、模式識別、機器學習等方面有著成功的應用,已成為信息科學最活躍的研究領域之一。如文獻[ 134 ]基於RS理論對帶鋼表面缺陷圖像進行了識別分類,並同BP算法進行了對比,驗證了基於粗糙集的分類識別算法的有效性。

        此外,蟻群聚類算法、粒子群聚類算法、基於遺傳算法的聚類方法、基於核的聚類算法等得到應用,廣大學者們正致力於具有聚類能力強、自適應、效率高等特點的聚類算法研究,並註重將不同的聚類思想進行融合以形成新的聚類等新算法。如,王孫安等人[ 135 ]提出一種混沌免疫模糊聚類算法,該算法把混沌變量加載於免疫算法的變量群體中,利用混沌搜索的特點對群體進行微小擾動並逐步調整擾動幅度,提高了基於人工免疫進化算法的模糊聚類算法的搜索效率;吳一全等人[ 136 ]提出了一種利用核模糊C均值聚類和正則化的圖像稀疏去噪方法,更有效地去除圖像噪音,保留圖像細節,改善圖像視覺效果;Nunes應用一種人工免疫進化網絡用於聚類[ 137 ]。

One thought on “機器視覺表面缺陷檢測

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *