計算機視覺主要任務( 影像處理 主要 功能/作用/工作)

計算機視覺主要任務( 影像處理 主要 功能/作用/工作)

計算機視覺主要任務( 影像處理 主要 功能/作用/工作)


資料來源 :  https://mp.weixin.qq.com/s/LVG1ORvAeCnSyPTOtbOvvA 


在現在的計算機視覺研究中,可以主要分類為几個主要的任務


1. 圖像分類:分類任務是基礎任務,而圖像分類問題就是給輸入圖像分配標簽類別的任務,這是計算機視覺的核心問題之一。一般說來,經典的圖像分類算法是通過手工特徵或者特徵學習方法對整個圖像進行全局描述,然后使用分類器判斷是否存在某類物體。現在更多的是用端到端的深度學習技朮。


2.物體檢測:物體檢測是視覺感知的第一步,也是計算機視覺的一個重要分支。物體檢測的目標,就是用框去標出物體的位置,并給出物體的類別。物體檢測和圖像分類不一樣,檢測側重於物體的搜索,而且物體檢測的目標必須要有固定的形狀和輪廓。圖像分類可以是任意的目標,這個目標可能是物體,也可能是一些屬性或者場景。


3、物體定位:如果說圖像識別解決的是what,那么,物體定位解決的則是where的問題。利用計算視覺技朮找到圖像中某一目標物體在圖像中的位置,即定位。目標物體的定位對於計算機視覺在安防、自動駕駛等領域的應用有着至關重要的意義。

另外,物體定位的延伸目標跟蹤,是指在給定場景中跟蹤感興趣的具體對象或多個對象的過程。簡單來說,給出目標在跟蹤視頻第一幀中的初始狀態(如位置、尺寸),自動估計目標物體在后續幀中的狀態。該技朮對自動駕駛汽車等領域顯得至關重要。


4. 圖像分割:圖像分割指的是將數字圖像細分為多個圖像子區域(像素的集合,也被稱作超像素)的過程。圖像分割的目的是簡化或改變圖像的表示形式,使得圖像更容易理解和分析。更精確地說,圖像分割是對圖像中的每個像素加標簽的一個過程,這一過程使得具有相同標簽的像素具有某種共同視覺特性。

另外,“圖像語義分割”是一個像素級別的物體識別,即每個像素點都要判斷它的類別。它和檢測的區別是,物體檢測是一個物體級別的,他只需要一個框,去框住物體的位置,而通常分割是比檢測要更難的問題。


5. 圖像標注–看圖說話:圖像標注是一項引人注目的研究領域,它的研究目的是給出一張圖片,你給我用一段文字描述它,具體例子如下圖所示,近几年,工業界的百度,谷歌和微軟 以及學朮界的加大伯克利,深度學習研究重地多倫多大學都在做相應的研究。


6. 圖像生成–文字轉圖像:圖片標注任務本來是一個半圓,既然我們可以從圖片產生描述文字,那么我們也能從文字來生成圖片。這個任務也是非常有趣的,特別是在深度學習模型GAN被研發出來之后,這個任務也有更多的方法來解決。

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *