期刊VIP學(xué)術(shù)指導(dǎo) 符合學(xué)術(shù)規(guī)范和道德
保障品質(zhì) 保證專業(yè),沒有后顧之憂
來源:期刊VIP網(wǎng)所屬分類:農(nóng)業(yè)科技時間:瀏覽:次
摘 要:紡織品及服裝研究與計算機、信息技術(shù)的融合發(fā)展是推進紡織品及服裝產(chǎn)業(yè)智能化的必然途徑,聚焦圖像識別技術(shù)在紡織品及服裝研究中的應(yīng)用,歸納其研究內(nèi)容和研究成果。如紡織品領(lǐng)域的纖維及織物組織識別、紡織品疵點檢驗、面料檢索,服裝領(lǐng)域的人體體型識別、服裝款式圖與樣版圖識別、服裝著裝圖檢索分類等;闡述圖像識別關(guān)鍵技術(shù)簡況及分類依據(jù)等。討論研究中存在的問題、空缺與難點,提出未來的研究方向和研究前景。
關(guān)鍵詞:圖像識別;紡織品檢驗;服裝圖像;計算機視覺;機器學(xué)習(xí)
《服裝學(xué)報》由教育部主管、江南大學(xué)(國家“211工程”重點建設(shè)高校)主辦的專業(yè)性學(xué)術(shù)期刊。
信息化時代快速發(fā)展下,紡織服裝領(lǐng)域中圖像信息所占比例日益提高,成為獲取和傳遞信息的重要工具。人們的生產(chǎn)生活方式也因此改變:在紡織服裝生產(chǎn)過程中,通過獲取與處理圖像將物理圖像轉(zhuǎn)化為所需信息,為自動化生產(chǎn)提供信息輸入;在紡織服裝作為商品的展示與銷售過程中,以紡織品及服裝為內(nèi)容的圖像檢索、識別、標注等技術(shù)為用戶篩選商品信息提供了便利,還可進行個性化推薦等。
其中所用技術(shù)為圖像工程及人工智能領(lǐng)域中的圖像識別技術(shù),其目的是讓計算機代替人類處理大量物理信息,對圖像作出各種處理、分析,最終識別所要研究的目標。圖像識別技術(shù)的研究進展與計算機圖形學(xué)、計算機視覺、機器學(xué)習(xí)、模糊邏輯等理論和技術(shù)有密切聯(lián)系,[1]其應(yīng)用范圍涉及醫(yī)學(xué)、生物、工業(yè)自動化、公共安全等領(lǐng)域。[2]
本文結(jié)合國內(nèi)外文獻研究及技術(shù)調(diào)查,針對紡織服裝圖像,對圖像識別相關(guān)技術(shù)進行簡要介紹;并就紡織品和服裝領(lǐng)域分別闡述圖像識別在其中的應(yīng)用構(gòu)想與結(jié)果。討論目前應(yīng)用中存在的不足和研究空缺,期望促進圖像識別在紡織服裝領(lǐng)域的進一步發(fā)展,帶動傳統(tǒng)紡織服裝行業(yè)的轉(zhuǎn)型升級。
1 圖像識別在紡織服裝上的應(yīng)用
根據(jù)應(yīng)用領(lǐng)域及生產(chǎn)過程的不同,圖像識別在紡織服裝上的應(yīng)用可分為紡織品領(lǐng)域和服裝領(lǐng)域。
1.1 紡織領(lǐng)域
圖像識別技術(shù)在紡織及紡織品中多用于纖維和織物組織識別、疵點檢測以及面料檢索等,其識別難度和應(yīng)用廣泛度有所差異,介紹如下。
1.1.1 纖維及織物組織識別
紡織階段,圖像識別技術(shù)可用于識別區(qū)分各類纖維及其織物,還可用于原棉加工前識別非棉雜質(zhì)。對于織物組織結(jié)構(gòu),針織物中對緯編組織的研究較多,如對其編織周期的識別及組織結(jié)構(gòu)的編碼分類等。[3]機織物中目前能夠識別出織物中的三原組織;還可輔以亮度累加法檢測分割經(jīng)緯紗線、定位組織點,用于計算紗線密度和組織點的自動分類。[4]但由于織物組織結(jié)構(gòu)復(fù)雜多樣,即使是人工識別,若非專業(yè)人士也難以輕易辨認,因此目前大多相關(guān)研究還停留在人工與計算機交互操作提取特征進行識別,難以大范圍推廣。
1.1.2 織物疵點檢測
織物疵點檢測經(jīng)過十?dāng)?shù)年的發(fā)展,已基本能完成疵點判別、疵點分割、疵點分類等功能,并應(yīng)用于工業(yè)。識別準度是其中較為重要的驗收指標,但在保證準度的前提下,識別速度也需逐步提高,目前疵點在線監(jiān)測的速度要求一般高于60 m/min,檢測的疵點最小尺寸為0.5 mm。[5]近年進展多為提高精細度及速度、擴展識別疵點類別及檢驗規(guī)范化等,還有部分學(xué)者在對織物褶皺及折痕的研究中也使用了圖像識別相關(guān)技術(shù),提出多視域織物外觀平整度客觀評級方法,嘗試讓機器判斷織物平整度并驗證,為織物表現(xiàn)性能的評估提供了有效的解決方案。[6]
1.1.3 面料檢索
面料圖像的商業(yè)價值和大眾使用率較高,消費者和生產(chǎn)商都有挑選符合自己預(yù)期面料的需求;且面料圖像的顏色、紋理、形狀等底層特征相對較為簡單明晰,易于被計算機提取和區(qū)分。計算機除了能夠通過對比面料圖像實現(xiàn)相似面料的檢索之外,還可基于對部分特征明顯的面料進行感性屬性定義,實現(xiàn)對面料的主觀情感標注。如分析面料顏色的飽和度、對比度、色彩關(guān)系及紋理、圖案等,人工將客觀指標歸納至感性認知,用于面料檢索和推薦。[7]但目前的面料檢索研究樣本仍較為單一,多為同類面料不同色彩,或同類面料不同圖案的研究,且人工定義情感屬性局限較大,可嘗試多維度多分類研究。
1.2 服裝領(lǐng)域
服裝領(lǐng)域中,對人體體型及服裝款式圖、樣板圖的識別多為服裝院校和服裝專業(yè)研究者完成;而計算機、信息技術(shù)領(lǐng)域等學(xué)者通常從識別服裝實物圖、著裝圖入手,對相關(guān)圖像進行識別、檢索、分割、分類及標注等。
1.2.1 人體體型識別
人體是服裝的基礎(chǔ),服裝的智能化生產(chǎn)離不開對個體體型的研究及描述。對人體體型的研究多基于來源于二維測量或三維人體掃描的數(shù)據(jù),但就圖像識別技術(shù)發(fā)展以來,也漸有學(xué)者致力于對圖像信息的分析以識別體型。一般是對人體二維照片進行預(yù)處理后提取輪廓曲線,再用一定的描述方法對曲線分類、以達到對體型分類的目的。[8]
1.2.2 服裝款式圖與樣版圖識別
關(guān)于服裝款式圖,可運用shock graph技術(shù)提取形狀特征再對其分類;[9]對于樣版圖,可對樣版邊緣進行識別,在樣片文件中儲存縫紉信息以用于自動縫紉技術(shù)。[10]但服裝行業(yè)中的款式圖風(fēng)格不一,還未形成一個統(tǒng)一規(guī)范作為分類標準;且shock graph一般用于進行形狀外輪廓的識別與匹配,不包括內(nèi)部細節(jié),無法作為樣版庫的檢索依據(jù)。需求方面,對服裝款式圖與樣版圖的識別需求較小;識別難度方面,服裝款式圖和樣版圖像只包含黑白二色及線條,無顏色和紋理特征,就發(fā)展現(xiàn)狀而言識別難度較實物圖高,需要對比不同的圖像識別模型和方法,綜合選擇最合適的方案。
1.2.3 服裝著裝圖檢索分類(圖1)
服裝圖像識別可分為對服裝廓形、尺寸的識別,及服裝分類、檢索和標注。服裝廓形的識別中,一般先在人體著裝照片以人臉或人體膚色為參照來確定照片中的服裝,再對服裝掃描識別特征點、獲取數(shù)據(jù),由人體身高比例或其他公式自動計算測量服裝廓形相關(guān)尺寸,以此定義照片中的服裝廓形。[11]借助計算機可實現(xiàn)部分服裝實物圖的尺寸及尺碼測量,但仍有較多人機交互工作量。[12]
服裝著裝圖的識別發(fā)展相對成熟,基本能夠?qū)崿F(xiàn)對相同或相似服裝的檢索,服裝長度、寬松度及各部件等細節(jié)要素的識別,以及服裝圖像的分類和款式屬性標注,其中用到了大量計算機視覺及機器學(xué)習(xí)的前沿技術(shù)。[13]
2 相關(guān)技術(shù)
圖像識別技術(shù)主要通過對比存儲的信息和當(dāng)前信息從而識別圖像,不同圖像不同目的的識別分析稍有不同,在此介紹圖像識別的分類及其關(guān)鍵技術(shù)。
2.1 圖像識別分類
2.1.1 按發(fā)展階段
圖像識別的發(fā)展主要經(jīng)歷了文字識別、數(shù)字圖像識別、物體識別3個階段。[14]可分為最初對擁有模式數(shù)據(jù)庫的印刷體文本的識別,對較為清晰的數(shù)字圖像提取輪廓、線條計算加以識別,以及掃描獲取現(xiàn)實物體圖像、記錄像素色值對物體進行識別3類。服裝標簽及樣版圖紙中的文字、符號可通過文字識別技術(shù)獲得,服裝圖像的識別也從外輪廓線條推進至內(nèi)部細節(jié)和款式屬性的識別,即往識別細分類、自動化發(fā)展。
2.1.2 按識別粒度
根據(jù)識別粒度不同,可分為通用圖像識別、細粒度圖像識別和更精細粒度圖像識別等。[15]其中通用圖像識別,指識別區(qū)分度較大、隸屬不同大類的物體,如目標檢測、圖像分割(將人體、衣物從背景中區(qū)分出來)和圖像分類等;細粒度圖像識別,則是對大類下的子類進行識別,如服裝中的各類服飾、款式識別等,大多采用深度學(xué)習(xí)方法;更精細粒度識別,包括人臉識別、指紋識別等,還有紡織品中的織物組織識別。根據(jù)目前的技術(shù)原理,其發(fā)展需要質(zhì)量更好的大量織物組織圖片,以及對細部特征提取更為敏感的學(xué)習(xí)算法。
2.1.3 按識別形式
常見的圖像識別技術(shù)形式有模式識別、神經(jīng)網(wǎng)絡(luò)識別和降維形式識別等。模式識別原理是按一定的規(guī)則,對比已有圖像和新獲得圖像的相似度,相似度高為同類,一般用于面料和服裝的檢索、分類等。神經(jīng)網(wǎng)絡(luò)識別形式是在傳統(tǒng)圖像識別的基礎(chǔ)上融合神經(jīng)網(wǎng)絡(luò)算法。降維形式的圖像識別則是對圖像中包含的高維性特征數(shù)據(jù)信息進行降維。降維又可分為線性降維和非線性降維,一般用于特征篩選與表達。[16]
2.1.4 按圖像語義層次
圖像語義可分為低層、中層、高層,也稱為視覺層、對象層和概念層,[17]對圖像的研究因此可分為圖像處理、圖像分析和圖像理解3個層次(圖2)。
圖像識別技術(shù)也可據(jù)此分為3類,它們的識別依據(jù)、識別技術(shù)路線都不同。基于低層語義的圖像識別以顏色、紋理和形狀為識別基礎(chǔ),這些特征也被稱為底層特征語義;中層語義通常包含了屬性特征,及某一對象在某一時刻的狀態(tài)和特點,如服裝中可由數(shù)據(jù)歸納出的客觀屬性――款式細節(jié)等,目前需要人為歸納;高層語義指圖像表達出的接近人類理解的主觀感受語言,如人們對衣物的風(fēng)格描述等,圖像識別可基于此進行情感或物體關(guān)系的描述。
2.2 計算機視覺
計算機要進行圖像識別,首先需要“看見”、“看懂”圖像,這由計算機視覺相關(guān)技術(shù)實現(xiàn),其關(guān)鍵技術(shù)有特征提取、圖像分割、圖像匹配等。
2.2.1 特征提取
特征提取是將圖像上的特征點劃分為不同特征子集的過程,對圖像識別的精度和速度有重要影響。[2]圖像的基礎(chǔ)特征有顏色、紋理、形狀及各部分之間的空間關(guān)系等,其中空間關(guān)系特征包括圖像中不同識別目標的相對位置關(guān)系和每個目標在圖像中的絕對位置信息。服裝及人體的關(guān)鍵點及關(guān)鍵部位等的識別均以特征提取為基礎(chǔ);[18]在對織物組織結(jié)構(gòu)的識別中,重點提取組織點的色彩和紋理特征,再對提取出的特征向量進行運算和自動分類,有助于實現(xiàn)組織結(jié)構(gòu)的自動識別。[4]吳歡等[19]基于CaffeNet模型通過女褲外輪廓并描述,對女褲廓形進行了分類,但在進行特征提取時由于自動化識別不足,還無法實現(xiàn)自動拾取關(guān)鍵點,需進行手動操作,這是識別系統(tǒng)實現(xiàn)全自動亟待解決的問題。
2.2.2 圖像分割
根據(jù)不同識別目的,圖像分割可以是圖像識別的前期工作,如先將服裝從雜亂背景中分割出來、再進行進一步識別提高準確性;[20]也可以是最終成果,如著裝人體的服裝檢測、輪廓檢測、自動識別抓取衣物等。[21]分割方法有基于閾值、基于邊緣檢測,以及基于區(qū)域的圖像分割。目前借助各種理論模型提出的分割算法已達上千種,在進行某幅圖像分割時,只采用一種方法一般較難得到理想的分割結(jié)果,因此需要將以上各種方法有機結(jié)合并加以改造,構(gòu)造多級分割體系,以獲得最優(yōu)的分割結(jié)果。
2.2.3 圖像匹配
圖像匹配是指從不同視角得到的圖像中識別出與目標相同或相似的圖像區(qū)域。最常用的匹配方法是模板匹配和模式識別,模板匹配形式較單一,基本是將圖像像素逐一對比,難以解決變形圖像的識別。
模式識別可用于圖像檢索和分類等,將相似的、與其他圖像區(qū)分度大的部分圖像分為同類,是人工智能發(fā)展的基石。現(xiàn)今某些模式識別算法還可進行圖像理解和描述,如高珊[22]提出樣本之間的相似度可通過距離度量學(xué)習(xí)來得到,其建立了一種多標簽距離度量學(xué)習(xí)模型,并將該模型運用到已獲得的特征上,得到新的距離度量學(xué)習(xí)特征;之后結(jié)合服裝圖片的客觀風(fēng)格文本描述信息,對多視圖學(xué)習(xí)特征集進行多標簽分類,得到服裝多個主觀風(fēng)格的識別結(jié)果。