攝影測量學的誕生與深度學習的起源
攝影測量學是一門“利用光學像片研究被攝物體的形狀、位置、大小、特性及相互位置關系”的學科。攝影測量誕生于19世紀早期。1838年,物理學家惠斯頓發(fā)明了實體鏡,第一次發(fā)現(xiàn)和定義了立體視覺。1839年,法國畫家達蓋爾發(fā)明了銀版攝影法,并制作了世界上第一臺真正的照相機。在此基礎上,法國測量學家Fourcade首先發(fā)現(xiàn)了用立體照片可重建立體視覺,從而促成了攝影測量學的誕生。攝影測量的第一個也是最重要的分支是航空攝影測量。
深度學習起源于20世紀中葉的人工智能。人工智能的兩個主要流派分別是符號主義(symbolism)和聯(lián)結(jié)主義(connectionism)。其中,符號主義者在1956年首次提出“人工智能”的概念,并統(tǒng)治了該領域近半個世紀;基于統(tǒng)計學習的思想被廣泛應用于機器學習、計算機視覺,以及攝影測量與遙感。
攝影測量與深度學習及計算機視覺的聯(lián)系
深度學習的最重要應用是在視覺圖像上,如手寫字體識別、自然圖像分類和檢索等。而攝影測量的研究對象就是視覺圖像,因此深度學習的成功和蓬勃發(fā)展,使得攝影測量也成為最受益的學科之一。
在語義上,攝影測量中的研究內(nèi)容就是采用智能方法為各行業(yè)提供專題圖。攝影測量的應用特性使得它并不關心諸如特征描述、上下文關系等中間結(jié)果。這種端到端的模式(end-to-end )特別適用深度學習方法。目前,深度學習已經(jīng)被廣泛用于遙感圖像的分類、識別、檢索和提取。與在幾何方面的欠佳表現(xiàn)不同,在語義上基本全面碾壓了傳統(tǒng)的方法。
1982年,Marr發(fā)表《視覺:從計算的視角研究人的視覺信息表達與處理》,是計算機視覺的開山之作。計算機視覺的最初研究:用計算機代替人眼,從圖片中重建3D世界。與攝影測量在幾何方面具有很高的重疊度。20世紀90年代,在語義方面計算機視覺開始蓬勃開展。其中運用了大量的機器學習知識。有學者分析指出機器學習與計算機視覺重疊度約在60%~70%,因此是非常緊密的兩門學科。
隨著深度學習成為機器學習的主流,深度學習在計算機視覺中得到廣泛應用。將深度學習引入到攝影測量中,特別是提高攝影測量后期語義處理的智能水平,是科學研究發(fā)展的必然途徑。
深度學習在攝影測量語義方面的應用
深度學習在遙感圖像語義提取方面的應用剛剛起步并逐漸普及。以下將從各類地物語義專題圖出發(fā),回顧深度學習的具體應用。
遙感圖像建筑、道路網(wǎng)等地物的提取一直是數(shù)十年來的熱門課題。雖然經(jīng)典方法取得一定的效果,但距離實用、市場、商業(yè)軟件尚有一定的距離。CNN目前正成為道路網(wǎng)提取的主流方法。通過級聯(lián)式端到端CNN同時實現(xiàn)了道路網(wǎng)提取及道路中心線提取,與其他方法比較,達到了更高的分類精度。通過CNN結(jié)合線積分卷積克服了樹木遮蔽、房屋陰影所造成的道路網(wǎng)殘缺問題。通過非監(jiān)督學習預處理和空間相關性的應用,利用深度學習極大地提高了復雜城市場景的道路提取精度。均為使用深度學習的方法進行道路提取并取得了良好的效果。
建筑物、農(nóng)作物、水體等專題的提取相對道路而言較少,但預期會有許多相關文獻近期發(fā)表。采用CNN實現(xiàn)高分辨率多光譜衛(wèi)星影像的建筑物提取。
首先采用AlexNet提取特征,最后的全連接層用于訓練SVM分類器并采用MRF模型精化。作物精細分類是攝影測量與遙感在農(nóng)業(yè)中的重要應用。在影像平面上進行2D卷積,在光譜方向上進行1D卷積,分別提取出影像空間特征和光譜特征,取得了比隨機森林和全連接MLP更好的作物分類精度。
為了從本質(zhì)上解決該問題,需要考慮兩點。
第一點是恰當?shù)倪w移學習方法。目前ImageNet等龐大的數(shù)據(jù)庫來自大眾攝影圖像,并不包括鳥瞰航攝圖像和衛(wèi)星遙感圖像。照片的標注諸如人、大象或椅子;遙感圖像中的標注諸如耕地、建筑、森林等。若直接將這些數(shù)據(jù)庫訓練得到的模型,用來進行遙感圖像直接分類,就要考慮遷移學習。遷移學習是將A數(shù)據(jù)集中訓練好的模型,應用在B數(shù)據(jù)集上。A與B可能是同源的,也可能存在巨大差異。這就要進一步發(fā)掘完善的遷移學習機制。
第二點是建立針對遙感圖像的開源的、完備的標簽數(shù)據(jù)庫。涵蓋足夠多的地物類別,每個類別包括足夠多的樣本。這樣的數(shù)據(jù)庫是攝影測量與遙感走向“自動化專題制圖”的必經(jīng)之路。然而,實現(xiàn)難度要比千萬圖像級別的ImageNet更大。首先,由于遠距成像的特性,圖像受到更多電磁輻射傳輸?shù)挠绊?。?jīng)過大氣傳播的電磁輻射與地物間的相互作用機理更加復雜,同一標簽的樣本往往呈現(xiàn)明顯的差異。這種差異不但對樣本的選取造成不便,而且對深度學習模型的可區(qū)分性提出更大的挑戰(zhàn)。
第二,眾包模式并不能完全起作用。普通人可能很好地辨認出的區(qū)別,因此通過互聯(lián)網(wǎng)眾包能夠快速構建一個巨大的標注數(shù)據(jù)庫;但是,小麥和水稻在遙感圖像上的差異,則需要專業(yè)人員的目視判讀。若影像分辨率較低,甚至可能需要實地調(diào)查。
第三,攝影測量與遙感界的科研模式尚需向開源發(fā)展。目前,遙感學界已經(jīng)開始走向開源模式,希望由公司、政府或科研機構能夠在短期內(nèi)建立的針對遙感圖像分類的標簽數(shù)據(jù)庫,并實現(xiàn)完全開源。有了足夠的數(shù)據(jù)標簽庫或恰當?shù)倪w移學習方法,并借助深度學習的泛化能力,可以預期未來攝影測量與遙感專題制圖的精度將比傳統(tǒng)的特征分類方法得到明顯的改進。
文章來源于網(wǎng)絡,由飛燕遙感m.theweddingcatcher.com編輯。登載此文出于傳遞更多信息之目的,版權歸原作者及刊載媒體所有,如本文中圖片或文字侵犯您的權益,請聯(lián)系我們。
猜你喜歡:
測繪4D產(chǎn)品中 DLG 數(shù)據(jù)是如何生產(chǎn)的?
激光LIDAR 航測技術應用在河道測繪
ADS系列數(shù)字航攝儀應用的是推掃式攝影方式,應用POS系統(tǒng)進行數(shù)字影像獲取。在航空攝影測量中應用ADS系列數(shù)字航攝儀,可以不經(jīng)過掃描便可以直接為遙感圖像處理系統(tǒng)及數(shù)字攝影測量提供全色...
與傳統(tǒng)的測繪技術相比,高空攝影技術可以對高空大比例尺的地形圖進行較為準確的測繪。...
航空攝影測量技術中的空中三角測量,是在立體攝影測量實踐中參照少部分野外控制點,并...
作為一種通過空間數(shù)據(jù)得到核心技術處理的綜合技術,技術應用過程中需要從技術層面分析...
POS輔助空中三角測量的第一步是要采用載波相位動態(tài)GPS定位技術測定攝站的空間位置(簡...
當代航空攝影測量加密方式中的GPS輔助光束法區(qū)域網(wǎng)平差,相位中心一般會被放置在航空G...
電話:025-83216189
郵箱:frank.zhao@feiyantech.com
地址:江蘇省南京市玄武區(qū)紅山街道領智路56號星河World產(chǎn)業(yè)園3號樓北8樓
微信公眾號
總經(jīng)理微信
版權所有:飛燕航空遙感技術有限公司 ? 2019 備案號:鄂ICP備19029994號-1 蘇ICP備20022669號-1 鄂公網(wǎng)安備:420106020021194號 簡體中文/English