Geo-AI浪潮下的影像辨識應用新契機

資料來源: 興創知能股份有限公司
發佈日期: 2022/03/14
相關關鍵字: 智慧國土, AI影像辨識, 地理資訊系統（GIS）, 智慧空間資訊(Geospatial AI)

將AI技術結合地理資訊系統（GIS），創造智慧空間資訊（Geospatial AI），扮演未來生活應用不可或缺的科技角色。本文將帶領大家挖掘，有別於過去Geo-AI影像辨識技術應用的新契機。

人工智慧（Artificial Intelligence, AI），已成為近幾年來最火熱的科技代名詞，而將AI技術結合地理資訊系統（Geographic Information System, GIS），創造智慧空間資訊（Geospatial AI, Geo-AI），更扮演未來生活應用不可或缺的科技角色。在各類型巨量數據萃取與快速累積的當今，硬體的強力支援以及AI演算法的不斷創新，為人類社會拓展出許多成功的AI數據應用服務，並且構築於GIS基礎上，提升至數位孿生地球（Digital Twin of Earth）的虛實整合理想。（右圖取材自123RF）

實際上，Geo-AI透過地球科學數位資料庫的概念，囊括了所有與3D空間資訊有關的議題，包含多元時空尺度的影像應用、地理空間資訊整合、三維點雲、都市建模與物聯網設備監測…等。興創知能股份有限公司已專注於圖資、影像與點雲的AI辨識（Image Recognition）技術應用多年，將在本文帶大家挖掘，有別於過去Geo-AI影像辨識技術應用的新契機。

要能飛天遁地，你得要有多尺度影像的幫忙

人類本是視覺動物，長久以來總需仰賴雙眼看到的事物來進行各種判斷，而這也真實反映了現代社會人們對於影像辨識的依賴。拜感光元件IC技術快速發展之賜，今日影像採集來源和效率，相比於19世紀早期相機才剛普及的時代，早已不可同日而語，甚至依據各領域五花八門的應用情境，造就了多尺度的影像來源（參見圖1）。由遠距離至近距離包含了太空尺度的衛星遙測、高空中的航空攝影、近地表的無人機攝影，再到布滿大街小巷無所不在的CCTV;若改由單鏡頭到多鏡頭來區分，則包含了再普遍不過的單鏡相機、用於立體視覺的雙目相機，以及街景常用的環景相機等。

顯然，搭配著上述不同尺度的影像來源與拍攝場景，影像辨識的應用也將不再侷限於那些傳統電腦視覺（Computer Vision）常見的物件辨識議題，更甚以Geo-AI的思維來看，這些可能帶有地理空間位置資訊的多尺度影像數據，無疑是未來創造智慧空間資訊生態系的重要基礎。

選對模型架構，做好Geo-AI影像辨識

人工智慧最早出現於1956年，時至今日發展超過一甲子，從傳統的機器學習（Machine Learning），演化至深度學習（Deep Learning），不斷支撐著電腦視覺技術的進步，創造了許多影像辨識的突破與應用。從最基礎的觀點來看，影像辨識即是一種判斷影像中是否包含特定目標的應用。看似簡單的問題，其實應可拆分為四種辨識情境（參見圖2），包含影像分類（Classification）、物件偵測（Objection Detection）、語意分割（Semantic Segmentation）與實體切割（Instance Segmentation）等，這也分別代表著不同難易程度的影像處理邏輯。

從演算法的角度切入，卷積神經網路（Convolutional Neural Networks, CNN）是影像辨識情境中最為常見的基礎架構，透過卷積層（Convolutional）、池化層（Pooling）與全連接層（Fully-onnected）串流設計，將大量二維影像轉化為單一維度特徵排列組合方式，並有效萃取目標物的特徵值。隨著影像分割問題變得過於複雜，在不同應用情境的驅使下，電腦視覺的領域仍持續誕生許多表現亮眼的演算法，例如U-Net、VGG-16、DeepLab、RetinaNet及FasterRCNN等模型。值得一提的是，在追求即時動態影像辨識的應用上，近期最受推崇的YOLO（You Only Look Once）系列演算法，在2020年也有了突破性的發展，由中研院團隊與俄羅斯學者共同研發的YOLOv4以優異的運算效率，成為當前最廣為使用的影像物件偵測模型。

實際上，AI影像辨識模型百百種，面對不同的影像尺度與應用情境，我們可能會選擇不同的演算法架構，但從無到有的打造模型過程，除了把關訓練資料品質，模型訓練流程（參見圖3）一般包含了影像採集、影像標記、模型建構、訓練與驗證，通過評價的模型才得以進行佈署接續上線服務的任務。

經驗豐富，打造Geo-AI跨領域應用服務

興創知能AI技術研發團隊近年來致力於Geo-AI影像辨識技術整合應用的發展，打造TronGisPy開源程式碼成為業界首創，至今涉足多元尺度影像辨識服務（參見圖4），包含衛星遙測（農業）、航空照片（森林）、無人機（交通）、CCTV（水務）、環景相機（交通）、單鏡相機（交通）、雙目相機（營建）等議題，都值得帶大家深究其奧妙。

精準農業資料服務：使用光學衛星（Sentinel-2）【註】影像，配合歷年水稻分布調查作為標記圖資，建立AI作物辨識模型（模型架構包含CNN與LightGBM），提供水稻田分布調查雲端資料基礎服務。
森林資源調查輔助：使用航空照片，配合森林資源長期圖資調查，建立AI森林覆蓋辨識模型（模型架構為CNN），提供分類結果建議，改善人工數化效率與正確性。
車輛物件辨識應用：使用UAV無人機影像，配合既有的AI開源模型（模型架構為YOLOv4），完成白天與夜間情境下，車輛位置辨識與移動軌跡偵測之應用。
橋墩水位辨識應用：使用既有的橋墩監控CCTV影像，配合OpenCV的特徵萃取方法，完成墩柱水尺影像辨識應用，偵測白天與夜間的即時水位變化，確保橋墩行駛安全。
道路物件資源盤整：在產製高精度地圖（High Definition Maps, HD Map）的過程中，善用裝載於測繪車上的環景影像，配合人工標記的投入，建立AI道路物件辨識模型（模型架構為YOLOv4），加速道路人工物件盤點之效率。
道路鋪面破損辨識：使用裝載於車上的單鏡相機，配合高品質的專業標記數據，建立AI道路破損辨識模型（模型架構為CNN），完成即時辨識、即時傳輸之服務，以提升人工巡查道路品質之效率。
文史甬道形變監測：使用雙目相機全天候監控，配合OpenCV的特徵萃取方法，完成狹小甬道兩側牆面固定點位的時序形變監測，並以LINE Notify為媒介即時推播牆面是否有位移之數據。

讓平面影像擁有空間意義，成就Geo-AI浪潮的重要關鍵

影像資料的系統整合：面對多尺度影像辨識議題，勢必得處理多樣且複雜的影像的來源與規格，從資料面的採集、清理、標記、訓練，衍伸到應用面的自動化與專業的數據解讀，均考驗著團隊應付每一個環節的整合能力。
領域知識的問題拆解：僅有數據處理的能力依然不夠，為了精準掌握跨領域的應用場景，必須要有專業領域的知識投入，才能有效加速應用程式的開發，從痛點的理解，客製化設計解決方案。
影像的空間資訊意義：在Geo-AI的架構下，影像不再只是一張圖片如此簡單，如何讓影像辨識的結果帶有地理空間位置資訊，考驗著團隊在空間資訊與攝影測量的整合能力。

高空機載攝影容易理解，但地表上那些各式各樣的影像又該如何讓它們也同樣賦予空間資訊的意義呢？我們期待各種跨領域的議題討論與合作，一同打造飛天遁地的智慧空間應用服務願景。

【註】Sentinel-2衛星：為歐洲太空總署（European Space Agency, ESA）發射的繞極軌道衛星，最短5日的再訪觀測頻率，與13個光學波段的支援，已是現今高解析度（10公尺）光衛星觀測中極具優勢的免費國際影像資源，因此不論是在環境監測、森林農業、海洋資源、冰川監控或洪水災害等議題，都有相當廣泛的應用成果。

分享文章: