佛光大學 應用科技與設計學院

:::

AI跨域應用新視野──施永強教授於佛光大學分享影像分析與媒體安全研究

  • 2026-03-04
  • tech
佛光大學科技學院於2026年3月4日邀請美國新澤西理工學院(New Jersey Institute of Technology, NJIT)電腦科學系 施永強(Frank Y. Shih)教授 蒞校專題演講,主題為 「AI in Ecology, Image Captioning and Forgery Detection」。施教授長期致力於人工智慧、圖樣辨識、影像處理、電腦視覺、多媒體資料安全與影像鑑識等領域的研究,並在國際學術界具有重要影響力。其研究涵蓋機器學習與深度學習於影像分析與多媒體安全的應用,並出版多本人工智慧相關專書,對於推動影像智慧分析與數位媒體安全研究具有深遠貢獻。

本次演講首先回顧人工智慧在影像分析領域的發展歷程。隨著深度學習技術的快速進展,人工智慧在影像分類(Image Classification)、物件偵測與分割(Object Detection and Segmentation)、影像生成(Image Generation)與影像增強(Image Enhancement)等技術上均取得突破性成果。透過大型資料集與深度神經網路模型的訓練,人工智慧已能在許多影像辨識任務中達到甚至超越人類的辨識能力,使影像理解與視覺分析技術快速應用於醫療、環境監測、智慧城市及自動化系統等多元領域。 

在應用層面方面,施教授介紹人工智慧在生態研究中的實際案例。透過深度學習模型分析蜜蜂翅膀與蝴蝶影像資料,可以有效協助物種辨識與生物多樣性監測。然而,在生態研究中常面臨影像資料量不足或資料分布不均等問題,這對於深度學習模型的訓練造成挑戰。為解決此問題,研究中運用了 資料增強(Data Augmentation) 與 遷移學習(Transfer Learning) 等方法,透過影像旋轉、變形與視角轉換等方式擴增資料量,同時利用大型資料集(如 ImageNet)預先訓練的模型進行遷移學習,以提升分類準確率與模型效能,成功改善小型資料集的學習效果。

此外,演講亦介紹近年人工智慧與語言模型結合所發展的 影像描述生成(Image Captioning) 技術。此技術能透過深度學習模型自動分析影像中的物件、場景與關係,並生成完整的自然語言描述。例如,人工智慧可以從影像中辨識「一隻狗坐在草地上,旁邊有一個紅色消防栓」等細節,並將視覺資訊轉換為文字敘述。施教授進一步說明其研究團隊所提出的多流交叉注意力模型(Multi-Stream Cross Attention),透過物件特徵、背景資訊與高頻影像特徵的整合分析,提升影像描述生成的準確性與細節表現。此技術亦可應用於醫學影像分析,例如 MRI、X-ray 或 CT 影像的自動報告生成,協助醫師更快速理解影像資訊並提升臨床診斷效率。

在數位媒體高度普及的時代,影像真實性與資訊安全已成為重要議題。演講中亦探討 數位影像偽造偵測(Digital Forgery Detection) 技術。隨著影像編輯工具與生成式人工智慧(如 GAN)技術的進步,影像偽造的手法愈來愈精細,包括影像複製移動(Copy-Move)、影像拼接(Splicing)及影像修補(Inpainting)等方式,均可能造成資訊誤導與安全風險。施教授說明目前研究如何利用深度學習與電腦視覺技術來辨識影像中的異常區域,並透過特徵匹配與像素層級分析偵測偽造痕跡。然而,由於影像可能經過旋轉、縮放、模糊或壓縮等複雜處理,使偽造偵測仍面臨相當挑戰,因此相關研究仍持續發展中。

透過本次專題演講,佛光大學師生得以深入了解人工智慧在影像理解、生成與安全鑑識等領域的最新研究成果與技術趨勢,也展現人工智慧在生態監測、醫療影像分析與數位媒體安全等跨領域應用的廣大潛力。此次活動不僅促進國際學術交流,也讓學生能從世界級學者的研究經驗中獲得啟發,進一步拓展對人工智慧發展與未來應用的視野。


這是一張圖片
國際著名的人工智慧、影像處理和模式識別專家施永強教授蒞臨應用科技與設計學院演講

這是一張圖片
趙校長致詞

這是一張圖片
施教授演講吸引滿場師生到場聆聽