佛光大学 应用科技与设计学院

:::

AI跨域应用新视野──施永强教授于佛光大学分享影像分析与媒体安全研究

  • 2026-03-04
  • tech
佛光大学科技学院于2026年3月4日邀请美国新泽西理工学院(New Jersey Institute of Technology, NJIT)电脑科学系 施永强(Frank Y. Shih)教授 莅校专题演讲,主题为 「AI in Ecology, Image Captioning and Forgery Detection」。施教授长期致力于人工智能、图样辨识、影像处理、电脑视觉、多媒体资料安全与影像鑑识等领域的研究,并在国际学术界具有重要影响力。其研究涵盖机器学习与深度学习于影像分析与多媒体安全的应用,并出版多本人工智能相关专书,对于推动影像智慧分析与数码媒体安全研究具有深远贡献。

本次演讲首先回顾人工智能在影像分析领域的发展历程。随着深度学习技术的快速进展,人工智能在影像分类(Image Classification)、物件侦测与分割(Object Detection and Segmentation)、影像生成(Image Generation)与影像增强(Image Enhancement)等技术上均取得突破性成果。透过大型资料集与深度神经网络模型的训练,人工智能已能在许多影像辨识任务中达到甚至超越人类的辨识能力,使影像理解与视觉分析技术快速应用于医疗、环境监测、智慧城市及自动化系统等多元领域。 

在应用层面方面,施教授介绍人工智能在生态研究中的实际案例。透过深度学习模型分析蜜蜂翅膀与蝴蝶影像资料,可以有效协助物种辨识与生物多样性监测。然而,在生态研究中常面临影像资料量不足或资料分布不均等问题,这对于深度学习模型的训练造成挑战。为解决此问题,研究中运用了 资料增强(Data Augmentation) 与 迁移学习(Transfer Learning) 等方法,透过影像旋转、变形与视角转换等方式扩增资料量,同时利用大型资料集(如 ImageNet)预先训练的模型进行迁移学习,以提升分类准确率与模型效能,成功改善小型资料集的学习效果。

此外,演讲亦介绍近年人工智能与语言模型结合所发展的 影像描述生成(Image Captioning) 技术。此技术能透过深度学习模型自动分析影像中的物件、场景与关系,并生成完整的自然语言描述。例如,人工智能可以从影像中辨识「一只狗坐在草地上,旁边有一个红色消防栓」等细节,并将视觉资讯转换为文字叙述。施教授进一步说明其研究团队所提出的多流交叉注意力模型(Multi-Stream Cross Attention),透过物件特征、背景资讯与高频影像特征的整合分析,提升影像描述生成的准确性与细节表现。此技术亦可应用于医学影像分析,例如 MRI、X-ray 或 CT 影像的自动报告生成,协助医师更快速理解影像资讯并提升临床诊断效率。

在数码媒体高度普及的时代,影像真实性与资讯安全已成为重要议题。演讲中亦探讨 数码影像伪造侦测(Digital Forgery Detection) 技术。随着影像编辑工具与生成式人工智能(如 GAN)技术的进步,影像伪造的手法愈来愈精细,包括影像复制移动(Copy-Move)、影像拼接(Splicing)及影像修补(Inpainting)等方式,均可能造成资讯误导与安全风险。施教授说明目前研究如何利用深度学习与电脑视觉技术来辨识影像中的异常区域,并透过特征匹配与像素层级分析侦测伪造痕迹。然而,由于影像可能经过旋转、缩放、模糊或压缩等复杂处理,使伪造侦测仍面临相当挑战,因此相关研究仍持续发展中。

透过本次专题演讲,佛光大学师生得以深入了解人工智能在影像理解、生成与安全鑑识等领域的最新研究成果与技术趋势,也展现人工智能在生态监测、医疗影像分析与数码媒体安全等跨领域应用的广大潜力。此次活动不仅促进国际学术交流,也让学生能从世界级学者的研究经验中获得启发,进一步拓展对人工智能发展与未来应用的视野。


这是一张图片
国际着名的人工智能、影像处理和模式识别专家施永强教授莅临应用科技与设计学院演讲

这是一张图片
赵校长致词

这是一张图片
施教授演讲吸引满场师生到场聆听