2024年5月17日,计算机与软件工程学院邀请迪吉彭理工学院刘芳教授来学院开展学术报告,报告主题:如何让ChatGPT具备视觉能力。
刘芳教授结合人工智能技术落地场景,引入计算机视觉前沿研究——让ChatGPT具备视觉能力。首先,与卷积神经网络、循环神经网络对比,详细讲解transformer技术优势和关键技术:Positional Embedding、Self-Attention;然后,介绍ChatGPT系统架构、发展历史及亟待解决的问题;最后,详细讲解GPT的视觉能力,流行计算机视觉架构:Flamingo Architecture、Visual-ChatGPT、DreamBooth。
报告过程中,刘芳教授通过三个问题与学生进行互动,并奖励回答正确学生精美礼品。