VALSE 2025大会 Workshop主题确定 会议时间: 2025年6月6-8日 会议地点: 广东珠海 主办单位: 中国图象图形学学会 承办单位: 中山大学 VALSE年度研讨会旨在为计算机视觉、图像处理、模式识别、机器学习、具身智能、机器人等领域的青年学者提供高水准、高层次、高质量的学术交流舞台。在VALSE的舞台上,我们践行勇于探索、实证、创新的科学精神;我们恪守理性学术的百家争鸣和思想交锋;我们期许青年学者越发优雅的学术华尔兹。VALSE为国内青年学者在思想交流和学术合作上敏捷赋能,促进他们在本领域的协同创新,最终提升中国学者在国际舞台上的学术影响力。 本届视觉与学习青年学者研讨会 (VALSE 2025)将在广东珠海召开,由中国图象图形学学会主办,中山大学承办,预计会议超过5000人参会。大会主页: VALSE 2025的20场研讨会Workshop主题确定如下: 研讨会一:多模态遥感通用模型 多模态遥感通用模型是当前遥感领域的前沿研究方向,旨在通过AI技术提升多模态遥感数据的处理与分析能力。随着可见光、红外、SAR等多模态遥感技术的快速发展,遥感数据呈现出高维度、多模态、空间相关性强等特点,但同时也面临图像质量差、样本标注困难、数据异构性等挑战。构建通用模型的核心在于解决跨尺度、跨传感器的数据融合问题,克服分辨率差异和时空尺度不一致性,以提升模型的适应性、泛化能力和地物识别精度。当前,尽管已有多种遥感通用模型,但其性能瓶颈、适用场景及优化空间仍需深入探讨。本研讨会将聚焦遥感大数据质量与多模态通用模型构建,推动理论创新与技术突破,为遥感数据处理提供更高效、精准的解决方案。 研讨会二:多模态学习助力智慧医疗:从科研到落地 “多模态学习助力智慧医疗:从科研到落地”是当前人工智能与医疗交叉领域的前沿主题,旨在通过多模态学习技术整合医学影像、文本、基因组数据等多源医疗信息,推动智慧医疗的智能化与精细化发展。多模态学习不仅能够提升疾病诊断、预测和个性化治疗的精准度,还面临医疗数据隐私、模型可解释性及多模态数据异质性等挑战。本次研讨会汇聚学术界、医疗机构和工业界的顶尖专家,聚焦多模态学习在医学影像分析、疾病预测等领域的创新应用与技术转化,通过圆桌论坛、案例展示等形式,促进跨学科合作与科研成果的临床落地,为智慧医疗生态系统的构建提供理论支持与实践指导,助力医疗行业的变革与突破。 研讨会三:开放环境视觉理解与生成 开放环境中的视觉理解与生成是计算机视觉领域的前沿挑战,其动态性、不确定性和多样化特性对传统视觉算法提出了更高要求。传统方法依赖封闭数据集和预定义任务,难以适应开放环境的复杂需求。随着深度学习、大规模预训练模型和生成式AI的快速发展,如何提升模型在开放环境中的泛化能力、适应能力和生产力成为研究焦点。本次Workshop聚焦开放集识别、跨模态学习、生成式AI应用、多任务协同等核心议题,覆盖从基础理论 (如零样本学习、域泛化)到实际应用 (如医疗图像分析、自动驾驶)的多样化内容。通过主题演讲、开放式讨论和圆桌会议等形式,汇聚领域顶尖专家与研究者,分享最新成果,探讨技术瓶颈与未来方向,推动开放环境视觉技术在智慧医疗、无人驾驶等领域的落地应用,为参会者提供理论到实践的全方位视角与合作机会。 研讨会四:低空智能感知与理解 “低空智能感知与理解”是当前低空经济与人工智能交叉领域的前沿主题,旨在探讨AI技术在低空环境中的应用与未来发展趋势。低空经济作为全球竞争的战略新兴产业,以无人机、5G通信等技术为支撑,正迎来前所未有的发展机遇。然而,低空环境的复杂性、动态性以及飞行安全与监管问题对智能感知与理解提出了更高要求。本次Workshop聚焦AI技术在低空经济中的关键应用,如无人机智能感知、空域资源优化、飞行安全监管等,结合国家政策与行业需求,深入探讨技术瓶颈与未来方向。通过汇聚学术界与工业界的顶尖专家,分享最新研究成果与实践经验,搭建跨领域合作平台,推动低空经济的智能化发展,为智慧空天交通时代的到来提供理论支持与技术保障。 研讨会五:大场景多对象的重建与生成 “大场景多对象的重建与生成”是计算机视觉与人工智能领域的前沿研究方向,聚焦于大型开放环境 (如广场、车站、机场等)中以人为中心的感知、重建与生成技术。该研究旨在实现复杂大场景的高精度重建、车辆与人群的动态感知、全局空间定位以及静态与动态对象的生成,为公共安全、自动驾驶、虚拟现实等领域提供智能支持。随着AIGC等技术的快速发展,该领域在精准监控、态势预测及虚拟与真实环境交互方面展现出巨大潜力。本次Workshop汇聚高校学者与企业研究者,探讨技术的前沿进展、理论基础与应用落地可能,推动国家公共安全与智能化建设的深度融合,同时通过学生互动环节激发创新思维与跨领域合作。 研讨会六:视觉通用模型 “视觉通用模型”是计算机视觉领域的前沿研究方向,标志着从专用模型向通用模型的转变趋势。通用模型通过多模态表征学习和多任务基础模型架构,能够更好地建模多模态数据之间的相关性,展现出更强的跨任务适用性和迁移性,为视觉感知从封闭条件走向开放场景提供了重要支撑。该研究不仅推动了感知决策一体化高效模型的发展,还为实现通用人工智能 (AGI)提供了全新思路。本次Workshop聚焦多模态表征学习、模型设计与感知生成一体化等核心议题,全面探讨视觉通用模型的最新进展与未来趋势。通过现场调查问卷与Panel讨论等互动形式,促进广泛而高效的学术交流,为相关领域的研究者提供理论借鉴与实践启发,推动视觉感知技术的创新与应用。 研讨会七:多模态认知计算 “多模态认知计算”是人工智能领域的前沿研究方向,旨在模拟人类多感官联觉机制,通过多模态关联、跨模态生成和多模态协同等任务,提升机器的认知能力。其核心目标是以最少的数据实现信息量的最大化,涵盖多模态学习机制、通用多模态学习及多模态自主学习等关键问题。该研究为机器感知与决策提供了更高效、智能的解决方案,广泛应用于人机交互、智能医疗、自动驾驶等领域。本次Workshop作为第四届多模态认知计算研讨会会议,汇聚全国高校、科研院所及企业的资深专家,分享最新研究成果与实践经验,推动产学研用深度融合与协同创新。 研讨会八:语言-视觉协同生成 “语言-视觉协同生成”是人工智能领域的前沿研究方向,聚焦语言模型与视觉生成的深度融合与交互。随着语言与视觉大模型的快速发展,语言模态在视觉生成、感知、理解及交互中的协同作用日益凸显,为2D/3D图像生成、视觉任务调度及3D视觉交互控制等任务提供了全新的探索机遇。本次研讨会特邀领域专家,围绕语言模型优化视觉生成质量、视觉任务调度及3D交互控制等核心议题展开讨论,旨在推动语言与视觉协同技术的创新与应用。通过分享最新研究成果与实践经验,激发跨领域合作与创造潜力,为语言-视觉协同生成的理论研究和技术落地提供前沿视角与解决方案,助力人工智能在多模态交互领域的突破性发展。 研讨会九:生物特征识别遇上AI+Science “生物特征识别遇上AI+Science”是人工智能与脑科学交叉领域的前沿研究方向,聚焦面部生物特征识别技术在AI4Science中的应用与探索。人脸作为视觉认知的核心对象,其识别机制与人类大脑的认知过程具有相似性,为神经科学和心理学研究提供了独特视角。通过研究神经网络的面部认知方式,可以揭示人脑认知机制,推动脑科学的突破性进展。本次研讨会以人脸为切入点,探讨AI与神经学、心理学的深度融合,挖掘跨学科研究的新机遇与新热点,展现鲜明的跨学科特色。结合2024年诺贝尔奖对AI4Science潜力的肯定,本研讨会旨在激发创新火花,推动面部生物特征识别技术在科学研究中的前沿应用,为人工智能与脑科学的协同发展提供理论支持与实践启示。 研讨会十:基于生成式AI驱动的具身智能 “基于生成式AI驱动的具身智能”是人工智能领域的前沿研究方向,旨在利用生成式AI的强大能力,推动智能体在复杂任务中的感知、决策与行为优化。生成式AI通过大规模数据训练,不仅能够帮助智能体掌握抽象计划和行为策略,还能生成逼真的仿真环境,克服传统物理实验中数据稀缺和成本高昂的问题。近期,基于扩散模型的机器人策略控制、模仿学习和运动规划方法成为研究热点。本次研讨会汇聚具身智能领域的专家与初创公司代表,分享技术转化与实际应用经验,探讨生成式AI在具身智能中的适应与学习、虚拟环境生成与优化等核心议题。通过研讨会讲座与互动研讨,推动生成式AI在自动驾驶等商业场景中的应用落地,释放Scaling Law的潜力,助力研究成果从实验室走向市场,为具身智能的未来发展提供创新思路与实践路径。 研讨会十一:类脑成像:当事件相机遇到AI “类脑成像:当事件相机遇到AI”是计算机视觉与人工智能交叉领域的前沿研究方向,聚焦于事件相机这一新型视觉传感器及其AI处理模型的构建。事件相机通过异步事件流实现亚毫秒级时间分辨率和高动态范围感知,显著降低数据冗余,为动态场景的高效解析提供了新途径。该研究涉及目标检测、识别、追踪及视觉重建等基础任务,同时融合类脑传感、深度学习和神经形态计算等多学科技术,推动感知机制与AI技术的协同创新。事件相机在高速动态场景、高动态范围环境及低功耗需求中展现出独特优势,广泛应用于自动驾驶、智能机器人和工业质检等领域。本次Workshop为学科交叉与合作提供新视角,探讨从理论到应用的完整路径,助力事件驱动感知与智能推理的深度融合,推动智能视觉体系的变革型发展。 研讨会十二:AI4Science,诺贝尔奖后的思考 “AI4Science,诺贝尔奖后的思考”是人工智能与科学交叉领域的前沿主题,旨在探讨AI如何重塑科学研究范式并推动科学突破。2024年诺贝尔物理学奖和化学奖的颁发,标志着AI在科学领域的突破性成就,但AI驱动科学研究仍处于起步阶段。本次研讨会由上海人工智能实验室与清华大学联合主办,聚焦AI如何打破知识边界、解析复杂科学数据、加速科学发现到市场应用的转化等核心问题。通过深入探讨AI与科学研究方式的差异及AI4Science学者的稀缺性,研讨会将推动AI在物理、化学、生命科学等领域的深度融合,构建跨学科数据与算法开放生态平台,赋能化学、新材料、气象、药物研发等行业的创新与落地,为AI4Science的未来发展提供全方位的前沿视角与创新动力。 研讨会十三:大模型基础理论-从理论视角看待大模型技术发展 “大模型基础理论-从理论视角看待大模型技术发展”是人工智能领域的前沿研究方向,旨在深入探讨大模型技术的内部运作机制与优化路径。尽管大模型在学术界与工业界取得了显著成就,但其基础理论研究相对滞后,限制了对其工作原理的深入理解与技术突破。本次研讨会聚焦思维链的作用、决策逻辑的可解释性、Transformer两阶段学习范式及参数化卷积方法等核心议题,填补大模型基础理论研究的空白。通过搭建学术与工业界的交流平台,研讨会将推动对大模型技术本质的深入探索,为解决其核心问题提供新思路与方法,助力大模型技术的可持续发展与创新应用,开启大模型研究的新篇章。 研讨会十四:自动驾驶多模态世界模型 “自动驾驶多模态世界模型”是人工智能与机器人领域的前沿研究方向,聚焦于具身大模型在自动驾驶中的应用。自动驾驶大模型 (如特斯拉FSD)通过实时接收视觉信号输入,直接控制车辆执行动作,初步实现了端到端智能化系统。然而,距离实现认知推理规划与通用操作的深度融合,形成真正的感知、决策、执行一体化的通用人工智能 (AGI)仍有较大差距。多模态世界模型作为当前最热门的AGI解决方案,通过整合多模态数据与环境交互,推动自动驾驶的持续优化与场景适应。本次研讨会邀请学术界与工业界领军专家,围绕多模态世界模型的技术突破与落地路径展开深入探讨,为自动驾驶的未来发展提供前沿视角与实践经验,推动AGI技术的创新与应用。 研讨会十五:人体动作理解与生成 “人体动作理解与生成”是计算机视觉与多媒体领域的前沿研究方向,致力于构建通用性强、适应性高的运动时空感知与生成模型,以提升人体动作识别、定位、分析、重建及生成的准确性与逼真度。在大模型的驱动下,该技术在行为分析、人机交互、运动捕捉等领域不断取得突破,并广泛应用于个性化训练、医疗康复、智能监控、社交媒体及数字人等场景。本次研讨会汇聚领域内专家学者,分享人体动作理解与生成的最新进展,探讨技术落地应用中的机遇与挑战,展望未来发展趋势。通过理论与实践的结合,推动人体动作理解与生成技术的创新与应用,为相关领域的发展提供前沿视角与解决方案。 研讨会十六:VALSE第一届深度连续学习研讨会 “VALSE第一届深度连续学习研讨会”聚焦于连续学习这一机器学习与深度学习领域的前沿方向,旨在赋予系统在动态环境中持续学习新知识并避免灾难性遗忘的能力,从而更接近人类的学习方式。连续学习涉及参数优化、知识迁移、记忆复现及模型动态调整等技术路径,广泛应用于自动驾驶、个性化推荐等长期学习场景。本次研讨会围绕灾难性遗忘解决策略、跨任务知识共享机制、大模型在连续学习中的应用等核心议题展开深入探讨,结合预训练大模型、具身智能与跨模态连续学习等新兴方向,激发创新思维。通过主题演讲与小型深度讨论会,为青年学者提供交流与成长平台,推动连续学习技术的突破与应用,为领域发展提供前瞻性视角与创新性思路。 研讨会十七:人工智能大模型安全 “人工智能大模型安全”是当前人工智能领域中的一个关键议题,随着大模型在金融、医疗、交通等行业的广泛应用,安全隐患逐渐暴露。数据隐私泄露、恶意攻击、算法偏见、决策误导以及有害信息传播等问题,严重影响着大模型的安全性和可靠性。为了应对这些挑战,安全技术正在朝着多维度方向发展,包括通过加固模型架构以防范恶意攻击,利用多模态分析技术识别和应对深度伪造内容等。尤其在垂直行业应用中,随着大模型深入特定场景,行业对定制化安全需求的关注不断增加。本研讨会将聚焦这一前沿议题,深入探讨大模型在实际应用中的安全风险及其应对策略,推动相关技术创新与行业应用落地,确保人工智能大模型在复杂环境中的安全可控运行。作为上一届VALSE研讨会的延续和升级,本次活动将为学术界与产业界提供一个深入交流的平台,助力大模型在各行业的安全部署与发展。 研讨会十八:面向移动终端的AI图像增强2025 “面向移动终端的AI图像增强2025”是计算机视觉与移动计算领域的前沿研究方向,聚焦于利用人工智能技术提升移动设备图像质量。随着移动终端性能的不断提升,AI驱动的图像增强技术在智能手机拍照等场景中的应用日益广泛。本次研讨会延续VALSE 2024的成功经验,邀请学术界与工业界专家分享最新研究成果与实践经验,探讨移动端图像增强的技术挑战与未来发展方向。通过企业专家发布真实需求与学者解题相结合的形式,研讨会将推动理论研究与工业应用的深度融合,促进技术快速落地。研讨会注重青年学者的参与,鼓励创新思维,旨在打造VALSE的标志性Workshop,为移动终端图像增强技术的持续发展提供前沿视角与实践动力。 研讨会十九:空间智能的感知与决策 “空间智能的感知与决策”是人工智能与机器人领域的前沿研究方向,聚焦于智能体在三维环境中的认知与行为转化能力。随着通用人工智能的发展,空间智能与具身智能的结合成为关键,通过三维感知、智能导航及端到端具身大模型等技术,赋予智能体理解复杂环境并执行精准决策的能力。该领域深度融合计算机视觉、机器人学、图形学等多学科,推动人形机器人、人机协同等应用的创新突破。本次研讨会以跨学科思维碰撞为核心,邀请多领域专家探讨三维环境建模、动态交互策略等核心议题,并通过现场Demo展示具身智能在真实物理世界中的实践挑战与进展,为智能系统的研究提供新视角。同时,结合VALSE中视觉与学习的主题,拓展技术应用边界,激发青年学者参与,推动空间智能从理论到落地的全链条发展。 研讨会二十:优秀学生论坛 本论坛邀请优秀学生分享自己的研究工作和科研体会,旨在为参加VALSE大会的青年学生们提供科研经验和指导。同时邀请国内高校和研究机构的青年教师与同学们进行深入交流讨论,面对面地回答同学们感兴趣的问题。本论坛的目标是为不同阶段的同学提供科研、学习、工作、个人发展、热点时事等多个方面的互动交流,帮助同学们解决实际科研中的困惑。在本论坛中,我们将邀请8位优秀学生讲者,分享自己的代表工作和科研经验。同时邀请10位左右青年教师与100名左右学生进行互动交流。 VALSE 2025的研讨会Workshop归纳了计算机视觉和机器学习领域的前沿和热点主题,相信参会者一定能从报告中收获满满,让我们一起期待VALSE 2025大会学术盛宴。为了办好VALSE 2025盛会,我们诚挚邀请相关企业合作!合作权益请参考: |
小黑屋|手机版|Archiver|Vision And Learning SEminar
GMT+8, 2025-10-13 07:24 , Processed in 0.014836 second(s), 14 queries .
Powered by Discuz! X3.4
Copyright © 2001-2020, Tencent Cloud.