特邀报告:服务型机器人进展与展望
报告嘉宾:马利庄,上海交通大学教授,国家杰青
CVPR2024论文报告:
1)新一代”书生∙图像模型”:扩大视觉基础模型规模并对齐通用视觉语言任务
2)LeftRefill: 通过泛化的文生图大模型基于左侧参考视图控制右侧画布生成
3)SparseOCC: 重新思考基于视觉的语义占用预测的稀疏潜在表征
4)基于频域分布的非对齐鲁棒图像变换损失函数
5)DiffMOT:一种具有非线性预测能力的基于扩散模型的实时多目标跟踪器
6)基于自适应退出机制的可逆解码器推动图像去模糊的极限