WACV-2025-Papers

June 30, 2025 · View on GitHub

Alt text

会议时间：2025年2月28日–3月4日

会议网址：https://wacv2025.thecvf.com/

查看2025年综述文献点这里↘️2025-CV-Surveys

2025 年论文分类汇总戳这里

↘️WACV-2025-Papers ↘️CVPR-2025-Papers ↘️ICCV-2025-Papers

2024 年论文分类汇总戳这里

↘️WACV-2024-Papers ↘️CVPR-2024-Papers ↘️ECCV-2024-Papers

2023 年论文分类汇总戳这里

2022 年论文分类汇总戳这里

2021 年论文分类汇总戳这里

2020 年论文分类汇总戳这里

❣❣❣ WACV 2025 论文分类整理已完成

:loudspeaker::loudspeaker::loudspeaker:获奖论文

:trophy:最佳论文(算法)

RayGauss: Volumetric Gaussian-Based Ray Casting for Photorealistic Novel View Synthesis
:star:code
:house:project

:trophy:最佳论文(应用)

Optimizing Vision-Language Model for Road Crossing Intention Estimation

:trophy:最佳学生论文

GeoDiffuser: Geometry-Based Image Editing with Diffusion Models
:star:code
:house:project

:trophy:最佳学生论文荣誉提名奖

Cross-Domain and Cross-Dimension Learning for Image-to-Graph Transformers
:star:code

:trophy:Time of time award: (tie)

目录

:cat:	:dog:	:tiger:	:wolf:
1.Othere(其它)	2.Face(人脸)	3.Image Segmentation(图像分割)	4.Image Progress(图像/视频处理)
5.Image Classification(图像分类)	6.Image/video Compression(图像/视频压缩)	7.Image Captioning(图像字幕)	8.Image/Video Retrieval(图像/视频检索)
9.SR(超分辨率)	10.OD(目标检测)	11.OT(目标跟踪)	12.UAV/RS/Satellite Image(无人机/遥感/卫星图像)
13.Biomedical(生物特征识别)	14.Autonomous Driving(自动驾驶)	15.Medical Image Progress(医学影响处理)	16.HPE(人体姿态估计)
17.Action Detection(动作检测)	18.Person Re-id(行人重识别)	19.Video	20.Point Cloud(点云)
21.3D(三维重建\三维视觉)	22.OCR	23.VQA(视觉问答)	24.GAN/Image Synthesis(图像生成)
25.Style Transfer(风格迁移)	26.Motion Generation(人体运动生成)	27.Machine Learning(机器学习)	28.GNN/GCN
29.Deep Learning	30.Few/Zero-Shot Learning/DG/A(小/零样本/域泛化/域适应)	31.NAS(神经架构搜索)	32.MC/KD/Pruning(模型压缩/知识蒸馏/剪枝)
33.Semi/SSL(半/自监督)	34.VL(视觉语言)	35.Dataset/Benchmark(数据集/基准)	36.Object Pose Estimation(物体姿态估计)
37.Scene(场景)	38.HOI Detection(交互检测)	39.Robots(机器人)	40.Deepfake
41.Anomaly Detection(异常检测)	42.Industrial Anomaly Detection(工业缺陷检测)	43.Neural Radiance Fields	44.Dense Prediction(密集预测)
45.Transformer	46.Sound	47.Sketch(草图)	48.Protecting copyright(保护版权)
49.计算成像

49.计算成像

48.Protecting copyright(保护版权)

47.Sketch(草图)

46.Sound

45.Transformer

44.Dense Prediction(密集预测)

Optimizing Dense Visual Predictions Through Multi-Task Coherence and Prioritization
:star:code
Cross-Task Affinity Learning for Multitask Dense Scene Predictions密集场景预测

43.Neural Radiance Fields

42.Industrial Anomaly Detection(工业缺陷检测)

41.Anomaly Detection(异常检测)

40.Deepfake

39.Robots(机器人)

38.HOI Detection(交互检测)

37.Scene(场景)

36.Object Pose Estimation(物体姿态估计)//

35.Dataset/Benchmark(数据集/基准)

34.Vision-Language(视觉语言)

33.Semi/self-supervised learning(半/自监督)//

32.MC/KD/Pruning(模型压缩/知识蒸馏/剪枝)//

31.Neural Architecture Search(神经架构搜索)

30.Few/Zero-Shot Learning/DG/A(小/零样本/域泛化/域适应)

29.Deep Learning

28.GNN/GCN

27.Machine Learning(机器学习)

26.Motion Generation(人体运动生成)

25.Style Transfer(风格迁移)

24.GAN/Image Synthesis(图像生成)

23.Visual Question Answering(视觉问答)

22.OCR

手写文档识别
- DocTTT: Test-Time Training for Handwritten Document Recognition using Meta-Auxiliary Learning
场景文本识别
- Stratified Domain Adaptation: A Progressive Self-Training Approach for Scene Text Recognition
场景文本编辑
- FASTER: A Font-Agnostic Scene Text Editing and Rendering Framework
文本变化检测
- Text Change Detection in Multilingual Documents Using Image Comparison
文本多边形检测
- TPD-STR: Text Polygon Detection with Split Transformers
表结构识别
- Treading Towards Privacy-Preserving Table Structure Recognition

21.3D(三维重建\三维视觉)

20.Point Cloud(点云)

19.Video

NeuroViG - Integrating Event Cameras for Resource-Efficient Video Grounding
MVFNet: Multipurpose Video Forensics Network using Multiple Forms of Forensic Evidence
GEXIA: Granularity Expansion and Iterative Approximation for Scalable Multi-Grained Video-Language Learning视频语言学习
视频监控
- DashCop: Automated E-Ticket Generation for Two-Wheeler Traffic Violations using Dashcam Videos使用Dashcam视频自动生成两轮车交通违章电子票
视频理解
视频时许定位
- FlashVTG: Feature Layering and Adaptive Score Handling Network for Video Temporal Grounding
  :star:code
视频异常检测
视频镜像检测
- RGB-D Video Mirror Detection
视频时刻检索
- Moment of Untruth: Dealing with Negative Queries in Video Moment Retrieval
- Background-Aware Moment Detection for Video Moment Retrieval
视频帧插值
- Explicit Guidance for Robust Video Frame Interpolation against Discontinuous Motions
视频稳定
- SensorFlow: Sensor and Image Fused Video Stabilization

18.Person Re-id(行人重识别)

17.Action Detection(动作检测)

Learning to Visually Connect Actions and their Effects
ActionDiffusion: An Action-Aware Diffusion Model for Procedure Planning in Instructional Videos
Inferring Past Human Actions in Homes with Abductive Reasoning
动作检测
- VAD
  - Boosting Semi-Supervised Video Action Detection with Temporal Context
- 零样本动作检测
  - Spatio-Temporal Context Prompting for Zero-Shot Action Detection
- 开放词汇动作检测
  - Exploiting VLM Localizability and Semantics for Open Vocabulary Action Detection
    :star:code
动作识别
群组动作识别
- LiGAR: LiDAR-Guided Hierarchical Transformer for Multi-Modal Group Activity Recognition
时许动作定位
动作质量评估
- I3D-AE-LSTM: A 2-Stream Autoencoder for Action Quality Assessment using a Newly Created Cricket Batsman Video Dataset
社交互动识别
- Loose Social-Interaction Recognition in Real-World Therapy Scenarios

16.Human Pose Estimation(人体姿态估计)

15.Medical Image Progress(医学影响处理)

14.Autonomous Driving(自动驾驶)

13.Biomedical(生物特征识别)

On Which Data Distribution (Synthetic or Real) We Should Rely for Soft Biometric Classification软生物特征分类
指纹检测
- ColFigPhotoAttnNet: Reliable Finger Photo Presentation Attack Detection Leveraging Window-Attention on Color Spaces
虹膜检测
- A Parametric Approach to Adversarial Augmentation for Cross-Domain Iris Presentation Attack Detection
基于虹膜图像的死后间隔估计
- Forensic Iris Image-Based Post-Mortem Interval Estimation

12.UAV/Remote Sensing/Satellite Image(无人机/遥感/卫星图像)

11.Object Tracking(目标跟踪)

10.Object Detection(目标检测)

9.Super Resolution(超分辨率)

8.Image/Video Retrieval(图像/视频检索)

跨域检索
- UCDR-Adapter: Exploring Adaptation of Pre-Trained Vision-Language Models for Universal Cross-Domain Retrieval
  :star:code
图像检索
视频检索
信息检索
- Patchfinder: Leveraging Visual Language Models for Accurate Information Retrieval using Model Uncertainty

7.Image Captioning(图像字幕)

6.Image/video Compression(图像/视频压缩)

5.Image Classification(图像分类)

4.Image Progress(图像/视频处理)

3.Image Segmentation(图像分割)

2.Face(人脸)

1.Othere(其它)

2020 年论文分类汇总戳这里

↘️CVPR-2020-Papers ↘️ECCV-2020-Papers

2021 年论文分类汇总戳这里

↘️ICCV-2021-Papers ↘️CVPR-2021-Papers

2022 年论文分类汇总戳这里

↘️CVPR-2022-Papers ↘️WACV-2022-Papers ↘️ECCV-2022-Papers

2023 年论文分类汇总戳这里

↘️CVPR-2023-Papers ↘️WACV-2023-Papers ↘️ICCV-2023-Papers ↘️2023-CV-Surveys

扫码CV君微信(注明：CVPR)入微信交流群：

9475fa20fd5e95235d9fa23ae9587a2