Vision & Learning Lab @ Princeton University

PAPERS

By Topic: All . 3D Vision . Object Recognition . Action/Relation Recognition . Vision & Language . Automated Reasoning . Deep Learning

Llemma: An Open Language Model For Mathematics
Zhangir Azerbayev, Hailey Schoelkopf, Keiran Paster, Marco Dos Santos, Stephen McAleer, Albert Q. Jiang, Jia Deng, Stella Biderman, Sean Welleck
International Conference on Learning Representations (ICLR), 2024
[ paper ] [ code ]

Label-Free Synthetic Pretraining of Object Detectors
Hei Law, Jia Deng
Winter Conference on Applications of Computer Vision (WACV), 2024
[ paper ] [ code ]

Deep Patch Visual Odometry
Zachary Teed*, Lahav Lipson*, Jia Deng (*equal contribution)
Neural Information Processing Systems (NeurIPS), 2023
[ paper ] [ code ]

Siamese Masked Autoencoders
Agrim Gupta, Jiajun Wu, Jia Deng, Li Fei-Fei
Neural Information Processing Systems (NeurIPS), 2023
[ paper ] [ project ]

Convolutional Networks with Oriented 1D Kernels
Alexandre Kirchmeyer, Jia Deng
International Conference on Computer Vision (ICCV), 2023
[ paper ] [ code ]

Non-deep Networks
Ankit Goyal, Alexey Bochkovskiy, Jia Deng, Vladlen Koltun
Neural Information Processing Systems (NeurIPS), 2022
[ paper ] [ code ]

Dynamically Grown Generative Adversarial Networks
Lanlan Liu, Yuting Zhang, Jia Deng, Stefano Soattos
AAAI Conference on Artificial Intelligence (AAAI), 2021
[ paper ]

A Unified Framework of Surrogate Loss by Refactoring and Interpolation
Lanlan Liu, Mingzhe Wang, Jia Deng
European Conference on Computer Vision (ECCV), 2020
[ paper ] [ code ]

DeepV2D: Video to Depth with Differentiable Structure from Motion
Zachary Teed, Jia Deng
International Conference on Learning Representations (ICLR), 2020
[ paper ] [ code ]

Learning to Generate Synthetic 3D Training Data through Hybrid Gradient
Dawei Yang, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2020
[ paper ]

Feature Partitioning for Efficient Multi-Task Architectures
Alejandro Newell, Lu Jiang, Chong Wang, Li-Jia Li, Jia Deng
arXiv:1908.04339
[ paper ]

CornerNet: Detecting Objects as Paired Keypoints
Hei Law, Jia Deng
European Conference on Computer Vision (ECCV), 2018
[ paper ] [ code ] [ slides ]

Decorrelated Batch Normalization
Lei Huang, Dawei Yang, Bo Lang, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2018
[ paper ] [ code ]

Dynamic Deep Neural Networks: Optimizing Accuracy-Efficiency Trade-offs by Selective Execution
Lanlan Liu, Jia Deng
AAAI Conference on Artificial Intelligence (AAAI), 2018
[ paper ]

Pixels to Graphs by Associative Embedding
Alejandro Newell, Jia Deng
Neural Information Processing Systems (NIPS), 2017
[ paper ] [ code ]

Stacked Hourglass Networks for Human Pose Estimation
Alejandro Newell, Kaiyu Yang, Jia Deng
European Conference on Computer Vision (ECCV), 2016
[ paper ] [ code ]

Probabilistic Label Relation Graphs with Ising Models
Nan Ding, Jia Deng, Kevin Murphy, Hartmut Neven
International Conference on Computer Vision (ICCV) 2015
[ paper ]

Rel3D: A Minimally Contrastive Benchmark for Grounding Spatial Relations in 3D
Ankit Goyal, Kaiyu Yang, Dawei Yang, Jia Deng
Neural Information Processing Systems (NeurIPS), 2020
[ paper ] [ code ] [ data ]

SpatialSense: An Adversarially Crowdsourced Benchmark For Spatial Relation Recognition
Kaiyu Yang, Olga Russakovsky, Jia Deng
International Conference on Computer Vision (ICCV), 2019
[ paper ] [ code ]

Identifying Visible Actions in Lifestyle Vlogs
Oana Ignat, Laura Burdick, Jia Deng, Rada Mihalcea
Annual Meeting of the Association for Computational Linguistics (ACL), 2019
[ paper ]

Think Visually: Question Answering through Virtual Imagery
Ankit Goyal, Jian Wang, Jia Deng
Annual Meeting of the Association for Computational Linguistics (ACL), 2018
[ paper ] [ code ] [ data ]

Speaker Naming in Movies
Mahmoud Azab, Mingzhe Wang, Max Smith, Noriyuki Kojima, Jia Deng, Rada Mihalcea
Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL), 2018
[ paper ]

Structured Matching for Phrase Localization
Mingzhe Wang, Mahmoud Azab, Noriyuki Kojima, Rada Mihalcea, Jia Deng
European Conference on Computer Vision (ECCV), 2016
[ paper ] [ code ]

Seeing and Seeing Through the Glass: Real and Synthetic Data for Multi-Layer Depth Estimation
Hongyu Wen, Yiming Zuo, Venkat Subramanian, Patrick Chen, Jia Deng
arXiv:2503.11633
[ paper ] [ project ] [ code ]

Towards Foundation Models for 3D Vision: How Close Are We?
Yiming Zuo*, Karhan Kayan*, Maggie Wang, Kevin Jeon, Jia Deng, Thomas L. Griffiths (*equal contribution)
International Conference on 3D Vision (3DV), 2025
[ paper ] [ code ]

View-Dependent Octree-based Mesh Extraction in Unbounded Scenes for Procedural Synthetic Data
Zeyu Ma, Alexander Raistrick, Lahav Lipson, Jia Deng
International Conference on 3D Vision (3DV), 2025
[ paper ] [ code ]

OMNI-DC: Highly Robust Depth Completion with Multiresolution Depth Integration
Yiming Zuo, Willow Yang, Zeyu Ma, Jia Deng
arXiv:2411.19278
[ paper ] [ project ] [ code ]

OGNI-DC: Robust Depth Completion with Optimization-Guided Neural Iterations
Yiming Zuo, Jia Deng
European Conference on Computer Vision (ECCV), 2024
[ paper ] [ code ]

SEA-RAFT: Simple, Efficient, Accurate RAFT for Optical Flow
Yihan Wang, Lahav Lipson, Jia Deng
European Conference on Computer Vision (ECCV), 2024
[ paper ] [ code ]

LayeredFlow: A Real-World Benchmark for Non-Lambertian Multi-Layer Optical Flow
Hongyu Wen, Erich Liang, Jia Deng
European Conference on Computer Vision (ECCV), 2024
[ paper ] [ project ] [ code ]

Deep Patch Visual SLAM
Lahav Lipson, Zachary Teed, Jia Deng
European Conference on Computer Vision (ECCV), 2024
[ paper ] [ code ]

Infinigen Indoors: Photorealistic Indoor Scenes using Procedural Generation
Alexander Raistrick*, Lingjie Mei*, Karhan Kayan*, David Yan, Yiming Zuo, Beining Han, Hongyu Wen, Meenal Parakh, Stamatis Alexandropoulos, Lahav Lipson, Zeyu Ma, Jia Deng (*equal contribution)
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2024
[ paper ] [ project ] [ code ]

Multi-Session SLAM with Differentiable Wide-Baseline Pose Optimization
Lahav Lipson, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2024
[ paper ] [ code ]

Deep Patch Visual Odometry
Zachary Teed*, Lahav Lipson*, Jia Deng (*equal contribution)
Neural Information Processing Systems (NeurIPS), 2023
[ paper ] [ code ]

Infinite Photorealistic Worlds using Procedural Generation
Alexander Raistrick*, Lahav Lipson*, Zeyu Ma*, Lingjie Mei, Mingzhe Wang, Yiming Zuo, Karhan Kayan, Hongyu Wen, Beining Han, Yihan Wang, Alejandro Newell, Hei Law, Ankit Goyal, Kaiyu Yang, Jia Deng (*equal contribution)
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2023
[ paper ] [ project ] [ code ]

View Synthesis with Sculpted Neural Points
Yiming Zuo, Jia Deng
International Conference on Learning Representations (ICLR), 2023
[ paper ] [ code ]

Multiview Stereo with Cascaded Epipolar RAFT
Zeyu Ma, Zachary Teed, Jia Deng
European Conference on Computer Vision (ECCV), 2022
[ paper ] [ code ]

IFOR: Iterative Flow Minimization for Robotic Object Rearrangement
Ankit Goyal, Arsalan Mousavian, Chris Paxton, Yu-Wei Chao, Brian Okorn, Jia Deng, Dieter Fox
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2022
[ paper ] [ project ]

Coupled Iterative Refinement for 6D Multi-Object Pose Estimation
Lahav Lipson, Zachary Teed, Ankit Goyal, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2022
[ paper ] [ code ]

RAFT-Stereo: Multilevel Recurrent Field Transforms for Stereo Matching
Lahav Lipson, Zachary Teed, Jia Deng
International Conference on 3D Vision (3DV), 2021
[ paper ] [ code ] [ Best Student Paper Award ]

DROID-SLAM: Deep Visual SLAM for Monocular, Stereo, and RGB-D Cameras
Zachary Teed, Jia Deng
Neural Information Processing Systems (NeurIPS), 2021
[ paper ] [ code ]

Revisiting Point Cloud Shape Classification with a Simple and Effective Baseline
Ankit Goyal, Hei Law, Bowei Liu, Alejandro Newell, Jia Deng
International Conference on Machine Learning (ICML), 2021
[ paper ] [ code ]

Tangent Space Backpropagation for 3D Transformation Groups
Zachary Teed, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2021
[ paper ] [ code ]

RAFT-3D: Scene Flow using Rigid-Motion Embeddings
Zachary Teed, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2021
[ paper ] [ code ]

Rel3D: A Minimally Contrastive Benchmark for Grounding Spatial Relations in 3D
Ankit Goyal, Kaiyu Yang, Dawei Yang, Jia Deng
Neural Information Processing Systems (NeurIPS), 2020
[ paper ] [ code ] [ data ]

RAFT: Recurrent All-Pairs Field Transforms for Optical Flow
Zachary Teed, Jia Deng
European Conference on Computer Vision (ECCV), 2020
[ paper ] [ code ] [ Best Paper Award ]

PackIt: A Virtual Environment for Geometric Planning
Ankit Goyal, Jia Deng
International Conference on Machine Leaning (ICML), 2020
[ paper ] [ code ]

OASIS: A Large-Scale Dataset for Single Image 3D in the Wild
Weifeng Chen, Shengyi Qian, David Fan, Noriyuki Kojima, Max Hamilton, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2020
[ paper ] [ project ]

Learning to Generate Synthetic 3D Training Data through Hybrid Gradient
Dawei Yang, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2020
[ paper ]

DeepV2D: Video to Depth with Differentiable Structure from Motion
Zachary Teed, Jia Deng
International Conference on Learning Representations (ICLR), 2020
[ paper ] [ code ]

Learning Single-Image Depth from Videos using Quality Assessment Networks
Weifeng Chen, Shengyi Qian, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2019
[ paper ] [ code ]

MeshAdv: Adversarial Meshes for Visual Recognition
Dawei Yang*, Chaowei Xiao*, Bo Li, Jia Deng, Mingyan Liu (*equal contribution)
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2019
[ paper ]

Shape from Shading through Shape Evolution
Dawei Yang, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2018
[ paper ]

Surface Normals in the Wild
Weifeng Chen, Donglai Xiang, Jia Deng
International Conference on Computer Vision (ICCV), 2017
[ paper ] [ project ] [ data ]

Single-Image Depth Perception in the Wild.
Weifeng Chen, Zhao Fu, Dawei Yang, Jia Deng.
Neural Information Processing Systems (NIPS), 2016.
[ paper ] [ data ] [ code ]

3D Object Representations for Fine-Grained Categorization
Jonathan Krause, Michael Stark, Jia Deng, Li Fei-Fei
4th IEEE Workshop on 3D Representation and Recognition, at ICCV 2013 (3dRR-13)
[ paper ]

Digital Bas-Relief From 3D Scenes
Tim Weyrich, Jia Deng, Connelly Barnes, Szymon Rusinkiewicz, Adam Finkelstein.
ACM Transactions on Graphics (Proc. SIGGRAPH), 26(3), August 2007.
[ paper ] [ project site ] [ bibtex ]

A Study of Face Obfuscation in ImageNet
Kaiyu Yang, Jacqueline Yau, Li Fei-Fei, Jia Deng, Olga Russakovsky
International Conference on Machine Learning (ICML), 2022
[ paper ] [ code ]

CornerNet-Lite: Efficient Keypoint Based Object Detection
Hei Law, Yun Teng, Olga Russakovsky, Jia Deng
British Machine Vision Conference (BMVC), 2020
[ paper ] [ code ]

CornerNet: Detecting Objects as Paired Keypoints
Hei Law, Jia Deng
European Conference on Computer Vision (ECCV), 2018
[ paper ] [ code ] [ slides ]

Scalable annotation of fine-grained categories without experts
Timnit Gebru, Jonathan Krause, Jia Deng, Li Fei-Fei
Conference on Human Factors in Computing Systems (CHI), 2017
[ paper ]

Fine-Grained Car Detection for Visual Census Estimation
Timnit Gebru, Jonathan Krause, Yilun Wang, Duyun Chen, Jia Deng, Li Fei-Fei
AAAI Conference on Artificial Intelligence (AAAI), 2017
[ paper ]

Leveraging the Wisdom of the Crowd for Fine-Grained Recognition
Jia Deng, Jonathan Krause, Michael Stark, Li Fei-Fei.
IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI). 2016.
[ paper ]

Learning to Name Objects
Vicente Ordonez, Wei Liu, Jia Deng, Yejin Choi, Alexander C. Berg, Tamara L. Berg
Communications of the ACM. March 2016 (Vol. 59, No. 3).
[ paper ]

Probabilistic Label Relation Graphs with Ising Models
Nan Ding, Jia Deng, Kevin Murphy, Hartmut Neven
International Conference on Computer Vision (ICCV) 2015
[ paper ]

Mining Semantic Affordances of Visual Object Categories
Yu-Wei Chao, Zhan Wang, Rada Mihalcea, Jia Deng
In IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 2015.
[ paper ] [project ] [ data ] [ code ] [ poster ]

ImageNet Large Scale Visual Recognition Challenge
Olga Russakovsky*, Jia Deng*, Hao Su, Jonathan Krause, Sanjeev Satheesh, Sean Ma, Zhiheng Huang, Andrej Karpathy, Aditya Khosla, Michael Bernstein, Alexander C. Berg and Li Fei-Fei. (* = equal contribution)
International Journal of Computer Vision (IJCV), 2015.
[ paper ] [ bibtex ] [ MIT Technology Review ]

Large-Scale Object Classification Using Label Relation Graphs
Jia Deng, Nan Ding, Yangqing Jia, Andrea Frome, Kevin Murphy, Samy Bengio, Yuan Li, Hartmut Neven, Hartwig Adam.
European Conference on Computer Vision (ECCV), 2014
[ paper ] [ supplemental material ] [ slides ] [ Best Paper Award ]

Scalable Multi-Label Annotation
Jia Deng, Olga Russakovsky, Jonathan Krause, Michael Bernstein, Alexander C. Berg, Li Fei-Fei.
ACM Conference on Human Factors in Computing Systems (CHI), 2014
[ paper ]

From Large Scale Image Categorization to Entry-Level Categories
Vicente Ordonez, Jia Deng, Yejin Choi, Alexander C. Berg, Tamara L. Berg.
International Conference on Computer Vision (ICCV), 2013
[ paper ] [ Marr Prize (best paper award) ]

Detecting avocados to zucchinis: what have we done, and where are we going?
Olga Russakovsky, Jia Deng, Zhiheng Huang, Alexander C. Berg, Li Fei-Fei.
International Conference on Computer Vision (ICCV), 2013
[ pdf ] [ supplement ] [more analysis ] [ bibtex ] [ slides ] [ video ]

Fine-Grained Crowdsourcing for Fine-Grained Recognition
Jia Deng, Jonathan Krause, Li Fei-Fei.
IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2013.
[ paper ] [ bibtex ] [ slides ] [ poster ] [ UI code ] [ oral talk ] [ data ]

Crowdsourcing Annotations for Visual Object Detection
Hao Su, Jia Deng, Li Fei-Fei.
AAAI Human Computation Workshop (HCOMP) 2012
[ paper ] [ bibtex ]

Large Scale Visual Recognition
Jia Deng.
PhD Dissertation 2012
[ pdf ]

Hedging Your Bets: Optimizing Accuracy-Specificity Trade-offs in Large Scale Visual Recognition
Jia Deng, Jonathan Krause, Alex Berg, Li Fei-Fei
IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2012.
[ paper ] [ supplementary materials ] [ code ] [ project site ] [ bibtex ]

Fast and Balanced: Efficient Label Tree Learning for Large Scale Object Recognition
Jia Deng, Sanjeev Satheesh, Alex Berg, Li Fei-Fei
Neural Information Processing Systems(NIPS), 2011.
[ paper] [ supplementary materials ] [ bibtex ]

Hierarchical Semantic Indexing for Large Scale Image Retrieval.
Jia Deng, Alex Berg, Li Fei-Fei
IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2011.
[ paper ] [ supplementary materials ] [ bibtex ]

What does classifying more than 10,000 image categories tell us?
Jia Deng, Alex Berg, Kai Li, Li Fei-Fei
European Conference on Computer Vision(ECCV), 2010.
[ paper ] [ data ] [ code ] [ bibtex ]

ImageNet: A Large-Scale Hierarchical Image Database.
Jia Deng, Wei Dong, Richard Socher, Li-Jia Li, Kai Li, Li Fei-Fei
IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2009.
[ paper ] [ project site ] [ New York Times article ] [ bibtex ]

Towards scalable dataset construction: An active learning approach
Brandon Collins, Jia Deng, Kai Li, Li Fei-Fei.
European Conference on Computer Vision(ECCV), 2008.
[ paper ] [ bibtex ]

Learning to Sit: Synthesizing Human-Chair Interactions via Hierarchical Control
Yu-Wei Chao, Jimei Yang, Weifeng Chen, Jia Deng
AAAI Conference on Artificial Intelligence (AAAI), 2021
[ paper ]

Rel3D: A Minimally Contrastive Benchmark for Grounding Spatial Relations in 3D
Ankit Goyal, Kaiyu Yang, Dawei Yang, Jia Deng
Neural Information Processing Systems (NeurIPS), 2020
[ paper ] [ code ] [ data ]

D3D: Distilled 3D Networks for Video Action Recognition
Jonathan C. Stroud, David A. Ross, Chen Sun, Jia Deng, Rahul Sukthankar
Winter Conference on Applications of Computer Vision (WACV), 2020
[ paper ] [ code ]

SpatialSense: An Adversarially Crowdsourced Benchmark For Spatial Relation Recognition
Kaiyu Yang, Olga Russakovsky, Jia Deng
International Conference on Computer Vision (ICCV), 2019
[ paper ] [ code ]

Identifying Visible Actions in Lifestyle Vlogs
Oana Ignat, Laura Burdick, Jia Deng, Rada Mihalcea
Annual Meeting of the Association for Computational Linguistics (ACL), 2019
[ paper ]

Rethinking the Faster R-CNN Architecture for Temporal Action Localization
Yu-Wei Chao, Sudheendra Vijayanarasimhan, Bryan Seybold, David Ross, Jia Deng, Rahul Sukthankar
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2018
[ paper ]

Learning to Detect Human-Object Interactions
Yu-Wei Chao, Yunfan Liu, Xieyang Liu, Huayi Zeng, Jia Deng
IEEE Winter Conference on Applications of Computer Vision (WACV), 2018
[ paper ] [ data ] [ code ]

Pixels to Graphs by Associative Embedding
Alejandro Newell, Jia Deng
Neural Information Processing Systems (NIPS), 2017
[ paper ] [ code ]

Associative Embedding: End-to-End Learning for Joint Detection and Grouping
Alejandro Newell, Zhiao Huang, Jia Deng
Neural Information Processing Systems (NIPS), 2017
[ paper ] [ code ]

Forecasting Human Dynamics from Static Images
Yu-Wei Chao, Jimei Yang, Brian Price, Scott Cohen, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017
[ paper ] [project] [code]

Temporal Action Localization by Structured Maximal Sums
Zehuan Yuan, Jonathan Stroud, Tong Lu, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017
[ paper ] [ code ]

Stacked Hourglass Networks for Human Pose Estimation
Alejandro Newell, Kaiyu Yang, Jia Deng
European Conference on Computer Vision (ECCV), 2016
[ paper ] [ code ]

HICO: A Benchmark for Recognizing Human-Object Interactions in Images
Yu-Wei Chao, Zhan Wang, Yugeng He, Jiaxuan Wang, Jia Deng
International Conference on Computer Vision (ICCV) 2015
[ paper ] [ data ] [ code ]

Probabilistic Label Relation Graphs with Ising Models
Nan Ding, Jia Deng, Kevin Murphy, Hartmut Neven
International Conference on Computer Vision (ICCV) 2015
[ paper ]

Learning Semantic Relationships for Better Action Retrieval in Images
Vignesh Ramanathan, Congcong Li, Jia Deng, Wei Han, Zhen Li, Kunlong Gu, Yang Song, Samy Bengio, Charles Rosenberg, Fei-Fei Li
In IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 2015
[ paper] [ project ]

Mining Semantic Affordances of Visual Object Categories
Yu-Wei Chao, Zhan Wang, Rada Mihalcea, Jia Deng
In IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 2015.
[ paper ] [project ] [ data ] [ code ] [ poster ]

2025

2024

OMNI-DC: Highly Robust Depth Completion with Multiresolution Depth Integration
Yiming Zuo, Willow Yang, Zeyu Ma, Jia Deng
arXiv:2411.19278
[ paper ] [ project ] [ code ]

FetchBench: A Simulation Benchmark for Robot Fetching
Beining Han, Meenal Parakh, Derek Geng, Jack A Defay, Luyang Gan, Jia Deng
Conference on Robot Learning (CoRL), 2024
[ paper ] [ code ]

OGNI-DC: Robust Depth Completion with Optimization-Guided Neural Iterations
Yiming Zuo, Jia Deng
European Conference on Computer Vision (ECCV), 2024
[ paper ] [ code ]

SEA-RAFT: Simple, Efficient, Accurate RAFT for Optical Flow
Yihan Wang, Lahav Lipson, Jia Deng
European Conference on Computer Vision (ECCV), 2024
[ paper ] [ code ]

LayeredFlow: A Real-World Benchmark for Non-Lambertian Multi-Layer Optical Flow
Hongyu Wen, Erich Liang, Jia Deng
European Conference on Computer Vision (ECCV), 2024
[ paper ] [ project ] [ code ]

Deep Patch Visual SLAM
Lahav Lipson, Zachary Teed, Jia Deng
European Conference on Computer Vision (ECCV), 2024
[ paper ] [ code ]

Infinigen Indoors: Photorealistic Indoor Scenes using Procedural Generation
Alexander Raistrick*, Lingjie Mei*, Karhan Kayan*, David Yan, Yiming Zuo, Beining Han, Hongyu Wen, Meenal Parakh, Stamatis Alexandropoulos, Lahav Lipson, Zeyu Ma, Jia Deng (*equal contribution)
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2024
[ paper ] [ project ] [ code ]

Multi-Session SLAM with Differentiable Wide-Baseline Pose Optimization
Lahav Lipson, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2024
[ paper ] [ code ]

Llemma: An Open Language Model For Mathematics
Zhangir Azerbayev, Hailey Schoelkopf, Keiran Paster, Marco Dos Santos, Stephen McAleer, Albert Q. Jiang, Jia Deng, Stella Biderman, Sean Welleck
International Conference on Learning Representations (ICLR), 2024
[ paper ] [ code ]

Label-Free Synthetic Pretraining of Object Detectors
Hei Law, Jia Deng
Winter Conference on Applications of Computer Vision (WACV), 2024
[ paper ] [ code ]

2023

Deep Patch Visual Odometry
Zachary Teed*, Lahav Lipson*, Jia Deng (*equal contribution)
Neural Information Processing Systems (NeurIPS), 2023
[ paper ] [ code ]

Siamese Masked Autoencoders
Agrim Gupta, Jiajun Wu, Jia Deng, Li Fei-Fei
Neural Information Processing Systems (NeurIPS), 2023
[ paper ] [ project ]

Convolutional Networks with Oriented 1D Kernels
Alexandre Kirchmeyer, Jia Deng
International Conference on Computer Vision (ICCV), 2023
[ paper ] [ code ]

Learning Symbolic Rules for Reasoning in Quasi-Natural Language
Kaiyu Yang, Jia Deng
Transactions on Machine Learning Research (TMLR), 2023
[ paper ] [ code ]

Infinite Photorealistic Worlds using Procedural Generation
Alexander Raistrick*, Lahav Lipson*, Zeyu Ma*, Lingjie Mei, Mingzhe Wang, Yiming Zuo, Karhan Kayan, Hongyu Wen, Beining Han, Yihan Wang, Alejandro Newell, Hei Law, Ankit Goyal, Kaiyu Yang, Jia Deng (*equal contribution)
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2023
[ paper ] [ project ] [ code ]

View Synthesis with Sculpted Neural Points
Yiming Zuo, Jia Deng
International Conference on Learning Representations (ICLR), 2023
[ paper ] [ code ]

2022

Generating Natural Language Proofs with Verifier-Guided Search
Kaiyu Yang, Jia Deng, Danqi Chen
Conference on Empirical Methods in Natural Language Processing (EMNLP), 2022
[ paper ] [ code ]

Non-deep Networks
Ankit Goyal, Alexey Bochkovskiy, Jia Deng, Vladlen Koltun
Neural Information Processing Systems (NeurIPS), 2022
[ paper ] [ code ]

Multiview Stereo with Cascaded Epipolar RAFT
Zeyu Ma, Zachary Teed, Jia Deng
European Conference on Computer Vision (ECCV), 2022
[ paper ] [ code ]

A Study of Face Obfuscation in ImageNet
Kaiyu Yang, Jacqueline Yau, Li Fei-Fei, Jia Deng, Olga Russakovsky
International Conference on Machine Learning (ICML), 2022
[ paper ] [ code ]

IFOR: Iterative Flow Minimization for Robotic Object Rearrangement
Ankit Goyal, Arsalan Mousavian, Chris Paxton, Yu-Wei Chao, Brian Okorn, Jia Deng, Dieter Fox
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2022
[ paper ] [ project ]

Coupled Iterative Refinement for 6D Multi-Object Pose Estimation
Lahav Lipson, Zachary Teed, Ankit Goyal, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2022
[ paper ] [ code ]

2021

RAFT-Stereo: Multilevel Recurrent Field Transforms for Stereo Matching
Lahav Lipson, Zachary Teed, Jia Deng
International Conference on 3D Vision (3DV), 2021
[ paper ] [ code ] [ Best Student Paper Award ]

DROID-SLAM: Deep Visual SLAM for Monocular, Stereo, and RGB-D Cameras
Zachary Teed, Jia Deng
Neural Information Processing Systems (NeurIPS), 2021
[ paper ] [ code ]

Revisiting Point Cloud Shape Classification with a Simple and Effective Baseline
Ankit Goyal, Hei Law, Bowei Liu, Alejandro Newell, Jia Deng
International Conference on Machine Learning (ICML), 2021
[ paper ] [ code ]

Tangent Space Backpropagation for 3D Transformation Groups
Zachary Teed, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2021
[ paper ] [ code ]

RAFT-3D: Scene Flow using Rigid-Motion Embeddings
Zachary Teed, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2021
[ paper ] [ code ]

Dynamically Grown Generative Adversarial Networks
Lanlan Liu, Yuting Zhang, Jia Deng, Stefano Soattos
AAAI Conference on Artificial Intelligence (AAAI), 2021
[ paper ]

Learning to Sit: Synthesizing Human-Chair Interactions via Hierarchical Control
Yu-Wei Chao, Jimei Yang, Weifeng Chen, Jia Deng
AAAI Conference on Artificial Intelligence (AAAI), 2021
[ paper ]

2020

Learning to Prove Theorems by Learning to Generate Theorems
Mingzhe Wang, Jia Deng
Neural Information Processing Systems (NeurIPS), 2020
[ paper ] [ code ]

Rel3D: A Minimally Contrastive Benchmark for Grounding Spatial Relations in 3D
Ankit Goyal, Kaiyu Yang, Dawei Yang, Jia Deng
Neural Information Processing Systems (NeurIPS), 2020
[ paper ] [ code ] [ data ]

Strongly Incremental Constituency Parsing with Graph Neural Networks
Kaiyu Yang, Jia Deng
Neural Information Processing Systems (NeurIPS), 2020
[ paper ] [ code ]

Rearrangement: A Challenge for Embodied AI
Dhruv Batra, Angel X. Chang, Sonia Chernova, Andrew J. Davison, Jia Deng, Vladlen Koltun, Sergey Levine, Jitendra Malik, Igor Mordatch, Roozbeh Mottaghi, Manolis Savva, Hao Su
arXiv:2011.01975
[ paper ]

RAFT: Recurrent All-Pairs Field Transforms for Optical Flow
Zachary Teed, Jia Deng
European Conference on Computer Vision (ECCV), 2020
[ paper ] [ code ] [ Best Paper Award ]

A Unified Framework of Surrogate Loss by Refactoring and Interpolation
Lanlan Liu, Mingzhe Wang, Jia Deng
European Conference on Computer Vision (ECCV), 2020
[ paper ] [ code ]

CornerNet-Lite: Efficient Keypoint Based Object Detection
Hei Law, Yun Teng, Olga Russakovsky, Jia Deng
British Machine Vision Conference (BMVC), 2020
[ paper ] [ code ]

PackIt: A Virtual Environment for Geometric Planning
Ankit Goyal, Jia Deng
International Conference on Machine Leaning (ICML), 2020
[ paper ] [ code ]

How Useful is Self-Supervised Pretraining for Visual Tasks?
Alejandro Newell, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2020
[ paper ] [ code ]

OASIS: A Large-Scale Dataset for Single Image 3D in the Wild
Weifeng Chen, Shengyi Qian, David Fan, Noriyuki Kojima, Max Hamilton, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2020
[ paper ] [ project ]

Learning to Generate Synthetic 3D Training Data through Hybrid Gradient
Dawei Yang, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2020
[ paper ]

DeepV2D: Video to Depth with Differentiable Structure from Motion
Zachary Teed, Jia Deng
International Conference on Learning Representations (ICLR), 2020
[ paper ] [ code ]

D3D: Distilled 3D Networks for Video Action Recognition
Jonathan C. Stroud, David A. Ross, Chen Sun, Jia Deng, Rahul Sukthankar
Winter Conference on Applications of Computer Vision (WACV), 2020
[ paper ] [ code ]

2019

SpatialSense: An Adversarially Crowdsourced Benchmark For Spatial Relation Recognition
Kaiyu Yang, Olga Russakovsky, Jia Deng
International Conference on Computer Vision (ICCV), 2019
[ paper ] [ code ]

Generative Modeling for Small-Data Object Detection
Lanlan Liu, Michael Muelly, Jia Deng, Tomas Pfister, Li-Jia Li
International Conference on Computer Vision (ICCV). 2019
[ paper ]

Identifying Visible Actions in Lifestyle Vlogs
Oana Ignat, Laura Burdick, Jia Deng, Rada Mihalcea
Annual Meeting of the Association for Computational Linguistics (ACL), 2019
[ paper ]

Feature Partitioning for Efficient Multi-Task Architectures
Alejandro Newell, Lu Jiang, Chong Wang, Li-Jia Li, Jia Deng
arXiv:1908.04339
[ paper ]

Learning to Prove Theorems via Interacting with Proof Assistants
Kaiyu Yang, Jia Deng
International Conference on Machine Learning (ICML), 2019
[ paper ] [ code ]

Learning Single-Image Depth from Videos using Quality Assessment Networks
Weifeng Chen, Shengyi Qian, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2019
[ paper ] [ code ]

MeshAdv: Adversarial Meshes for Visual Recognition
Dawei Yang*, Chaowei Xiao*, Bo Li, Jia Deng, Mingyan Liu (*equal contribution)
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2019
[ paper ]

To Learn or Not to Learn: Analyzing the Role of Learning for Navigation in Virtual Environments
Noriyuki Kojima, Jia Deng
arXiv:1907.11770
[ paper ]

2018

CornerNet: Detecting Objects as Paired Keypoints
Hei Law, Jia Deng
European Conference on Computer Vision (ECCV), 2018
[ paper ] [ code ] [ slides ]

Think Visually: Question Answering through Virtual Imagery
Ankit Goyal, Jian Wang, Jia Deng
Annual Meeting of the Association for Computational Linguistics (ACL), 2018
[ paper ] [ code ] [ data ]

Shape from Shading through Shape Evolution
Dawei Yang, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2018
[ paper ]

Decorrelated Batch Normalization
Lei Huang, Dawei Yang, Bo Lang, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2018
[ paper ] [ code ]

Rethinking the Faster R-CNN Architecture for Temporal Action Localization
Yu-Wei Chao, Sudheendra Vijayanarasimhan, Bryan Seybold, David Ross, Jia Deng, Rahul Sukthankar
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2018
[ paper ]

Speaker Naming in Movies
Mahmoud Azab, Mingzhe Wang, Max Smith, Noriyuki Kojima, Jia Deng, Rada Mihalcea
Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL), 2018
[ paper ]

Dynamic Deep Neural Networks: Optimizing Accuracy-Efficiency Trade-offs by Selective Execution
Lanlan Liu, Jia Deng
AAAI Conference on Artificial Intelligence (AAAI), 2018
[ paper ]

Learning to Detect Human-Object Interactions
Yu-Wei Chao, Yunfan Liu, Xieyang Liu, Huayi Zeng, Jia Deng
IEEE Winter Conference on Applications of Computer Vision (WACV), 2018
[ paper ] [ data ] [ code ]

2017

Premise Selection for Theorem Proving by Deep Graph Embedding
Mingzhe Wang*, Yihe Tang*, Jian Wang, Jia Deng (*equal contribution)
Neural Information Processing Systems (NIPS), 2017
[ paper ] [ code ]

Pixels to Graphs by Associative Embedding
Alejandro Newell, Jia Deng
Neural Information Processing Systems (NIPS), 2017
[ paper ] [ code ]

Associative Embedding: End-to-End Learning for Joint Detection and Grouping
Alejandro Newell, Zhiao Huang, Jia Deng
Neural Information Processing Systems (NIPS), 2017
[ paper ] [ code ]

Surface Normals in the Wild
Weifeng Chen, Donglai Xiang, Jia Deng
International Conference on Computer Vision (ICCV), 2017
[ paper ] [ project ] [ data ]

Forecasting Human Dynamics from Static Images
Yu-Wei Chao, Jimei Yang, Brian Price, Scott Cohen, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017
[ paper ] [project] [code]

Temporal Action Localization by Structured Maximal Sums
Zehuan Yuan, Jonathan Stroud, Tong Lu, Jia Deng
IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017
[ paper ] [ code ]

Scalable annotation of fine-grained categories without experts
Timnit Gebru, Jonathan Krause, Jia Deng, Li Fei-Fei
Conference on Human Factors in Computing Systems (CHI), 2017
[ paper ]

Fine-Grained Car Detection for Visual Census Estimation
Timnit Gebru, Jonathan Krause, Yilun Wang, Duyun Chen, Jia Deng, Li Fei-Fei
AAAI Conference on Artificial Intelligence (AAAI), 2017
[ paper ]

Surgeon Technical Skill Assessment using Computer Vision based Analysis
Hei Law, Khurshid Ghani, Jia Deng
Machine Learning for Healthcare (MLHC), 2017
[ paper ]

2016

Single-Image Depth Perception in the Wild.
Weifeng Chen, Zhao Fu, Dawei Yang, Jia Deng.
Neural Information Processing Systems (NIPS), 2016.
[ paper ] [ data ] [ code ]

Structured Matching for Phrase Localization
Mingzhe Wang, Mahmoud Azab, Noriyuki Kojima, Rada Mihalcea, Jia Deng
European Conference on Computer Vision (ECCV), 2016
[ paper ] [ code ]

Stacked Hourglass Networks for Human Pose Estimation
Alejandro Newell, Kaiyu Yang, Jia Deng
European Conference on Computer Vision (ECCV), 2016
[ paper ] [ code ]

Leveraging the Wisdom of the Crowd for Fine-Grained Recognition
Jia Deng, Jonathan Krause, Michael Stark, Li Fei-Fei.
IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI). 2016.
[ paper ]

Learning to Name Objects
Vicente Ordonez, Wei Liu, Jia Deng, Yejin Choi, Alexander C. Berg, Tamara L. Berg
Communications of the ACM. March 2016 (Vol. 59, No. 3).
[ paper ]

2015

HICO: A Benchmark for Recognizing Human-Object Interactions in Images
Yu-Wei Chao, Zhan Wang, Yugeng He, Jiaxuan Wang, Jia Deng
International Conference on Computer Vision (ICCV) 2015
[ paper ] [ data ] [ code ]

Probabilistic Label Relation Graphs with Ising Models
Nan Ding, Jia Deng, Kevin Murphy, Hartmut Neven
International Conference on Computer Vision (ICCV) 2015
[ paper ]

Learning Semantic Relationships for Better Action Retrieval in Images
Vignesh Ramanathan, Congcong Li, Jia Deng, Wei Han, Zhen Li, Kunlong Gu, Yang Song, Samy Bengio, Charles Rosenberg, Fei-Fei Li
In IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 2015
[ paper] [ project ]

Mining Semantic Affordances of Visual Object Categories
Yu-Wei Chao, Zhan Wang, Rada Mihalcea, Jia Deng
In IEEE Conference on Computer Vision and Pattern Recognition (CVPR) 2015.
[ paper ] [project ] [ data ] [ code ] [ poster ]

ImageNet Large Scale Visual Recognition Challenge
Olga Russakovsky*, Jia Deng*, Hao Su, Jonathan Krause, Sanjeev Satheesh, Sean Ma, Zhiheng Huang, Andrej Karpathy, Aditya Khosla, Michael Bernstein, Alexander C. Berg and Li Fei-Fei. (* = equal contribution)
International Journal of Computer Vision (IJCV), 2015.
[ paper ] [ bibtex ] [ MIT Technology Review ]

2014

Large-Scale Object Classification Using Label Relation Graphs
Jia Deng, Nan Ding, Yangqing Jia, Andrea Frome, Kevin Murphy, Samy Bengio, Yuan Li, Hartmut Neven, Hartwig Adam.
European Conference on Computer Vision (ECCV), 2014
[ paper ] [ supplemental material ] [ slides ] [ Best Paper Award ]

Scalable Multi-Label Annotation
Jia Deng, Olga Russakovsky, Jonathan Krause, Michael Bernstein, Alexander C. Berg, Li Fei-Fei.
ACM Conference on Human Factors in Computing Systems (CHI), 2014
[ paper ]

2013 and before

3D Object Representations for Fine-Grained Categorization
Jonathan Krause, Michael Stark, Jia Deng, Li Fei-Fei
4th IEEE Workshop on 3D Representation and Recognition, at ICCV 2013 (3dRR-13)
[ paper ]

From Large Scale Image Categorization to Entry-Level Categories
Vicente Ordonez, Jia Deng, Yejin Choi, Alexander C. Berg, Tamara L. Berg.
International Conference on Computer Vision (ICCV), 2013
[ paper ] [ Marr Prize (best paper award) ]

Detecting avocados to zucchinis: what have we done, and where are we going?
Olga Russakovsky, Jia Deng, Zhiheng Huang, Alexander C. Berg, Li Fei-Fei.
International Conference on Computer Vision (ICCV), 2013
[ pdf ] [ supplement ] [more analysis ] [ bibtex ] [ slides ] [ video ]

Fine-Grained Crowdsourcing for Fine-Grained Recognition
Jia Deng, Jonathan Krause, Li Fei-Fei.
IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2013.
[ paper ] [ bibtex ] [ slides ] [ poster ] [ UI code ] [ oral talk ] [ data ]

Crowdsourcing Annotations for Visual Object Detection
Hao Su, Jia Deng, Li Fei-Fei.
AAAI Human Computation Workshop (HCOMP) 2012
[ paper ] [ bibtex ]

Large Scale Visual Recognition
Jia Deng.
PhD Dissertation 2012
[ pdf ]

Hedging Your Bets: Optimizing Accuracy-Specificity Trade-offs in Large Scale Visual Recognition
Jia Deng, Jonathan Krause, Alex Berg, Li Fei-Fei
IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2012.
[ paper ] [ supplementary materials ] [ code ] [ project site ] [ bibtex ]

Fast and Balanced: Efficient Label Tree Learning for Large Scale Object Recognition
Jia Deng, Sanjeev Satheesh, Alex Berg, Li Fei-Fei
Neural Information Processing Systems(NIPS), 2011.
[ paper] [ supplementary materials ] [ bibtex ]

Hierarchical Semantic Indexing for Large Scale Image Retrieval.
Jia Deng, Alex Berg, Li Fei-Fei
IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2011.
[ paper ] [ supplementary materials ] [ bibtex ]

What does classifying more than 10,000 image categories tell us?
Jia Deng, Alex Berg, Kai Li, Li Fei-Fei
European Conference on Computer Vision(ECCV), 2010.
[ paper ] [ data ] [ code ] [ bibtex ]

ImageNet: A Large-Scale Hierarchical Image Database.
Jia Deng, Wei Dong, Richard Socher, Li-Jia Li, Kai Li, Li Fei-Fei
IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2009.
[ paper ] [ project site ] [ New York Times article ] [ bibtex ]

Towards scalable dataset construction: An active learning approach
Brandon Collins, Jia Deng, Kai Li, Li Fei-Fei.
European Conference on Computer Vision(ECCV), 2008.
[ paper ] [ bibtex ]

Digital Bas-Relief From 3D Scenes
Tim Weyrich, Jia Deng, Connelly Barnes, Szymon Rusinkiewicz, Adam Finkelstein.
ACM Transactions on Graphics (Proc. SIGGRAPH), 26(3), August 2007.
[ paper ] [ project site ] [ bibtex ]

Acknowledgments

We acknowledge the generous support of the National Science Foundation, the Office of Naval Research, Samsung, DARPA, IARPA, Google, Intel, Amazon, Toyota, KAUST, Procter & Gamble, General Motors, Yahoo, Adobe, Facebook, and Nvidia.