Media_Creation_Reliving

Multi-modal Machine Learning

Shengcao Cao, Dhiraj Joshi, Liangyan Gui, Yu-Xiong Wang, "HASSOD: Hierarchical Adaptive Self-Supervised Object Detection", accepted to NeuRIPS 2023.
Shengcao Cao, Dhiraj Joshi, Liangyan Gui, Yu-Xiong Wang, "Contrastive Mean Teacher for Domain Adaptive Object Detectors", CVPR 2023.
Hanjing Wang, Dhiraj Joshi, Shiqiang Wang, Qiang Ji, "Gradient-based Uncertainty Attribution for Explainable Bayesian Deep Learning", CVPR 2023.
Andrew Rouditchenko, Angie Boggust, David Harwath, Brian Chen, Dhiraj Joshi, Samuel Thomas, Kartik Audhkhasi, Hilde Kuehne, Rameswar Panda, Rogerio Feris, Brian Kingsbury, Michael Picheny, Antonio Torralba, James Glass, "AVLnet: Learning Audio-Visual Language Representations from Instructional Videos", arXiv:2006.09199. (Also accepted at Interspeech 2021).
Sicheng Zhao, Shangfei Wang, Mohammad Soleymani, Dhiraj Joshi, Qiang Ji. "Affective Computing for Large-Scale Heterogeneous Multimedia Data: A Survey". ACM Transactions on Multimedia Computing, Communications, and Applications (TOMM), 2019.
Khoi-Nguyen C. Mac, Dhiraj Joshi, Raymond A. Yeh, Jinjun Xiong, Rogerio Feris, Minh N. Do, "Learning Motion in Feature Space: Locally- Consistent Deformable Convolution Networks for Fine Grained Action Detection", ICCV 2019 (oral - 4.3% of all submitted papers).
Angie Boggust, Kartik Audhkhasi, Dhiraj Joshi, David Harwath, Samuel Thomas, Rogerio Feris, Dan Gutfreund, Yang Zhang, Antonio Torralba, Michael Picheny, James Glass, "Grounding Spoken Words in Unlabeled Video", Sight and Sound Workshop, (CVPR) 2019.
Michele Merler, Khoi-Nguyen C. Mac, Dhiraj Joshi, Quoc-Bao Nguyen, Stephen Hammer, John Kent, Jinjun Xiong, Minh N. Do, John R. Smith, Rogerio Feris, "Automatic Curation of Sports Highlights using Multimodal Excitement Features", IEEE Transactions on Multimedia, 21(5), 1147-1160, 2019.
Michele Merler, Dhiraj Joshi, Khoi-Nguyen C. Mac, Quoc-Bao Nguyen, Stephen Hammer, John Kent, Jinjun Xiong, Minh N. Do, John R. Smith, Rogerio Feris, "The Excitement of Sports: Automatic Highlights using Audio-Visual Cues", Sight and Sound Workshop, (CVPR) 2018.
John R. Smith, Dhiraj Joshi, Benoit Huet, Winston Hsu, and Jozef Kota, "Harnessing A.I. for Augmenting Creativity: Application to Movie Trailer Creation", ACM Multimedia, 2017 (Best Brave New Ideas Paper Award 2017, IBM Pat Goldberg Memorial Best Paper Award 2017).
Dhiraj Joshi, Michele Merler, Quoc-Bao Nguyen, Stephen Hammer, John Kent, John R. Smith, Rogerio Feris, "IBM High-Five: Highlights From Intelligent Video Engine", ACM Multimedia, 2017 (demo).
Michele Merler, Dhiraj Joshi, Quoc-Bao Nguyen, Stephen Hammer, John Kent, John R. Smith, Rogerio Feris, "Auto Curation of Golf Highlights using Multimodal Excitement Features", Int. Workshop on Computer Vision in Sports (with CVPR), 2017.
Minwoo Park, Dhiraj Joshi, and Alexander Loui, "TagCloud++ - Scalable Tag-clouds for Arbitrary Layouts", IEEE Symposium on Multimedia (ISM), 2012.
Vivek Singh, Jiebo Luo, Dhiraj Joshi, Phoury Lei, Madirakshi Das, Peter Stubler, “Dynamic Media Show Drivable by Semantics”, ACM International Conference on Multimedia (demo session), 2011.
Vivek Singh, Jiebo Luo, Dhiraj Joshi, Phoury Lei, Madirakshi Das, Peter Stubler, “Reliving On Demand: A Total Viewer Experience”, ACM International Conference on Multimedia, 2011.
Dhiraj Joshi, Mark. D. Wood, and Jiebo Luo, “Suggesting Songs for Media Creation using Semantics”, IAPR International Conference on Pattern Recognition, 2010.