GitHub - AmmieQi/AVE-ECCV18 at 5732276fb151d02c3e40acf60835f728478224c0

Branches Tags

Name		Name	Last commit message	Last commit date
Latest commit History 45 Commits
Figs		Figs
data		data
visual_att/-pyreSm_sQs		visual_att/-pyreSm_sQs
README.md		README.md
attention_visualization.py		attention_visualization.py
dataloader.py		dataloader.py
models_fusion.py		models_fusion.py
supervised_main.py		supervised_main.py

Repository files navigation

Audio-Visual Event Localization in Unconstrained Videos (To appear in ECCV 2018) (not ready)

AVE Dataset & Features

AVE dataset can be downloaded from https://drive.google.com/open?id=1FjKwe79e0u96vdjIVwfRQ1V6SoDHe7kK.

Audio feature and visual feature are also released. Please put videos of AVE dataset into /data/AVE folder and features into /data folder before running the code.

Requirements

Pytorch, Keras, ffmpeg.

Visualize attention maps

Run: python attention_visualization.py to generate audio-guided visual attention maps.

Supervised audio-visual event localization

Weakly-supervised audio-visual event localization

Cross-modality localization

Citation

If you find this work useful, please consider citing it.

@inproceedings{AVE2018,
title={Audio-Visual Event Localization in Unconstrained Videos},
author={Yapeng Tian, Jing Shi, Bochen Li, Zhiyao Duan, and Chenliang Xu},
booktitle={ECCV},
year={2018}
}

Acknowledgements

Audio features are extracted using vggish and the audio-guided visual attention model was implemented highly based on adaptive attention. We thank the authors for sharing their codes.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AVE Dataset & Features

Requirements

Visualize attention maps

Supervised audio-visual event localization

Weakly-supervised audio-visual event localization

Cross-modality localization

Citation

Acknowledgements

About

Releases

Packages

Languages

AmmieQi/AVE-ECCV18

Folders and files

Latest commit

History

Repository files navigation

AVE Dataset & Features

Requirements

Visualize attention maps

Supervised audio-visual event localization

Weakly-supervised audio-visual event localization

Cross-modality localization

Citation

Acknowledgements

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages