Skip to content
/ mVGG Public

[JCCI 2021] Modified VGG Model for Immersive Image Classification

Notifications You must be signed in to change notification settings

hyunobae/mVGG

Repository files navigation

mVGG

[JCCI 2021] Modified VGG Model for Immersive Image Classification

요약


본문은 실감미디어로 주목받는 MPEG-I 표준을 위한 영상을 전통적인 자연 영상과 분류할 수 있는 CNN 모델을 제안한다. 실감미디어의 효율적인 데이터 압축을 위해 view synthesis가 이뤄지는 경우가 많은데, 이러한 영상의 경우 일반적인 자연 영상과 신호 특성이 현저히 다른 영역이 다수 존재할 수 있다. 그러나 일반적인 동영상 압축 기법들은 자연 영상에 최적화된 경향이 많아서 이러한 실감미디어 영상(아틀라스)에 최적화되기 어려운 문제가 있다. 이를 해결하기 위해 본문에서는 영상 분류 문제에서 탁월한 효과를 보여왔던 CNN 모델을 활용하여 실감미디어 영상 분류 문제를 해결하고자 한다. 특히, VGG신경망과 ResNet50의 효용성을 평가하고, 이 모델의 성능을 극대화하기 위하여 수정한 딥러닝 아키텍쳐를 제안한다. 실험을 통해 우리의 제안하는 VGG 수정 모델의 정확도가 95% 에 이르는 것을 밝힌다.

코드 및 모델


아틀라스 이미지와 그렇지 않은 이미지를 분류하는데 사용할 수 있도록 코드와 미리 훈련된 모델을 제공한다.
아래는 사전 훈련된 모델이다.
[링크] : https://drive.google.com/drive/folders/1Xbd3tT3hnQh8eQ2HMMR-tJEjFJ1x9B6M?usp=sharing

About

[JCCI 2021] Modified VGG Model for Immersive Image Classification

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages