multimodal1 MDT 논문리뷰(Multimodal Diffusion Transformer: Learning Versatile Behavior from Multimodal Goals) Multimodal Diffusion Transformer: Learning Versatile Behavior from Multimodal GoalsMultimodal Diffusion Transformer: Learning Versatile Behavior from...Introductionmultimodal task에서 다목적 행동을 학습할 수 있는 새로운 확산 기반 접근법인 Multimodal Diffusion Transformer (MDT) 를 소개한다. MDT는 적은 언어 주석 데이터에서도 효율적으로 학습하며, 두 가지 self-supervised loss(MGF, CLA)을 도입하여 성능을 크게 향상시킴. MDT는 CALVIN 및 LIBERO 벤치마크에서 최고 성능을 기록하며, 대규모 사전 학.. 2024. 8. 19. 이전 1 다음 반응형