RL4 MDT 논문리뷰(Multimodal Diffusion Transformer: Learning Versatile Behavior from Multimodal Goals) Multimodal Diffusion Transformer: Learning Versatile Behavior from Multimodal GoalsMultimodal Diffusion Transformer: Learning Versatile Behavior from...Introductionmultimodal task에서 다목적 행동을 학습할 수 있는 새로운 확산 기반 접근법인 Multimodal Diffusion Transformer (MDT) 를 소개한다. MDT는 적은 언어 주석 데이터에서도 효율적으로 학습하며, 두 가지 self-supervised loss(MGF, CLA)을 도입하여 성능을 크게 향상시킴. MDT는 CALVIN 및 LIBERO 벤치마크에서 최고 성능을 기록하며, 대규모 사전 학.. 2024. 8. 19. Concurrent Training 논문리뷰(Concurrent Training of a Control Policy and a State Estimator for Dynamic and Robust Legged Locomotion) Concurrent Training of a Control Policy and a State Estimator for Dynamic and Robust Legged LocomotionConcurrent Training of a Control Policy and a State Estimator for...simple end-to-end locomotion learning framework that concurrently trains a control policy and a state estimatorIntroduction기존의 4족보행 로봇의 locomotion control은 정교하게 미리 계산된 state estimation을 input으로 받아 계산한다. 하지만 이런 기존의 state estimato.. 2024. 8. 1. GenLoco 논문리뷰(GenLoco: Generalized Locomotion Controllers for Quadrupedal Robots) GenLoco: Generalized Locomotion Controllers for Quadrupedal RobotsGenLoco: Generalized Locomotion Controllers for Quadrupedal RobotsGenLoco Githubhttps://github.com/HybridRobotics/GenLocoIntroduction4족보행 로봇의 연구/기업 내 사용이 증가함에 따라 다양한 로봇에서 활용 가능한 보행 제어기의 필요성이 증가했다. 기존의 보행 제어기는 robot specific한 모델으로 강화학습 기반 제어기는 이론적으로는 모든 로봇에 적요이 가능하지만 실제로는 reward formulation의 특이성으로 단일 로봇에서만 정상적으로 동작한다. 이 논문에서는 유사한 형.. 2024. 7. 24. PerAct 논문리뷰(PERCEIVER-ACTOR: A Multi-Task Transformer for Robotic Manipulation) PERCEIVER-ACTOR: A Multi-Task Transformer for Robotic ManipulationPerceiver-Actor: A Multi-Task Transformer for Robotic Manipulation기본적으로 알면 이해에 도움이 되는 TransformerAttention Is All You Need💡 **Keywords:** Transformers, Language Grounding, Manipulation, Behavior CloningAbstract💡 “A language-conditioned BC agent that can learn to imitate a wide variety of 6-DoF manipulation tasks with just a few .. 2024. 7. 23. 이전 1 다음 반응형