본문 바로가기

분류 전체보기66

MDT 논문리뷰(Multimodal Diffusion Transformer: Learning Versatile Behavior from Multimodal Goals) Multimodal Diffusion Transformer: Learning Versatile Behavior from Multimodal GoalsMultimodal Diffusion Transformer: Learning Versatile Behavior from...Introductionmultimodal task에서 다목적 행동을 학습할 수 있는 새로운 확산 기반 접근법인 Multimodal Diffusion Transformer (MDT) 를 소개한다. MDT는 적은 언어 주석 데이터에서도 효율적으로 학습하며, 두 가지 self-supervised loss(MGF, CLA)을 도입하여 성능을 크게 향상시킴. MDT는 CALVIN 및 LIBERO 벤치마크에서 최고 성능을 기록하며, 대규모 사전 학.. 2024. 8. 19.
3D Diffuser Actor 논문리뷰(3D Diffuser Actor: Policy Diffusion with 3D Scene Representations) 3D Diffuser Actor: Policy Diffusion with 3D Scene Representations3D Diffuser Actor: Policy Diffusion with 3D Scene RepresentationsIntroductionManipulation task는 기본적으로 멀티모달 성격을 가진다. 가장 자연스러운 해결 메소드는 policy학습을 distribution learning problem으로 정의하고 policy를 deterministic map($\pi_\theta(x)$)이 아닌 현재 state($p(y|x)$)에 대한 action 분포를 학습시키는 것이다. 최근 연구들은 이 state conditioned action distribution 학습에 diffusion.. 2024. 8. 12.
Diffusion Policy 논문리뷰(Diffusion Policy: Visuomotor Policy Learning via Action Diffusion) Diffusion Policy: Visuomotor Policy Learning via Action DiffusionDiffusion Policy: Visuomotor Policy Learning via Action Diffusion기본적으로 알면 이해에 도움이 되는 확산 모델과 행동 복제(Behavior Cloning) 💡 Keywords: Imitation learning, visuomotor policy, manipulationAbstract💡 “로봇 행동 생성을 위한 새로운 방법으로, 로봇의 비주모터 정책을 조건부 디노이징 확산 과정으로 나타내는 방법을 소개한다.”Diffusion Policy는 새로운 로봇 행동 생성 방법으로, 로봇의 비주모터 정책을 조건부 디노이징 확산 과정으로 나타낸다. .. 2024. 8. 7.
Concurrent Training 논문리뷰(Concurrent Training of a Control Policy and a State Estimator for Dynamic and Robust Legged Locomotion) Concurrent Training of a Control Policy and a State Estimator for Dynamic and Robust Legged LocomotionConcurrent Training of a Control Policy and a State Estimator for...simple end-to-end locomotion learning framework that concurrently trains a control policy and a state estimatorIntroduction기존의 4족보행 로봇의 locomotion control은 정교하게 미리 계산된 state estimation을 input으로 받아 계산한다. 하지만 이런 기존의 state estimato.. 2024. 8. 1.
GNFactor 논문리뷰(GNFactor: Multi-Task Real Robot Learning with Generalizable Neural Feature Fields) 일단 들어가기 앞서 해당 논문은 이전에 포스팅한 PerAct의 후속 논문이다. 그거 읽고 와야 이해가 편하다!https://maltese-rocks.tistory.com/63 PerAct 논문 리뷰(PERCEIVER-ACTOR: A Multi-Task Transformer for Robotic Manipulation)PERCEIVER-ACTOR: A Multi-Task Transformer for Robotic ManipulationPerceiver-Actor: A Multi-Task Transformer for Robotic Manipulation기본적으로 알면 이해에 도움이 되는 TransformerAttention Is All You Need💡 **Keywords:** Transformers, L.. 2024. 7. 26.
GenLoco 논문리뷰(GenLoco: Generalized Locomotion Controllers for Quadrupedal Robots) GenLoco: Generalized Locomotion Controllers for Quadrupedal RobotsGenLoco: Generalized Locomotion Controllers for Quadrupedal RobotsGenLoco Githubhttps://github.com/HybridRobotics/GenLocoIntroduction4족보행 로봇의 연구/기업 내 사용이 증가함에 따라 다양한 로봇에서 활용 가능한 보행 제어기의 필요성이 증가했다. 기존의 보행 제어기는 robot specific한 모델으로 강화학습 기반 제어기는 이론적으로는 모든 로봇에 적요이 가능하지만 실제로는 reward formulation의 특이성으로 단일 로봇에서만 정상적으로 동작한다. 이 논문에서는 유사한 형.. 2024. 7. 24.
반응형