본문 바로가기

전체 글69

Stanford CS234 Lecture 6 Stanford CS234: Reinforcement Learning | Winter 2019 | Lecture 6 We will combine Nueral Network(NN) features on RL Basic Deep Neural Network DNN is linear neural network structure with more than three hidden layers of functional operators which are differentiable. Benefits of using DNN are as below DNN is universal function approximator Requires less nodes/parameters to represent same function U.. 2022. 8. 9.
Stanford CS234 Lecture 5 Stanford CS234: Reinforcement Learning | Winter 2019 | Lecture 5 We need to be able to generalize from our experience to make “good decisions” Value Function Approximation(VFA) from now on, we will represent (s,a) value function with parameterized function input would be state or state-action pair, output would be value in any kinds. parameter w here would a vector in simple terms such as DN.. 2022. 8. 8.
훈련소 필수품 및 꿀팁 본 글은 2022년 07월 07일부터 07월 28일까지 산업기능요원 보충역 훈련소 관련 내용입니다. 개인 짐을 생활관에 두는 보충역 기준이므로 현역은 다를 수 있습니다. 훈련소 준비물/필수품 여분의 팬티 * 2 (공익은 짐을 생활관 내에 둬서 사제 팬티 입어도 모름) 샴푸, 바디워시, 폼클렌징, 치약, 칫솔(보급으로는 비누만 줘서 피부 뒤집어짐. 귀찮으면 안가져가고 빌려쓰는 것도 낫배드기 함ㅎㅎ. 보급 치약, 칫솔 진짜 별로니까 가능하면 좋은거 챙겨갈 것) 로션, 바디로션, 선크림(매우 중요) 물티슈 100매 + 비데용물티슈 1팩(보급 휴지 3개 주기는 하는데 비데 물티슈 있으면 쾌적함) 개인 상비약(알러지약, 타이레놀, 영양제 등 / 첫날 내라고 하는데 무시하고 가지고 있자) 카누, 아이스티(첫날부터 .. 2022. 8. 7.
산업기능요원 훈련소(3주) 후기 3편 _ 12일 ~ 21일차(2,3주차) 본 글은 2022년 07월 07일부터 07월 28일까지 산업기능요원 보충역 훈련소 후기입니다. 3편은 12일차 ~ 21일차 수료까지의 이야기입니다. * 본인은 육군훈련소 29연대 3교육대 11중대 2소대 소속이었습니다. 타 연대는 운영이 다를 수 있습니다. 12일차(07.18 월) 4시 기상, 우천으로 인한 실내 체단 7시 반까지 총기분해, 손질시킴. 스니커즈 없었으면 굶어 죽었을 것 같다. 아침식사(노맛... 이제 슬슬 질린다.) 10시 반까지 총기분해, 안전검사, 고장점검 평가(이 또한 빨리 통과하고 빠르게 휴식) 영상 보다가 점심식사 쉬다가 총기세척 여어어얼심히 하고 저녁식사 20시 취침 밖에 나가지도 않고 뭐 훈련도 안하는데 왜 4시에 깨운걸까? 13일차(07.19 화) 사격 전 마지막 연습한 날.. 2022. 8. 6.
ROS Noetic : Concept of ROS Topic (Publisher, Subscriber) Concept of ROS Topic (Publisher, Subscriber) ROS 환경에서 2개 이상의 node는 topic을 통해 통신을 하게 된다. 이때 Topic을 발행하는 쪽이publisher, 이를 수령하는 쪽이 Subscriber의 역할을 한다. 간단하게 tutorial로 준 talker, listener node의 동작을 본다. 좌측 상단이 talker, 우측 상단이 listener 위 화면을 보면 talker node에서 listener node로 /chatter라는 이름의 topic을 전달하는 것을 확인할 수 있다. 현재 시행되는 node, topic은 아래 명령들로 확인이 가능하다. rosnode list # node rostopic list # topic rostopic info.. 2022. 8. 6.
Stanford CS234 Lecture 4 Stanford CS234: Reinforcement Learning | Winter 2019 | Lecture 4 →We evaluated policy in model-free situation last time How can an agent start making good decisions when it doen’t know how the world works: How do we make a “good decision”? Learning to Control Invovles... Optimization : we want maximal expected rewards Delayed Consequences : may take time to realize wheter previous action aws goo.. 2022. 8. 5.
반응형