안녕하세요 GDSC DJU AI 스터디팀 입니다. 저희는 강화학습에 대해 공부를 진행하고 있으며 두 번째 포스팅은 마르코프 결정 프로세스에 대한 기초적인 설명을 드리도록 하겠습니다! 2.1.1 마르코프 결정 프로세스(MDP: Markov Decision Process) - 순차적 의사결정 문제는 결국 MDP라는 개념을 통해 더 정확하게 표현이 가능하다. 아이가 잠이 드는 마르코프 프로세스 - 아이가 잠이 들 때 벌어지는 상황을 마르코프 프로세스로 나타낸 그림 - 아이가 취할 수 있는 상황은 총 5가지 누워있는 상태 S0 일어나서 노는 상태 S2 눈을 감은 상태 S2 서서히 잠이오는 상태 S3 잠든 상태 S4 - 아이가 하나의 상태로 진입하게 되면 해당 상태에서 1분씩 머물게 됨 - 1분이 지나면 다음 상..
Study/AI 스터디
안녕하세요 GDSC DJU AI 스터디팀 입니다. 저희는 강화학습에 대해 공부를 진행하고 있어 첫 포스팅은 지도학습, 비지도 학습 그리고 강화학습에 대한 기초적인 설명을 드리도록 하겠습니다! 1.1 지도학습과 강화학습 지도학습 : 아버지(지도자)의 도움을 받아 자전거 타는 법을 배우는 아들(학습) 강화학습 : 혼자서 스스로 시행착오(train and error)를 통해 학습하는 아들 1.1.1 기계학습의 분류 비지도 학습 추가 설명후 train data와 test 데이터에 대해 설명 ex) 테스트 데이터는 train 데이터와 겹쳐지지 않는 사진이여야된다. 강화학습 강화학습이 무엇인가 쉽지만 추상적인 버전 “시행착오(train and error)를 통해 발전해 나가는 과정 어렵지만 좀더 명확한 버전 “순차..