제목 : RPG 사용자 플레이 관찰학습 기반 가이드 NPC 인공지능 강화학습
저자 : 정원조
초록 :
본 연구는 RPG에서 목표 레벨 달성을 위한 분기 선택 가이드를 해주는 인공지능 구축을 목적으로 한다. 이를 위하여 RPG 환경 구성, 인공지능 에이전트의 행동, 관측, 처벌 및 보상 설계하여 강화학습을 진행했다. 결과 데이터로 평균 레벨, 던전 입장횟수, 던전 클리어 횟수, 사망횟수를 구하였다. 이를 관찰행동 학습량 분류 데이터와 에이전트 명령 이행률 분류 데이터로 추출하여 플레이 타임 대비 비교 검증하였다. 학습이 완료된 인공지능 가이드는 목표 레벨달성까지 13시간 걸렸으며, 대조군인 가이드 이행률 0%는 44시간을 소모 했지만 목표 달성에 실패했다. 이를 바탕으로 RPG에서 인공지능 가이드의 역할 효율을 검증하였다. 본 연구는 게임 내 목표 달성을 위하여 인공지능을 활용한 콘텐츠 가이드 연구 사례로서 향후 인공지능의 협력을 활용한 게임 개발의 자료로 활용되길 희망한다.
The purpose of this study is to build an artificial intelligence that guides branch selection to achieve target level in RPG. For this, reinforcement learning was carried out by designing the RPG environment, the behavior of the artificial intelligence agent, observation, punishment, and reward. As the result data, the average level, dungeon entries count, dungeon clear count, death count were obtained. These data were compared with learning progress and agent command fulfillment rates. It took 13 hour for the trained agent to achieve the goal, but the guide Fulfillment rate of 0% took 44 hours, but failed to achieve the goal. agent guide is effective in achieving the goal.
URL : https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE11149435
제목 : RPG 사용자 플레이 관찰학습 기반 가이드 NPC 인공지능 강화학습
저자 : 정원조
초록 :
본 연구는 RPG에서 목표 레벨 달성을 위한 분기 선택 가이드를 해주는 인공지능 구축을 목적으로 한다. 이를 위하여 RPG 환경 구성, 인공지능 에이전트의 행동, 관측, 처벌 및 보상 설계하여 강화학습을 진행했다. 결과 데이터로 평균 레벨, 던전 입장횟수, 던전 클리어 횟수, 사망횟수를 구하였다. 이를 관찰행동 학습량 분류 데이터와 에이전트 명령 이행률 분류 데이터로 추출하여 플레이 타임 대비 비교 검증하였다. 학습이 완료된 인공지능 가이드는 목표 레벨달성까지 13시간 걸렸으며, 대조군인 가이드 이행률 0%는 44시간을 소모 했지만 목표 달성에 실패했다. 이를 바탕으로 RPG에서 인공지능 가이드의 역할 효율을 검증하였다. 본 연구는 게임 내 목표 달성을 위하여 인공지능을 활용한 콘텐츠 가이드 연구 사례로서 향후 인공지능의 협력을 활용한 게임 개발의 자료로 활용되길 희망한다.
The purpose of this study is to build an artificial intelligence that guides branch selection to achieve target level in RPG. For this, reinforcement learning was carried out by designing the RPG environment, the behavior of the artificial intelligence agent, observation, punishment, and reward. As the result data, the average level, dungeon entries count, dungeon clear count, death count were obtained. These data were compared with learning progress and agent command fulfillment rates. It took 13 hour for the trained agent to achieve the goal, but the guide Fulfillment rate of 0% took 44 hours, but failed to achieve the goal. agent guide is effective in achieving the goal.
URL : https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE11149435