애자일소다, 강화학습 보상 관련 특허 획득

기업 목표·성과 일치 가능한 보상 함수 알고리즘 개발

[아이뉴스24 최은정 기자] 애자일소다는 기업 비즈니스에 강화학습을 적용하는 데 활용할 수 있는 '데이터 기반 강화학습 장치 및 방법' 관련 국내 특허를 취득했다고 24일 발표했다.

강화학습은 자율주행, 로봇제어, 게임 분야에 많이 사용되는 머신러닝 기술이다. 행동 주체인 에이전트가 어떤 행동을 해야 더 많은 보상을 받을지 알아내는 것을 목적으로 한다.

그 동안 비즈니스 환경은 사업목적에 맞는 보상체계를 정하기가 어려워 매번 사업목적에 부합하는 보상 설정을 반복하면서 실험해야 했다. 가령 분석가들은 최적의 모델을 개발하기 위해 임의로 보상 점수를 부여, 재조정하는 수많은 시행착오 과정이 필요했다.

이에 애자일소다는 기업의 목표와 성과를 일치할 수 있는 보상 함수 알고리즘을 개발, 특허를 획득했다. 이번 기술을 통해 분석가들은 새로운 보상 설정에 필요한 시간과 공수를 단축할 수 있게 됐다는 게 회사 측 설명이다. 또한 반복적인 학습과 재조정 과정에 필요한 대규모 컴퓨팅 리소스도 줄이게 된다.

최대우 애자일소다 대표는 "이번 특허 기술은 향후 출시 예정인 강화학습 솔루션 '베이킹소다'에 적용될 예정"이라며 "앞으로도 애자일소다는 강화학습의 비즈니스 적용에 지속적인 관심을 갖고 연구해 나갈 계획"이라고 말했다.

최은정 기자 ejc@inews24.com

최은정 기자의 다른 기사 보기

첫 번째 댓글을 작성해 보세요.

로딩중

포토뉴스

애자일소다, 강화학습 보상 관련 특허 획득

기업 목표·성과 일치 가능한 보상 함수 알고리즘 개발

댓글 쓰기 ^제목 애자일소다, 강화학습 보상 관련 특허 획득

댓글-

기업 목표·성과 일치 가능한 보상 함수 알고리즘 개발

애자일소다, 국제학회에 '강화학습' 주제논문 채택

애자일소다·콴텍, 하이브리드형 자산배분 서비스 공동 개발

댓글 쓰기 제목 애자일소다, 강화학습 보상 관련 특허 획득

댓글 쓰기 ^제목 애자일소다, 강화학습 보상 관련 특허 획득