0% Complete
English
صفحه اصلی
/
سی و دومین کنفرانس ملی و دهمین کنفرانس بین المللی مهندسی زیست پزشکی ایران
Short-term gains vs. long-term Success: Reward strategy design for reinforcement learning in football
نویسندگان :
Mohammad Pashaei
1
Amirhossein Tayebi
2
Hadi Amiri
3
Ali Fahim
4
1- Department of Engineering Science, University of Tehran, Tehran, Iran
2- Department of Engineering Science, University of Tehran, Tehran, Iran
3- Department of Engineering Science, University of Tehran, Tehran, Iran
4- Department of Engineering Science, University of Tehran, Tehran, Iran
کلمات کلیدی :
Reinforcement Learning،Multi-agent systems،Soccer Simulation
چکیده :
Reinforcement learning in complex games like soccer relies heavily on how you define your reward function and environment. In this work, we developed a custom 3v3 soccer environment and implemented two RL-based teams with distinct learning trends: one with a fast convergence but limited long-term adaptation, and another with a slower yet more robust learning trajectory. Simulation shows that despite performing better at the start, the short-term agents fall short of the performance of the long-term agents in the long run, and after passing 50% of the episodes, the win rate of long-term agents rises from 30% in the beginning to 50%.
لیست مقالات
لیست مقالات بایگانی شده
چالشها و فرصتهای نگارش و فرایند داوری مقالات با هوش مصنوعی
مرضیه باباشپور اصل
طراحی بهینهی پلاکهای ارتوپدی برای ترمیم شکستگی ساب تروکانتریک استخوان ران بر پایهی مدلسازی آماری و روشهای یادگیری ماشین
ماجده رضائی - مسعود شریعت پناهی - مراد کریم پور - هادی قطان کاشانی
طراحی و پیاده سازی پایگاه داده سامانه فروش برخط
ملیحه نیک سیرت - مریم دادی
کاربرد هوش مصنوعی در مدیریت ارتباط با مشتری
سعیده شریفی علون آبادی - ناصر خانی
Ensemble Learning–Based Surrogate Models for Non-Invasive Estimation of Corneal Mechanical Properties
Seyed Sadjad Abedi Shahri - Mitra Baradari - Iman Zoljanahi Oskui
شبیه سازی افزایش نفوذ دارو در لوله مویرگی با غشا نفوذپذیر به کمک اثر نانوذرات مغناطیسی
پریماه سلیمی - هامون پورمیرزاآقا - منصور امیری دوگاهه - علی وظیفه دوست صالح - سیده سوده جهانی
شناسایی عوامل تعیین کننده قصد انطباق مالیات با تاکید بر نظریه رفتار برنامه ریزی شده
نیما صدری نوبر زاد - پریسا صدری نوبر زاد
Enhancing Drug–Target Affinity Prediction with Non-Local Block Graph Neural Networks
Reza Tahmasebi - Eghbal Mansoori - Armin Piashehvar - Abbas Mehrbaniyan
ارائه مدل ترکیبی کشف نفوذ مبتنی بر تحلیل دادههای بزرگ و یادگیری عمیق در محیطهای توزیعشده
شاهین سمیع عادل
بررسی خواص مکانیکی داربستهای متشکل از نانوسلولز، ژلاتین و ماتریس خارجسلولی برای کاربرد در مهندسی بافت استخوان
مهدی درگاهی - معصومه محمودی
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.5.2