0% Complete
فارسی
Home
/
سی و دومین کنفرانس ملی و دهمین کنفرانس بین المللی مهندسی زیست پزشکی ایران
Short-term gains vs. long-term Success: Reward strategy design for reinforcement learning in football
Authors :
Mohammad Pashaei
1
Amirhossein Tayebi
2
Hadi Amiri
3
Ali Fahim
4
1- Department of Engineering Science, University of Tehran, Tehran, Iran
2- Department of Engineering Science, University of Tehran, Tehran, Iran
3- Department of Engineering Science, University of Tehran, Tehran, Iran
4- Department of Engineering Science, University of Tehran, Tehran, Iran
Keywords :
Reinforcement Learning،Multi-agent systems،Soccer Simulation
Abstract :
Reinforcement learning in complex games like soccer relies heavily on how you define your reward function and environment. In this work, we developed a custom 3v3 soccer environment and implemented two RL-based teams with distinct learning trends: one with a fast convergence but limited long-term adaptation, and another with a slower yet more robust learning trajectory. Simulation shows that despite performing better at the start, the short-term agents fall short of the performance of the long-term agents in the long run, and after passing 50% of the episodes, the win rate of long-term agents rises from 30% in the beginning to 50%.
Papers List
List of archived papers
سیاستهای پولی، تغییرات نرخ ارز، تصمیمات تودهوار سهامداران در چارچوب الزامات قانونی بازار سرمایه
عظیم رضوی مجارشین
بررسی فرآیند مدیریت منابع انسانی بر عملکرد کارکنان سازمان مالیاتی با میانجی رضایت شغلی و تعدیلگری تعهد شغلی (مورد مطالعه: اداره امور مالیاتی تبریز)
پریسا صدری نوبرزاده - نیما صدری نوبرزاده
بررسی آینده چکهای تضمین شده در عصر متاورس
رضا آقاعباسی - طهورا گچی - مریم اعظم پور
An RZ-OOK Modulation Technique for Joint Data Rate and Output Power Tuning in Biomedical Applications
Tayebeh Azadmousavi - Esmaeil Najafiaghdam
Fast Reflection-Mode Ultrasound Computed Tomography Versus Conventional Pulse-Echo Technique
Elnaz Rostami Siahpoush - Haniye Fathi - Zahra Kavehvash
ساخت داربست پلییورتان گرمانرم-هیدروکسی آپاتیت-اکسید گرافن احیا شده و بررسی رفتار زیستتخریبپذیری و زیستسازگاری آن
سید امیررضا زارعیان - سید مجتبی زبرجد
ارزیابی تأثیر حسابداری مدیریت بر افزایش سرمایه فکری سازمانهای دولتی کشور
حسین بوذری
High-throughput microfluidic electroporation system using 3D-hydrodynamic focusing
Zohre Nazemi Dehkordi - Ali Abouei Mehrizi
تحلیل و بررسی الگوریتمهای جستجوی رشته
مجید عبدالرزاق نژاد
افزایش پیش بینی بازار سهام از طریق هوش مصنوعی
سهیلا صمدی گلوجه - اسما حیدری پناه - زهرا علی لیواری - فاطمه خالقیان
more
Samin Hamayesh - Version 43.6.0