0% Complete
فارسی
Home
/
سی و دومین کنفرانس ملی و دهمین کنفرانس بین المللی مهندسی زیست پزشکی ایران
Short-term gains vs. long-term Success: Reward strategy design for reinforcement learning in football
Authors :
Mohammad Pashaei
1
Amirhossein Tayebi
2
Hadi Amiri
3
Ali Fahim
4
1- Department of Engineering Science, University of Tehran, Tehran, Iran
2- Department of Engineering Science, University of Tehran, Tehran, Iran
3- Department of Engineering Science, University of Tehran, Tehran, Iran
4- Department of Engineering Science, University of Tehran, Tehran, Iran
Keywords :
Reinforcement Learning،Multi-agent systems،Soccer Simulation
Abstract :
Reinforcement learning in complex games like soccer relies heavily on how you define your reward function and environment. In this work, we developed a custom 3v3 soccer environment and implemented two RL-based teams with distinct learning trends: one with a fast convergence but limited long-term adaptation, and another with a slower yet more robust learning trajectory. Simulation shows that despite performing better at the start, the short-term agents fall short of the performance of the long-term agents in the long run, and after passing 50% of the episodes, the win rate of long-term agents rises from 30% in the beginning to 50%.
Papers List
List of archived papers
A Telemedicine Approach to Therapist-Free VR Exposure Therapy for Acrophobia: A pilot study
Arya Gholipoor Hanizi - Samaneh Minakhani - Poorya Gholipoor
طراحی یک سیستم تشخیص سطح لرزش برای بیماران پارکینسون بر اساس توپولوژی سری زمانی لرزش در فضای فاز جغرافیایی
مهدی ذوالفقارزاده کرمانی - سعید رشیدی - اساسه مریم
تاثیر هوش مصنوعی بر تغییرات سیاست های مالی: چالش ها و فرصت ها
بهارک یادگار جمشیدی - جمال سبک دستی - زینب رضائی - امین مقتدری
مروری بر ابزارهای نوین تأمین مالی اسلامی
مهدی زینالی
نقش علم داده در مهندسی راه و ترابری
حمیدرضا ربانینژاد
واقعاً چه چیزی در جلوگیری از تقلب علیه سازمان ها مؤثر است که تصمیم گیرندگان باید بدانند؟
شبنم بالازاده قره باغی - سعید مصدق - اسماعیل عبادی
افزایش تاب آوری سایبری با تلفیق بلاکچین و هوش مصنوعی: به کارگیری قراردادهای هوشمند جهت جلوگیری از تغییر سطح دسترسی مهاجم در حملات APT
شهرام حاج غنی - فرزانه عبدالرحیمی - زهره ابوالهادی
Gait Retraining of Musculoskeletal Patients Using Deep Learning Techniques
Kourosh Alimadadi - Masoud Shariat Panahi - Morad Karimpour - Hadi Ghattan Kashani
نقش ارزیابی عملکرد در مدیریت صحیح منابع انسانی (با تاکید بر نقش مدیران میانی)
محمد خدایی قلقاچی
نقش مشوق های مالی به عنوان تعدلیگر در رابطه بین هنجارهای ذهنی و رفتارهای حافظ محیط زیست در بین دانشجویان تحصیلات تکمیلی دانشگاه آزاد تبریز
سجاد محبی - اکبر علیزاده - مجید پابرجای زنجانی
more
Samin Hamayesh - Version 42.4.1