0% Complete
فارسی
Home
/
سی و دومین کنفرانس ملی و دهمین کنفرانس بین المللی مهندسی زیست پزشکی ایران
Short-term gains vs. long-term Success: Reward strategy design for reinforcement learning in football
Authors :
Mohammad Pashaei
1
Amirhossein Tayebi
2
Hadi Amiri
3
Ali Fahim
4
1- Department of Engineering Science, University of Tehran, Tehran, Iran
2- Department of Engineering Science, University of Tehran, Tehran, Iran
3- Department of Engineering Science, University of Tehran, Tehran, Iran
4- Department of Engineering Science, University of Tehran, Tehran, Iran
Keywords :
Reinforcement Learning،Multi-agent systems،Soccer Simulation
Abstract :
Reinforcement learning in complex games like soccer relies heavily on how you define your reward function and environment. In this work, we developed a custom 3v3 soccer environment and implemented two RL-based teams with distinct learning trends: one with a fast convergence but limited long-term adaptation, and another with a slower yet more robust learning trajectory. Simulation shows that despite performing better at the start, the short-term agents fall short of the performance of the long-term agents in the long run, and after passing 50% of the episodes, the win rate of long-term agents rises from 30% in the beginning to 50%.
Papers List
List of archived papers
مطالعه ای بر بهبود مدیریت ارتباط با مشتری با استفاده از هوش مصنوعی
اسماعیل محبی کندسری
Fast Reflection-Mode Ultrasound Computed Tomography Versus Conventional Pulse-Echo Technique
Elnaz Rostami Siahpoush - Haniye Fathi - Zahra Kavehvash
The Effects of Levodopa and Visual Information on The Complexity of Postural Control in Parkinson’s Disease Patients With and Without Freezing of Gait Through a Multiscale Entropy Approach
Kiarash Banan Motarjem - َAmirhassan Khalouzadeh Mobarakeh - Aria Behroozi - Elham Shirzad Araghi
حمل و نقل هوشمند در بازی جنگ
جواد طیبی - حسین حیدری
بررسی تاثیر معیارهای قرارداد هوشمند بر عملکرد زنجیره تامین پایدار
محمد علیمحمدی - امیر نجفی
بلاکچین برای آینده مدیریت زنجیره تأمین پایدار در صنعت چهارم
زهرا کرمی
Mapping Epileptic Networks: IED-Triggered Hemodynamic Changes Identified via Simultaneous EEG-fMRI Recordings
Elias Ebrahimzadeh - Mostafa Asgarinejad - Melika Akbarimehr - Hamid Soltanian-Zadeh
مزایای هوش مصنوعی در تصمیم گیری عملیاتی
مهدی محمدی امین - مهدی فرساد - هادی محمدی امین
Injectability Enhancement and Optimization of a Biphasic Calcium Phosphate Bone Cement
Sepehr Larijani - Mitra Asadi-Eydivand - Nabiollah Abolfathi - Mehran Solati-Hashjin
طراحی چارچوب شخصیسازیشده درمان بیماری MS مبتنی بر یادگیری تقویتی عمیق SAC
مریم سبزه یان - محبوبه سبزه یان - امین نوری - ماندانا سادات غفوریان
more
Samin Hamayesh - Version 42.5.2