0% Complete
English
صفحه اصلی
/
سی و دومین کنفرانس ملی و دهمین کنفرانس بین المللی مهندسی زیست پزشکی ایران
Short-term gains vs. long-term Success: Reward strategy design for reinforcement learning in football
نویسندگان :
Mohammad Pashaei
1
Amirhossein Tayebi
2
Hadi Amiri
3
Ali Fahim
4
1- Department of Engineering Science, University of Tehran, Tehran, Iran
2- Department of Engineering Science, University of Tehran, Tehran, Iran
3- Department of Engineering Science, University of Tehran, Tehran, Iran
4- Department of Engineering Science, University of Tehran, Tehran, Iran
کلمات کلیدی :
Reinforcement Learning،Multi-agent systems،Soccer Simulation
چکیده :
Reinforcement learning in complex games like soccer relies heavily on how you define your reward function and environment. In this work, we developed a custom 3v3 soccer environment and implemented two RL-based teams with distinct learning trends: one with a fast convergence but limited long-term adaptation, and another with a slower yet more robust learning trajectory. Simulation shows that despite performing better at the start, the short-term agents fall short of the performance of the long-term agents in the long run, and after passing 50% of the episodes, the win rate of long-term agents rises from 30% in the beginning to 50%.
لیست مقالات
لیست مقالات بایگانی شده
علم داده به عنوان شتابدهنده نوآوری در صنعت مهندسی
رامین احمدپور
آیندهپژوهی زنجیره تأمین بینالمللی در عصر هوش مصنوعی: چشماندازی دادهمحور به تأمین و خرید جهانی
اکرم معصومی دهقی - الهام گرک یراق - محمد علی جان نثاریان لادانی - روح اله جزینی درچه
Optimization and Novel insights: The convergence of Quantum Computing and Data Science in Engineering Application
Nayereh Majd
ارزیابی کارایی روشهای اصلاح پراکندگی در تصویربرداری SPECT قلب همزمان دو ایزوتوپی
بهاره جودی ثمرین - مهسا نوری اصل
تاثیر هوش مصنوعی بر عملکرد سازمانی: نقش واسطه ای بهره وری کارکنان(مطالعه موردی: اداره مالیاتی شهر تبریز)
نیما صدری نوبرزاده - پریسا صدری نوبرزاده
تاثیر هوش مصنوعی بر توسعه اقتصاد حسابداری
نیما قاسم زاده شهرک - سعید انورخطیبی - سلمان عبدی
تاثیر ارتباطات سیاسی بر ارزش و عملکرد شرکت ها
رعنا شهدآور - علی بیرامی مرزرود
Implementation of Anisotropic Hyperelastic Materials in NL-SBFEM Framework: The HGO Model
Seyed Sadjad Abedi-Shahri - Farzan Ghalichi - Iman Zoljanahi Oscui
حسابداری توسعه پایدار با رویکرد اقتصاد هوشمند
مهدی زینالی - علیرضا صابر - رامین فتح الله زاده دیزجی - احمد حسن پور
ایجاد پوشش کامپوزیتی HA-TiO₂ بر روی آلیاژ زیستتخریبپذیر منیزیم به روش رسوبدهی الکتروفورتیک
سید محمد مکی - حسن جعفری - فاطمه سادات پیشبین - سلیمان خوشرو
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.4.1