سامانه همایش‌ها TSTA | ثبت‌نام و ارسال مقاله کنفرانس‌ها و کنگره‌های ملی

English

صفحه اصلی / سی و دومین کنفرانس ملی و دهمین کنفرانس بین المللی مهندسی زیست پزشکی ایران

Short-term gains vs. long-term Success: Reward strategy design for reinforcement learning in football

نویسندگان :

Mohammad Pashaei¹ Amirhossein Tayebi² Hadi Amiri³ Ali Fahim⁴

1- Department of Engineering Science, University of Tehran, Tehran, Iran 2- Department of Engineering Science, University of Tehran, Tehran, Iran 3- Department of Engineering Science, University of Tehran, Tehran, Iran 4- Department of Engineering Science, University of Tehran, Tehran, Iran

کلمات کلیدی :

Reinforcement Learning،Multi-agent systems،Soccer Simulation

چکیده :

Reinforcement learning in complex games like soccer relies heavily on how you define your reward function and environment. In this work, we developed a custom 3v3 soccer environment and implemented two RL-based teams with distinct learning trends: one with a fast convergence but limited long-term adaptation, and another with a slower yet more robust learning trajectory. Simulation shows that despite performing better at the start, the short-term agents fall short of the performance of the long-term agents in the long run, and after passing 50% of the episodes, the win rate of long-term agents rises from 30% in the beginning to 50%.

لیست مقالات

لیست مقالات بایگانی شده

HEALTH: Hyperbolic Embedding and Acoustic-based Learning for Topological Hierarchies in Parkinson’s Disease

Saghar Shafaati - S. Hossein Erfani

بکارگیری هوش مصنوعی در فرآیندهای استخدام: ملاحظات اخلاقی

میررضا سیدقمی - بیتا دلنواز

بررسی تاثیر مسئولیت اجتماعی شرکت بر تصویر برند و تبلیغات دهان به دهان مصرف کننده با میانجی گری اعتماد به برند (مطالعه موردی: مصرف کنندگان برند اپل در تهران)

رویا آل عمران - کیمیا صالحی

تحلیل تنش روتور توربین گازی به کمک آنالیز حساسیت

پروانه امجدیان

بررسی تاثیر مدیریت سرمایه فکری بر عملکرد مالی سازمان منطقه آزاد تجاری - صنعتی ارس

سید حسین قاسمی - جواد حسینی - محمد حسن حدادی

بررسی تأثیر اطلاعات محیطی شرکت و ریسک عدم بازپرداخت بدهی‌ها بر ریسک سقوط قیمت سهام با توجه به نقش تعدیلگر بحران کم‌آبی

زهره حاجیها - شهرام کامکار

کاربردهای هوش مصنوعی و یادگیری عمیق در تشخیص و پیش‌بینی بیماری‌ها

علی فرزین

Physics-Informed Neural Networks for Cardiac Flow Estimation in 2D Simplified Human Right Ventricular Geometry

Mohammadmahdi Sekhavatpisheh - Nasser Fatouraee

Comparative Analysis of Time-Frequency Representations for Pediatric Respiratory Sound Classification Using Deep Learning

Ghazaleh Shiri - Hanieh Bahrami - Alireza Fallahi

Modeling Customer Behavior in Online Stores Based on the RFM Model and Random Forest and SVM Algorithms

Somayeh Ebrahimi Emamchai - Nayere Zaghari

بیشتر

19 اردیبهشت 1405

راهنمای انتخاب کنفرانس معتبر برای چاپ مقاله علمی

19 اردیبهشت 1405

چرا شرکت در کنفرانس‌های علمی برای مصاحبه دکتری اهمیت دارد؟

21 اردیبهشت 1405

پذیرش سریع مقاله در کنفرانس‌های علمی مهندسی و فناوری آغاز شد

21 اردیبهشت 1405

آغاز ثبت‌نام در همایش‌های بین‌المللی مدیریت و حسابداری

ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 44.5.0