0% Complete
English
Toggle main menu visibility
صفحه اصلی
کنفرانسهای فعال
مدیریت منابع انسانی پایدار
حسابداری
بازاریابی و برندینگ در عصر هوش مصنوعی
هوش مصنوعی:نوآوری، کسبوکار و آموزش
ارشیو کنفرانسها
اولین کنفرانس ملی هوش مصنوعی
دومین کنفرانس ملی هوش مصنوعی
اولین کنگره ملی حسابداری، مالی و مالیاتی
32کنفرانس بین المللی زیست پزشکی
راهنمای شرکت
نحوه ثبتنام
ثبت نام مدیریت منابع انسانی پایدار
ثبت نام دومین کنگره ملی حسابداری
ثبت نام سومین کنفرانس ملی هوش مصنوعی
ثیت نام بازاریابی و برندینگ در عصر هوش مصنوعی
ثبت نام زنجیره ارزش نفت گاز و پتروشیمی
ارسال مقاله
فرمت مقالات مدیریت منابع انسانی پایدار
فرمت مقالات سیستم های هوشمند حسابداری
فرمت مقالات ملی بازاریابی و برندینگ در عصر هوش مصنوعی
فرمت مقالات سومین کنفرانس هوش مصنوعی
سوالات متداول
اخبار و رویدادها
درباره ما
تماس با ما
صفحه اصلی
/
سی و دومین کنفرانس ملی و دهمین کنفرانس بین المللی مهندسی زیست پزشکی ایران
Short-term gains vs. long-term Success: Reward strategy design for reinforcement learning in football
نویسندگان :
Mohammad Pashaei
1
Amirhossein Tayebi
2
Hadi Amiri
3
Ali Fahim
4
1- Department of Engineering Science, University of Tehran, Tehran, Iran
2- Department of Engineering Science, University of Tehran, Tehran, Iran
3- Department of Engineering Science, University of Tehran, Tehran, Iran
4- Department of Engineering Science, University of Tehran, Tehran, Iran
کلمات کلیدی :
Reinforcement Learning،Multi-agent systems،Soccer Simulation
چکیده :
Reinforcement learning in complex games like soccer relies heavily on how you define your reward function and environment. In this work, we developed a custom 3v3 soccer environment and implemented two RL-based teams with distinct learning trends: one with a fast convergence but limited long-term adaptation, and another with a slower yet more robust learning trajectory. Simulation shows that despite performing better at the start, the short-term agents fall short of the performance of the long-term agents in the long run, and after passing 50% of the episodes, the win rate of long-term agents rises from 30% in the beginning to 50%.
لیست مقالات
لیست مقالات بایگانی شده
Designing a Machine Learning Model with LSTM and CNNs to Make the Quality Control Process of Liquefied Gas Tankers Intelligent
Raha Pakzad
تاثیر داراییهای نامشهود بر ارزش بازار شرکت؛ مطالعه موردی شرکت های صنایع شیمیایی بورس اوراق بهادار تهران
محمدرضا پژوهی
خطرات احتمالی در طراحی و تجزیه و تحلیل سیستمهای حسابداری و راهکارهای مقابله با آن
علی نمازیان - آرزو رضایی حومدینی
آمایش گردشگری مناطق ایران و هوش مصنوعی
محمدعلی فیض پور - مهدیه پیروی
بررسی نقش رهبران سازمانها و کاربرد هوش مصنوعی در کسب و کارها
حسین علی آبادی
بررسی ارتباط بین توانایی مدیریت و محدودیت مالی با تاکید بر نقش دانش مالی هیئت مدیره در شرکتهای دانش بنیان پذیرفته شده در بورس اوراق بهادار تهران
آروین نیک نام - قادر بابائی
بررسی رابطه بین کیفیت حسابرسی و ویژگی های کیفی سود و هزینه سرمایه در شرکت های پذیرفته شده در بورس اوراق بهادار تهران
مهدی شامی زاده - حیدر محمدزاده سالطه
Performance Evaluation of Supervised Machine Learning Algorithms for Customer Classification in E-Commerce
Somayeh Ebrahimi Emamchai
تحلیل تأثیر پیادهسازی الگوریتمهای هوش مصنوعی در بهینهسازی عملکرد زنجیره تأمین: رویکردی کاربردی در شرکت صنایع لبنی کاله"
حسین بوذری
تاثیر استقلال کمیته های حسابرسی بر محتوای اطلاعاتی اعلان سود با نقش کیفیت حاکمیت شرکتی در بورس اوراق بهادار تهران
بهزاد مظفری - هاتف ملازاده - رضا عشقی
بیشتر
19 اردیبهشت 1405
راهنمای انتخاب کنفرانس معتبر برای چاپ مقاله علمی
19 اردیبهشت 1405
چرا شرکت در کنفرانسهای علمی برای مصاحبه دکتری اهمیت دارد؟
21 اردیبهشت 1405
پذیرش سریع مقاله در کنفرانسهای علمی مهندسی و فناوری آغاز شد
21 اردیبهشت 1405
آغاز ثبتنام در همایشهای بینالمللی مدیریت و حسابداری
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 43.6.0