0% Complete
English
صفحه اصلی
/
دومین کنفرانس ملی عصر انفجار تکنولوژی؛ هوش مصنوعی، تحولی در صنعت، تجارت و زنجیره تامین و دومین کنفرانس ملی علم داده در کاربردهای مهندسی
A Multi-Stage Ranking Pipeline for High-Precision Medical Information Retrieval
نویسندگان :
Asa Shabanian
1
Alireza Asl Nemati
2
Morteza Mohammadi Zanjireh
3
1- دانشگاه بین الملل امام خمینی
2- دانشگاه بین الملل امام خمینی
3- دانشگاه بین الملل امام خمینی
کلمات کلیدی :
Information Retrieval،Hybrid Search،Re-ranking،Large Language Models (LLMs)
چکیده :
Effective retrieval of biomedical information presents a significant challenge due to terminological complexity and semantic ambiguity. Traditional keyword-based methods like BM25 often fail to capture the user's semantic intent. To address this, we propose and empirically evaluate a multi-stage ranking architecture designed for high-precision retrieval. Our pipeline initiates with two parallel retrieval stages: a sparse lexical retriever (BM25) and a dense semantic retriever using a Bi-Encoder model (multi-qa-MiniLM-L6-cos-v1). The resulting candidate lists are then fused using Reciprocal Rank Fusion (RRF) to leverage their complementary strengths. In the final stage, a more powerful Cross-Encoder model (ms-marco-MiniLM-L-6-v2) re-ranks the top 100 candidates from the fused list to achieve fine-grained relevance scoring. Evaluated on the standard TREC-COVID dataset, our complete pipeline demonstrates substantial performance gains at each stage, culminating in a final Precision@10 of 0.808 and an nDCG@10 of 0.754. This represents a significant relative improvement of 68% and 69%, respectively, over the BM25 baseline. These results validate the efficacy of a cascaded retrieve-fuse-rerank architecture. Our work underscores the synergistic value of combining sparse, dense, and cross-attention models, providing a robust framework for developing high-performance information retrieval systems in specialized domains.
لیست مقالات
لیست مقالات بایگانی شده
استراتژی رفتارگرایانه مدیریتی: چگونگی کنار آمدن با زمینه های آشفته و نامطمئن
رعنا شهدآور - صبا کبیرخو - سیما غفاری
بررسی ادبیات ارتباطات پایدار در بازاریابی
رعنا شهدآور - عسل اعتباری اصل امین
حسابداری سبز
لیلا کاتب - مبینا قدسی - ثنا کامکار
هیدروژل های طبیعی مبتنی بر زیستمواد برای بهبود زخم: طراحی، پیشرفتهای اخیر و دیدگاههای مهندسی بافت
محمد عرب چم چنگی - میلاد زارع - سولماز خلیق فرد
مروری در زمینه کاربرد شبکه عصبی در بهداشت، ایمنی و محیطزیست (HSE)
هاجرسادات علی زاده مقدم
Development of Folic Acid-Conjugated Iron Oxide Nanoparticles Loaded with Doxorubicin via Arc Discharge: A Novel Approach for Synergistic Photothermal-Chemotherapy of Cancer Using Bacterial Cellulose-Polyvinyl Alcohol Hydrogel
Saeid Orangi - Soodabeh Davaran
Mitigating MRI Domain Shift in Sex Classification: A Deep Learning Approach with ComBat Harmonization
Peyman Sharifian - Mohammad Saber Azimi - Masoud Noroozi - Alireza Karimian - Hossein Arabi
Enhancing Type 2 Diabetes Diagnosis with Evolutionary Algorithms and Machine Learning
Parisa Rezaei - Mohsen Saffar - Hamid Reza Naji - Mohammad Mehdi Faghih - Rasoul Nouriazar
بررسی تاثیر اندازه شرکت بر رابطه حاکمیت شرکتی خوب و عملکرد شرکت
یعقوب اقدم مزرعه - اشرف عارف نژاد
Examination and Analysis of the Influence of Near-Infrared Light Absorption by Hair Melanin on fNIRS Signal
Elmira Baghaeifar - Sina Shamekhi
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.4.1