وبلاگ
شکست هوش مصنوعی در برابر سوالات المپیاد جهانی ریاضی
💢 شکست هوش مصنوعی در برابر سوالات المپیاد جهانی ریاضی
▫️ طبق گزارش وبسایت تخصصی MathArena، سوالات المپیاد جهانی ریاضی ۲۰۲۵ که هفته پیش در استرالیا برگزار شد، در اختیار چند مدل برجسته هوش مصنوعی قرار گرفت.
▫️مدلهایی مانند Gemini 2.5 Pro، Grok-1.5, Claude 3 Opus, و GPT-4o مورد ارزیابی قرار گرفتند. هر مدل موظف بود به شش مسئله رسمی المپیاد پاسخ دهد و راهحلها طبق بارمبندی رسمی IMO نمرهگذاری شدند.
▫️هیچیک از مدلها نتوانستند به آستانه مدال برنز (۱۹ از ۴۲ نمره = حدود ۴۵٪) دست یابند.
▫️بهترین عملکرد متعلق به Gemini 2.5 Pro با تنها ۱۳ امتیاز (۳۱٪) بود.مدلهای دیگر، مانند Grok و Claude، امتیازهای بسیار پایینتری کسب کردند.
▫️ این نتایج نشان میدهد که با وجود پیشرفتهای چشمگیر هوش مصنوعی در زبان و محاسبه، همچنان تا تسلط بر مسائل استدلالی و انتزاعیِ عمیق مانند مسائل المپیاد فاصله زیادی وجود دارد.