شکست هوش مصنوعی در برابر سوالات المپیاد جهانی ریاضی

💢 شکست هوش مصنوعی در برابر سوالات المپیاد جهانی ریاضی

▫️ طبق گزارش وب‌سایت تخصصی MathArena، سوالات المپیاد جهانی ریاضی ۲۰۲۵ که هفته پیش در استرالیا برگزار شد، در اختیار چند مدل برجسته هوش مصنوعی قرار گرفت.

▫️مدل‌هایی مانند Gemini 2.5 Pro، Grok-1.5, Claude 3 Opus, و GPT-4o مورد ارزیابی قرار گرفتند. هر مدل موظف بود به شش مسئله رسمی المپیاد پاسخ دهد و راه‌حل‌ها طبق بارم‌بندی رسمی IMO نمره‌گذاری شدند.

▫️هیچ‌یک از مدل‌ها نتوانستند به آستانه مدال برنز (۱۹ از ۴۲ نمره = حدود ۴۵٪) دست یابند.

▫️بهترین عملکرد متعلق به Gemini 2.5 Pro با تنها ۱۳ امتیاز (۳۱٪) بود.مدل‌های دیگر، مانند Grok و Claude، امتیازهای بسیار پایین‌تری کسب کردند.

▫️ این نتایج نشان می‌دهد که با وجود پیشرفت‌های چشمگیر هوش مصنوعی در زبان و محاسبه، همچنان تا تسلط بر مسائل استدلالی و انتزاعیِ عمیق مانند مسائل المپیاد فاصله‌ زیادی وجود دارد.

وبلاگ