OpenAI’ın “gizli” modeli matematik şampiyonu oldu

OpenAI, Yapay Zeka İle IMO’da Altın Madalya Seviyesinde Performans Sergiledi

Yapay zeka araştırmalarına hız kesmeden devam eden OpenAI, Uluslararası Matematik Olimpiyatları’nda (IMO) “altın madalya seviyesinde performans” sergileyerek dikkatleri üzerine çekti. Şirketin büyük dil modelleri (LLM) ve akıl yürütme üzerine çalışan araştırmacısı Alexander Wei, X platformunda yaptığı paylaşımda, deneysel bir araştırma modelinin yapay zeka alanındaki “uzun süredir beklenen büyük meydan okuma”yı başarıyla tamamladığını duyurdu.

Gizli Bir Modelin Başarısı

Wei’ye göre, henüz kamuoyuna açıklanmamış bir OpenAI modeli, IMO’da altı sorudan beşini çözerek toplamda 42 üzerinden 35 puan elde etti. IMO, ülkelerin altışar öğrenci gönderdiği ve oldukça zor cebir ile ön-kalkülüs (pre-calculus) problemlerinin çözüldüğü bir yarışma olarak biliniyor. Her ne kadar sorular yüzeyde basit görünse de tam puan alabilmek için yaratıcı ve derinlemesine çözüm yöntemleri gerekiyor. Bu yıl düzenlenen yarışmada 630 katılımcıdan sadece 67’si altın madalya almayı başardı; bu da yaklaşık yüzde 10’luk bir başarı oranına denk geliyor.

İnsan Benzeri Akıl Yürütme İle Çözüm

Yapay zeka sistemleri genellikle büyük veri kümelerini analiz etme veya tekrarlayan görevleri yerine getirme gibi alanlarda etkili olsa da, yaratıcı düşünme veya karmaşık karar alma gerektiren problemleri çözmede yetersiz kalabiliyor. Ancak OpenAI, geliştirdikleri modelin, karmaşık matematik problemlerini insan benzeri bir akıl yürütmeyle çözebildiğini vurguluyor.

OpenAI CEO’su Sam Altman, “Bu başarı sayesinde, insan matematikçilerin seviyesinde detaylı ve sağlam mantık zincirleri kurabilen bir model elde ettik,” dedi.

Öte yandan şirket modelin yakın zamanda kamuya sunulmayacağını bildirdi. Bu, merakla beklenen GPT-5’in önceki sürüme kıyasla daha gelişmiş olacağına işaret etse de IMO seviyesinde matematik çözme yeteneğine henüz sahip olmayacağı anlamına geliyor.

Related Posts

Gemini Drops nedir? Google’dan aylık AI güncellemelerine özel sayfa

Google, yapay zekâ sohbet robotu Gemini için aylık güncellemeleri ve yeni özellikleri duyurduğu “Gemini Drops” serisini ve özel web sayfasını kullanıma sundu. Temmuz ayında gelen yenilikler arasında video üretimi, Wear OS desteği ve Zamanlanmış Eylemler öne çıkıyor.

Otomotivde yeni dönem: Sıfır araçlara, Türkiye kuralı uygulanacak

Çin Sanayi Bakanlığı, sıfır kilometre olarak gösterilen kullanılmış araç satışlarını önlemek amacıyla, araçların ilk tescilinden itibaren 6 ay içinde yeniden satışını yasaklamayı planlıyor. Buna göre Çin Türkiye’nin uyguladığı 6 ay 6 bin kilometre kuralına benzer uygulamaya geçecek.

Bilim dünyasına damga vuran deney! Casus arılar gerçek oldu

Çinli araştırmacılar tarafından arıların beyinlerine yerleştirilen küçük cihazlar sayesinde, arilar sibernetik organizmalar haline dönüştürüldü. arıların sırtına konumlandırılan ve küçük iğneler aracılığıyla doğrudan beyine bağlanılabilen bir …

Mistral’in yükselişi önlenemiyor

2023 yılında Paris’te kurulan Mistral AI, kısa sürede Fransa’nın en umut vadeden teknoloji girişimlerinden biri haline geldi. Şirket, sadece Fransa’da değil, tüm Avrupa’da bağımsız ve çevreci yapay zekâ vizyonuyla dikkat çekiyor. Mistral AI, OpenAI …

Cursor, GitHub Copilot’a rakip olma yoluna girdi

Yazılım geliştiricilere yönelik yapay zekâ destekli araçlarıyla dikkat çeken Cursor, kurumsal pazarda Microsoft’un GitHub Copilot ürününe doğrudan rakip olacak adımlar atıyor. ABD merkezli Cursor’un arkasındaki şirket olan Anysphere, kısa süre önce …

Heyecan verici keşif: Zamanda donmuş bir galaksi keşfedildi

İtalyan bilim insanları 7 milyar yıl boyunca değişmeden kalan bir galaksiyi gözlemledi.