OpenAI matematiği çözdü, mantık yürütmeyi öğrendi

Cade Metz / The New York Times

OpenAI’den ChatGPT ve Google’dan Gemini gibi çevrimiçi sohbet robotları bazen basit matematik problemlerinde zorlanıyor. Ürettikleri bilgisayar kodu genellikle hatalı ve eksik. Hatta zaman zaman uydurma yanıtlar verebiliyor.

ChatGPT artık ‘akıl yürütecek’

Ancak Perşembe günü OpenAI, ChatGPT’nin bu kusurları hafifletebilecek yeni bir sürümünü tanıttı. Şirket, OpenAI o1 adlı yeni yapay zeka teknolojisiyle desteklenen chatbot’un matematik, kodlama ve bilim içeren görevler aracılığıyla akıl yürütebileceğini söyledi.

OpenAI’nin baş bilim insanı Jakub Pachocki, “ChatGPT gibi önceki modellerde, onlara bir soru soruyorsunuz ve hemen yanıt vermeye başlıyorlar” dedi ve sözlerine şöyle devam etti:

“Bu modelin yanıt verme süresi ise zaman alabilir. Soruyu İngilizce olarak düşünebilir ve en iyi yanıtı vermek için sorunu parçalara ayırmaya ve farklı açılardan yanıt aramaya çalışabilir”

The New York Times için yapılan bir gösteride, Pachocki ve OpenAI teknik üyesi Szymon Sidor, sohbet robotunun sıradan bir bulmacadan çok daha karmaşık olan bir tür kelime bulmacası olan bir akrostişi çözdüğünü gösterdi. Sohbet robotu ayrıca doktora düzeyinde bir kimya sorusunu yanıtladı ve bir hastanın semptomları ve geçmişi hakkında ayrıntılı bir rapora dayanarak bir hastalığı teşhis etti.

Microsoft peşinde

Yeni teknoloji, karmaşık görevler üzerinde mantık yürütebilen yapay zeka oluşturmaya yönelik çabaların bir parçası. Google ve Meta gibi şirketler benzer teknolojiler geliştirirken, Microsoft ve yan kuruluşu GitHub, OpenAI’nin yeni sistemini kendi ürünlerine dahil etmek için çalışıyor.

Bilgisayar programcılarına fayda sağlayabilir

Amaç, insanların akıl yürütmesine benzer şekilde, her biri bir diğerinin üzerine inşa edilen bir dizi ayrı adımla bir sorunu dikkatli ve mantıklı bir şekilde çözebilen sistemler oluşturmak. Bu teknolojiler özellikle kod yazmak için yapay zeka sistemlerini kullanan bilgisayar programcıları için faydalı olabilir. Ayrıca matematik ve diğer dersler için otomatik eğitmenleri de geliştirebilirler.

OpenAI, yeni teknolojisinin fizikçilerin karmaşık matematiksel formüller üretmelerine ve sağlık araştırmacılarına deneylerinde yardımcı olabileceğini de söyledi.

ChatGPT’nin 2022’nin sonlarında piyasaya sürülmesiyle OpenAI, makinelerin istekleri daha çok insanlar gibi ele alabileceğini, soruları yanıtlayabileceğini, dönem ödevleri yazabileceğini ve hatta bilgisayar kodu üretebileceğini gösterdi. Ancak yanıtlar bazen kusurluydu.

ChatGPT becerilerini, Wikipedia makaleleri, kitaplar ve sohbet günlükleri de dahil olmak üzere internetten toplanan devasa miktarda metni analiz ederek öğrendi. Tüm bu metinlerdeki kalıpları saptayarak kendi başına metin üretmeyi öğrendi.

İnternet gerçek dışı bilgilerle dolu olduğu için, teknoloji aynı gerçek dışı bilgileri tekrarlamayı öğrendi. Bazen de bir şeyler uydurdu.

Pachocki, Sidor ve meslektaşları bu kusurları azaltmaya çalıştılar. OpenAI’nin yeni sistemini pekiştirmeli öğrenme adı verilen yöntemi kullanarak inşa ettiler. Haftalar ya da aylar sürebilen bu süreç sayesinde bir sistem, kapsamlı deneme yanılma yoluyla davranış öğrenebilir.

Tüm geliştirmelere rağmen kusursuz değil

Örneğin, çeşitli matematik problemleri üzerinde çalışarak, hangi yöntemlerin doğru cevaba götürdüğünü ve hangilerinin götürmediğini öğrenebilir. Bu süreci çok fazla sayıda problemle tekrarlarsa, kalıpları belirleyebilir. Ancak sistem mutlaka bir insan gibi mantık yürütemez. Yine de hata yapabilir ve halüsinasyon görebilir.

Yeni geliştirmelere rağmen “Mükemmel olmayacak” diyen Sidor. “Ancak daha çok çalışacağına ve doğru cevabı üretme olasılığının çok daha yüksek olduğuna güvenebilirsiniz” ifadelerini kullandı.

Ücretli aboneler erişebiliyor

Yeni teknolojiye erişim, şirketin ChatGPT Plus ve ChatGPT Teams hizmetlerine abone olan tüketiciler ve işletmeler için Perşembe günü başladı. Şirket ayrıca bu teknolojiyi kendi yapay zeka uygulamalarını geliştiren yazılım geliştiricilere ve işletmelere de satıyor.

OpenAI, yeni teknolojinin belirli standart testlerde önceki teknolojilerden daha iyi performans gösterdiğini söyledi. Uluslararası Matematik Olimpiyatı veya IMO – lise öğrencileri için önde gelen matematik yarışması – için eleme sınavında önceki teknolojisi yüzde 13 puan aldı. Şirket, OpenAI o1’in bu kez yüzde 83 puan aldığını söyledi.

Yine de standart testler, teknolojilerin gerçek dünya koşullarında nasıl performans göstereceği konusunda her zaman iyi bir değerlendirme olmayabilir ve sistem bir matematik testi sorusunda iyi olsa da matematik öğretmekte zorlanabilir.

Meta’da araştırmacı bilim insanı olan Angela Fan, “Problem çözme ile yardım arasında bir fark var” dedi ve ekledi: “Akıl yürüten yeni modeller sorunları çözebilir. Ancak bu, birine ev ödevinde yardımcı olmaktan çok farklıdır”