OpenAI, Kodlama ve Akıl Yürütme İçin Yeni Açık Kaynaklı Modelleri Tanıttı

Düzenleyen: Veronika Radoslavskaya

OpenAI, kodlama, matematik ve bilimsel akıl yürütme alanlarında kullanılmak üzere tasarlanmış iki yeni açık kaynaklı dil modeli olan gpt-oss-120b ve gpt-oss-20b'yi piyasaya sürdü. Bu modeller, gelişmiş akıl yürütme görevleri için optimize edilmiştir ve yapay zeka alanında daha fazla şeffaflık sağlamayı amaçlamaktadır.

gpt-oss-20b, yaklaşık 16 GB RAM ile kişisel bilgisayarlarda çalışabilecek şekilde tasarlanmıştır. Daha büyük olan gpt-oss-120b modeli ise tek bir NVIDIA GPU üzerinde çalışabilmektedir. Her iki model de Apache 2.0 lisansı altında sunulmakta olup, geliştiricilerin bu modelleri ticari amaçlar da dahil olmak üzere serbestçe kullanmasına, değiştirmesine ve dağıtmasına olanak tanır.

OpenAI'ye göre, gpt-oss-120b modeli, bazı gelişmiş kıyaslamalarda tescilli o3-mini ve o4-mini modelleriyle karşılaştırılabilir bir performans sergilemektedir. Bu kıyaslamalar arasında GPQA (lisansüstü bilim için), Codeforces (rekabetçi programlama için) ve AIME (matematik olimpiyat düzeyindeki sorular için) bulunmaktadır.

Bu modellerin yetenekleri arasında karmaşık matematiksel problemleri çözme, kodlama görevlerini yerine getirme ve bilimsel soruları yanıtlama bulunmaktadır. Ayrıca, her iki model de 'chain-of-thought reasoning' (düşünce zinciri akıl yürütme) tekniğini desteklemektedir; bu teknik, yapay zekanın nihai bir cevaba ulaşmadan önce düşünce sürecini adım adım ayrıştırmasına olanak tanır.

OpenAI, modellerin daha yüksek halüsinasyon oranları gösterdiğini belirtmektedir. PersonQA kıyaslamasında, 20B modeli için halüsinasyon oranı yaklaşık %53 iken, 120B modeli için %49'dur.

gpt-oss-120b ve gpt-oss-20b, Amazon Bedrock ve Amazon SageMaker AI aracılığıyla Amazon Web Services (AWS) üzerinde de kullanıma sunulmuştur.

NVIDIA ile işbirliği içinde, OpenAI'nin yeni açık kaynaklı gpt-oss modelleri NVIDIA GPU'lar için optimize edilmiştir. NVIDIA GeForce RTX 5090 GPU'da saniyede 256'ya kadar token performansı beklenmektedir.

Modellerin 128K'ya kadar bağlam uzunluklarını desteklemesi, müşteri hizmetleri transkriptleri ve teknik dokümantasyon gibi uzun belge ve konuşmaları işleyebilmelerini sağlamaktadır.

OpenAI, gpt-oss-120b ve gpt-oss-20b'nin piyasaya sürülmesinin, açık kaynaklı yapay zeka alanında önemli bir adım olduğunu ve geliştiricilere daha geniş bir araç yelpazesi sunarak inovasyonu teşvik edeceğini belirtmektedir.

Kaynaklar

  • mint

  • Amazon Will Offer OpenAI Models to Customers for First Time

  • OpenAI releases open-weight reasoning models optimized for running on laptops

  • OpenAI's first new open-weight LLMs in six years are here

Bir hata veya yanlışlık buldunuz mu?

Yorumlarınızı en kısa sürede değerlendireceğiz.

OpenAI, Kodlama ve Akıl Yürütme İçin Yeni ... | Gaya One