Açık ağırlıklı modellere geçmenin maliyeti gerçekten düşük mü?
Bu ay GLM 5.2'nin çıkışıyla birlikte aylardır sezilen bir eşik resmen aşıldı: açık ağırlıklı (open-weight) bir model, birçok kodlama testinde kapalı frontier modellere yüzde birkaç farkla yaklaştı — üstelik maliyetinin küçük bir kesrine. Bunun ardından gelen tartışmanın başlığı da netti: "açık modellere geçmenin neredeyse hiçbir dezavantajı yok." Bu cümle kulağa hem doğru hem fazla rahat geliyor. Çünkü bir modelin testlerde iyi olması ayrı şey, onu üretime taşımanın size neye mal olacağı ayrı şey. Bu yazıda hangi modelin "kazandığını" değil, geçiş kararının gerçek maliyetini ve bu kararın nasıl verileceğini konuşacağız.
Açık ağırlıklı model ne demek, neyi değiştiriyor?
Önce terimi netleştirelim, çünkü "açık" kelimesi burada birkaç farklı şeye karışıyor. Bir modelin açık ağırlıklı olması, eğitilmiş parametrelerinin (ağırlıkların) indirilip kendi donanımınızda çalıştırılabilmesi demektir. Bu, klasik anlamda açık kaynak (open-source) ile aynı şey değil: eğitim verisi ve süreci çoğu zaman paylaşılmaz, paylaşılan şey "bitmiş beyindir". GLM 5.2 bunu bir adım öteye taşıyıp ağırlıkları MIT lisansıyla yayınladı — yani ticari kullanım önünde pratikte bir engel yok.
Değişen şey kalite değil, sahiplik. Kapalı bir modelde elinizde yalnızca bir API anahtarı vardır; modelin kendisi sağlayıcının sunucusunda durur. Açık ağırlıkta ise modeli indirip kendi sunucunuzda (self-host) çalıştırabilir, isterseniz kendi verinizle ince ayar (fine-tune) yapabilirsiniz. Bu fark, fiyat tablosunda görünmeyen ama mimari olarak en belirleyici fark; yazının ilerleyen kısmında buna döneceğiz.
Benchmark'lar ne söylüyor, ne söylemiyor?
Önce iyi haber, çünkü gerçek: GLM 5.2, sınırlı ve iyi tanımlı görevlerde frontier'ın hemen yanına oturdu. Bir frontend kodlama arenasında Opus 4.8'in önüne geçti; bağımsız bir "dominance" değerlendirmesinde aradaki fark yüzde birin altında kaldı — istatistiksel olarak beraberlik. Yani günlük işlerin çoğunda, tek bir fonksiyonu yazmaktan bir hatayı bulup düzeltmeye kadar, iki model arasındaki farkı çoğu ekip pratikte hissetmez.
Ama ortalama bir skor, hikâyenin tamamı değildir. Aynı karşılaştırmaların görev uzadıkça nasıl ayrıştığına bakmak gerekiyor. Kısa, kapalı uçlu görevlerde omuz omuza giden iki model, saatlerce süren, onlarca adımlık otonom (long-horizon agentic) işlerde belirgin biçimde ayrışıyor. "Benchmark'ta yakın" demek, "her işte yakın" demek değil:
GLM 5.2 Opus 4.8 fark
─────────────────────────────────────────────────
Code Arena (Elo) 1595 1561 GLM önde
FrontierSWE (dominance) 74.4 75.1 ~beraberlik
Terminal-Bench 2.1 81.0 85.0 4 puan
SWE-bench Pro 62.1 69.2 7 puan
SWE-Marathon (uzun ufuk) 13.0 26.0 2 kat
# kısa görevde parite, uzun otonom işte makas açık
Buradan çıkan sonuç "açık model zayıf" değil; tam tersine, fiyatına göre olağanüstü. Çıkan sonuç şu: bir modelin sizin için yeterli olup olmadığı, hangi tür işi yaptığınıza bağlı. İşiniz çoğunlukla sınırlı, insan gözetimindeki görevlerse aradaki fark teorik kalır. İşiniz saatlerce kendi başına koşan otonom akışlarsa, o yüzde birkaçlık fark her adımda birikip somut bir güvenilirlik farkına dönüşür.
"Geçmenin maliyeti düşük" tezi nerede doğru, nerede yanıltıcı?
Fiyat tarafında tez gerçekten güçlü. Açık ağırlıklı bir modelin token başına maliyeti, kapalı premium bir modelin çoğu zaman birkaçta birine denk geliyor; yoğun kullanan ekipler için bu, ay sonunda ciddi bir fark. Buraya kadar "düşük maliyet" savı ayakta. Sorun, faturanın yalnızca token kaleminden ibaret sanılması. Görünmeyen iki kalem var ve geçiş kararını asıl onlar belirliyor.
Self-host etmek bedava değildir
"Ağırlıkları indirip çalıştırırım" cümlesi pratikte bir altyapı projesidir. Yüz milyarlarca parametreli bir modeli makul gecikmeyle servis etmek ciddi GPU kapasitesi, ölçekleme, izleme ve nöbet tutan bir ekip ister. Düşük ve düzensiz trafikte kendi sunucunuzu sürekli açık tutmak, çağrı başına ödediğiniz bir API'den pahalıya bile gelebilir. Token fiyatındaki kazancı, çalıştırma maliyeti kısmen ya da tamamen geri alabilir.
Hosted API'yi kullanırsanız, "açıklığın" çoğu avantajı buharlaşır
Çoğu ekip, modeli kendi çalıştırmak yerine onu sunan sağlayıcının API'sini kullanır — anlaşılır bir tercih, çünkü kolay. Ama o an "açık ağırlık" pratikte yine bir kapalı API'ye dönüşür: isteğiniz başka birinin sunucusuna gider, verinizin nerede işlendiği ve hangi yargı alanının kurallarına tabi olduğu yeniden bir soru hâline gelir. Modelin lisansı açık olabilir; onu sizin için çalıştıran servis açık değildir. Hassas veriyle çalışıyorsanız, "açık model kullanıyoruz" cümlesi tek başına bir güvence değildir.
Yani "geçmenin maliyeti düşük" demek, ancak hangi geçişten bahsettiğinizi söylediğinizde anlam kazanıyor. Hosted bir açık modele geçmek kolay ve ucuzdur ama bağımlılığı ve veri sorusunu çözmez. Gerçekten self-host etmek bağımsızlık verir ama ucuz ya da kolay değildir. İkisini tek bir slogana sığdırmak, kararın en önemli kısmını atlamak olur.
Kapalı modelden asıl fark fiyat değil: kontrol
Açık ağırlıklı modellerin en çok konuşulan yanı maliyeti; oysa kalıcı değeri başka yerde. Bir API anahtarının size verdiği şey erişimdir, sahiplik değil — ve erişim, sizin elinizde olmayan nedenlerle geri alınabilir. Bunu yakın zamanda somut olarak gördük: bir modelin bir gecede erişime kapanması, üzerine ürün kuran ekipler için teorik bir risk değil, yaşanmış bir kesinti oldu.
İşte açık ağırlığın asıl kazandırdığı bu noktada beliriyor: indirip kendi sınırlarınız içinde çalıştırdığınız bir modeli kimse uzaktan kapatamaz, bir gecede emekliye ayıramaz, fiyatını üçe katlayamaz. Veriniz sizin altyapınızdan dışarı çıkmaz. Bu, bir önceki yazıda konuştuğumuz dayanıklılık mimarisinin eksik parçasıydı: en kötü günde devreye girecek, kimsenin sizden alamayacağı bir emniyet ağı. Açık modelleri yalnızca "ucuz alternatif" olarak görmek, onların en değerli özelliğini gözden kaçırmak olur.
Peki ne zaman geçmeli, ne zaman geçmemeli?
Bu kararı tek bir benchmark skoruyla vermek yerine birkaç ekseni birlikte tartmak gerekiyor. Sade bir çerçeve:
- Görevin doğasına bakın — sınırlı, insan gözetimindeki işlerde açık model çoğunlukla yeterli. Saatlerce kendi başına koşan, uzun-ufuklu otonom akışlarda frontier farkı hâlâ anlamlı.
- Veri hassasiyetini ölçün — veri sınırlarınız içinde kalmak zorundaysa, hosted API değil gerçek self-host gerekir. Açık lisans tek başına uyum (compliance) güvencesi vermez.
- Ops olgunluğunuza dürüst olun — büyük bir modeli üretimde servis edecek ekibiniz ve altyapınız yoksa, "self-host ederiz" bir niyet değil, bir maliyettir.
- Ölçekte hesabı yeniden yapın — token fiyatı ile çalıştırma maliyetini birlikte hesaplayın. Düşük hacimde API ucuz, yüksek ve sabit hacimde self-host başa baş noktasını geçebilir.
- Tek modele değil, portföye geçin — açık modeli bir soyutlama katmanının arkasına koyun; kapalı frontier'ı zor işlere, açık modeli rutine ve yedeğe ayırın. Karar tek seferlik değil, görev bazında olsun.
Peki tablonun neresindeyiz?
GLM 5.2 ile gelen eşik gerçek: açık ağırlıklı modeller artık "ucuz ama vasat" kategorisinden çıkıp birçok iş için ciddi bir seçenek hâline geldi. Bu yönü görmezden gelmek bugün bir hata olur. Ama "geçmenin maliyeti yok" cümlesi, kararın en zor kısmını — self-host'un gerçek yükünü, hosted API'nin geri getirdiği veri sorusunu ve uzun-ufuk işlerdeki kalite farkını — halının altına süpürüyor.
Daha sağlıklı bir okuma şu: açık ağırlıklı modeller artık bir tercih değil, mimarinizin doğal bir parçası. Onları kapalı modellere karşı bir cephe gibi değil, aynı portföyde tamamlayıcı bir bileşen gibi düşünün — kapalı frontier en zor işlere, açık model rutine, dayanıklılığa ve maliyet duyarlı hacme. Doğru soru "hangisine geçeyim" değil, "hangi işi hangisine vereyim ve yarın hâlâ kontrolümde kalsın" olmalı. Geçişi bir bayrak değiştirme töreni değil, görev bazında verilen ölçülü bir karar olarak ele alan ekipler, hem maliyetten kazanıyor hem de dayanıklılıktan.
Konunun temellerine daha yakından bakmak isterseniz Bilgi Merkezi · Yazılım & Mimari, API Tasarımı & Entegrasyon, Konteyner & Kubernetes (self-host inference) ve Gözlemlenebilirlik & Loglama rehberlerine; AI bağımlılığını yönetme tarafı için de tek modele bağımlılık ve yazılımın AI ajanlarına geçişi yazılarına göz atabilirsiniz.