Microsoft Phi-4-reasoning açık ağırlıklı reasoning modeli, yapay zekada karmaşık akıl yürütme görevlerini optimize etmek için geliştirildi. 14 milyar parametreli bu model ailesi, matematik, bilim ve algoritmik karar senaryolarında büyük ölçekli modellere karşı düşük maliyet ve hızlı cevap avantajı sunuyor.
- Kurumsal ve rekabet matematik problemleri için SFT (structurally supervised fine-tuning) ile 1,4 milyon “sınır” durumlu ve çok aşamalı çıkarım promptlarıyla eğitildi.
- Yanıtların chain-of-thought olarak etiketli ve adım adım düzenlenmiş biçimde verilmesi sağlandı.
- 32K tokenlık geniş konteks desteği, uzun formlu ve çoklu diyaloglarda performans artışı sağladı.
- Pekiştirmeli öğrenme ile ince ayar yapılan Phi-4-reasoning-plus, zor matematik görevlerinde tutarlılık ve doğruluk kazandı.
Microsoft Phi-4-reasoning açık ağırlıklı reasoning modeli neden öne çıkıyor?
Pek çok büyük modele yakın doğruluk oranı sunarken, algoritma planlama, matematiksel kanıt üretme ve kodlama senaryolarında küçük ve hafif çalışabiliyor. Özellikle Phi-4-reasoning-plus, DeepSeek-R1 ve o3-mini gibi modellerle başa baş doğruluk ve çeşitlilik gösterdi.
| Model | Parametre | Öne Çıkan Özellik |
|---|---|---|
| Phi-4-reasoning | 14B | Yüksek doğruluklu çıkarım, SFT ile eğitim |
| Phi-4-reasoning-plus | 14B | Pekiştirmeli öğrenme, yüksek varyanslı görevlerde üst düzey tutarlılık |
| Phi-4-mini-reasoning | Küçük | Verimlilik odaklı, hızlı yanıt |
‘Phi-4 reasoning ailesiyle, küçük modelde kompleks akıl yürütme ilk kez bu kadar şeffaf ve ulaşılabilir oldu.’
Etiketler
Microsoft Phi-4-reasoning açık ağırlıklı reasoning modeli,14B LLM reasoning,Phi-4-reasoning-plus,chain-of-thought etiketleme,STEM AI çıkarım,küçük modelde yüksek akıl yürütme,açık kaynak LLM,matematik ve algoritma AI,open-weight benchmark,reinforcement learning reasoning modeli



Comments are closed