Kurumsal LLM mimarisi: RAG, guardrail ve maliyet kontrolü
BYM Teknoloji — AI Platform Lead ekibi
Kurumsal LLM projelerinde demo ile üretim arasındaki uçurum, model kalitesinden değil platform eksikliğinden kaynaklanır. Üretimde LLM işleten müşterilerimizden damıttığımız üç mimari ders paylaşıyoruz.
LLM gateway: tek kapı, tam görünürlük
Ekiplerin model API'lerine doğrudan erişmesine izin verirseniz; maliyet, güvenlik ve uyum görünürlüğünü daha ilk ay kaybedersiniz. Tüm model trafiğini tek bir gateway'den geçirin: istek loglama, PII maskeleme, model yönlendirme, kota ve maliyet ataması bu katmanda yaşar.
Bu katman aynı zamanda model bağımsızlığı sağlar: sağlayıcı veya model değiştirmek, uygulama ekipleri için bir konfigürasyon değişikliğine iner.
RAG'de kalite, embedding'den önce veri hattındadır
Kötü cevapların kök nedeni çoğunlukla model değil, içerik hattıdır: güncelliğini yitirmiş dokümanlar, yanlış parçalama (chunking), erişim yetkisi gözetmeyen indeksleme. Doküman yaşam döngüsünü (kim güncelledi, hangi sürüm geçerli, kim erişebilir) çözmeden vektör veritabanı seçimi tartışmak, temelsiz binaya çatı seçmektir.
Erişim kontrolünü indeksleme katmanına gömün: kullanıcının görmeye yetkili olmadığı doküman, daha retrieval aşamasında elenmiş olmalıdır.
Maliyeti mimariyle yönetin
Token maliyetleri lineer büyümez; kontrolsüz bağlam şişmesi ile patlar. Önbellekleme (aynı sorulara aynı cevap), model katmanlaması (basit görevlere küçük model), bağlam bütçeleri ve agresif RAG filtrelemesi; kalite kaybı olmadan maliyeti tipik olarak %60-80 düşürür.
Yazar hakkında
Bu yazı, BYM Teknoloji AI Platform Lead ekibi tarafından, kurumsal üretim ortamlarındaki birebir saha deneyimlerinden damıtılarak hazırlanmıştır.
Diğer yazılar
BDDK uyumlu bulut mimarisi: Finans kurumları için pratik bir çerçeve
Bulut bilişim tebliği sonrası finans kurumları için veri sınıflandırmasından denetim izine, uygulanabilir bir hybrid cloud mimari çerçevesi.
BYM Teknoloji — Cloud Practice Lead
Platform engineering'e nereden başlamalı: İlk 90 günün yol haritası
Internal developer platform kurmak isteyen ekipler için araç seçiminden önce cevaplanması gereken sorular ve ilk 90 günde üretilmesi gereken değer.
BYM Teknoloji — Head of Platform Engineering
SLO tasarımında en sık yapılan 5 hata
SLO'ları panoda duran sayılar olmaktan çıkarıp karar mekanizmasına dönüştürmek isteyen ekipler için saha deneyimlerinden damıtılmış uyarılar.
BYM Teknoloji — Principal SRE