Sesli ve metin pratik

Sesli ve metin pratik.

Saltana’nın pratik motoru hem canlı sesli görüşmeyi hem de metin tabanlı pratiği aynı persona, aynı senaryo ve aynı rubriğe göre işler. İki mod da birinci sınıf vatandaştır; metin modu, sesli modun ucuz alternatifi değildir.

Canlı02:17
Ayşe Demir · ZorOutbound
OpenAI RealtimeGemini LiveDeepgram
Giriş

Neden var?

Pratik aracının yaygın olarak kullanılması için iki şart vardır. Birincisi, pratiğin gerçek görüşmeye yeterince benzer olması. İkincisi, pratiğin temsilcinin günlük çalışma koşullarına uyum sağlayabilmesi. Sessiz odası olmayan, headset takmaya çekinilen bir açık ofiste, sadece sesli pratik öneren bir araç günde birkaç kullanım almakta zorlanır.

Saltana, sesli ve metin tabanlı pratiği iki ayrı sınıf değil, aynı motor üzerinde iki mod olarak konumlandırır. Sesli pratik için OpenAI Realtime, Google Gemini Live ve Deepgram Voice Agent destekli; tarayıcı doğrudan sağlayıcıyla konuşur, gecikme düşüktür. Metin pratiği aynı persona ve senaryo motoruyla çalışır; sessiz bir odada veya seyahat halinde tercih edilir. İki mod da şirket rubriğine göre puanlanır.

·Neden önemli

Tasarımı belirleyen üç prensip.

· 01

Üç ses sağlayıcı, tek arayüz

OpenAI Realtime (gpt-realtime-1.5), Gemini 2.5 Flash Native Audio ve Deepgram Nova-3 + gpt-5-mini desteklenir. Sağlayıcı seçimi şirket bazında yapılır, faturalama sağlayıcı maliyetinde şeffaftır.

· 02

Metin pratiği eşdeğer kalitededir

Metin modu, sesli modla aynı persona, senaryo ve rubrik üzerinde çalışır. Açık ofis, ortak alan ya da hareket halinde olan temsilciler için tam fonksiyonlu bir alternatiftir.

· 03

Tüm görüşmeler transkript edilir

Sesli görüşmeler yapay zeka tarafından kelimesi kelimesine yazıya dökülür ve değerlendirme aynı transkript üzerinden yapılır. Ses kaydının manuel olarak dinlenmesine gerek yoktur.

·Nasıl çalışır

Üç adımlı operasyonel akış.

Adım 01

Sağlayıcı seçilir

Manager, şirket ayarlarından kullanılacak ses motorunu seçer. Temsilci arayüzünde fark hissedilmez, sağlayıcı altta saydam çalışır.

Adım 02

Görüşme başlatılır

Persona, senaryo, zorluk seviyesi ve görüşme yönü (inbound veya outbound) seçilir. Saltana sunucu tarafında kısa ömürlü bir oturum anahtarı üretir; tarayıcı doğrudan sağlayıcıya bağlanır.

Adım 03

Pratik gerçekleşir

Sesli modda mikrofon açılır ve persona sesli olarak yanıt verir. Metin modunda klavye arayüzü açılır ve persona yazılı olarak yanıt verir. Her görüşme ortalama 3 ila 8 dakika sürer.

Platformda

Canlı görüşme ekranı böyle akıyor.

Sol sütunda persona, ortada mesaj akışı ve mikrofon, sağda canlı puan + empati haritası. Temsilci hala görüşmenin içinde.

app.saltana.com/gorusmeler/yeni
Görüşmeler · Canlı
Aktif görüşme
Son 30 gün
Persona
Ayşe Demir
42 · İK Müdürü · İstanbul
Senaryo
Tamamlayıcı sağlık itiraz
Zoroutbound
Ruh hali

Temkinli, rakibe bağlı, fiyat hassas, ikna edilebilir.

Canlı· 00:03:47
Ayşe
Biz zaten rakip firmayla çalışıyoruz. Niye değişelim ki? Yeni bir sisteme geçmek için sebep yok.
Sen
Anlıyorum. Çoğu müşterimiz aynı noktadan başladı. Bir şey sorabilir miyim, son 3 ayda hiç hasar yaşadınız mı?
Ayşe
Eh, bir kez küçük bir çizik oldu. Onunla uğraşmadık bile, küçüktü.
✦ Koç ipucu

Fiyattan önce riski azalt. Rakibe takılma, kendi farkını sor.

az önce · 00:03:41
Canlı puan
Empati84
Keşif72
Ürün68
İtiraz58
Kapanış-
Empati haritası
00:0003:47
·Güvenlik mimarisi

API anahtarları hiçbir zaman tarayıcıya gönderilmez.

Gerçek zamanlı sesli görüşmenin gecikme avantajı, tarayıcının doğrudan ses sağlayıcısına bağlanmasıyla elde edilir. Bu mimari, bir güvenlik gereksinimini de beraberinde getirir: gerçek API anahtarları tarayıcıya düşmemelidir.

Saltana, her görüşmenin başlangıcında sunucu tarafında kısa ömürlü bir oturum anahtarı (ephemeral token) üretir. Tarayıcı yalnızca bu kısa ömürlü anahtarla sağlayıcıya bağlanır. Görüşme sona erdiğinde anahtar geçersizleşir. Şirketin sağlayıcı kontratları, bu mekanizma sayesinde frontend kodunun hiçbir noktasında ifşa edilmez.

·Saltana Hakkında

Sesli ve metin pratik hakkında.

Hangi ses motorları destekleniyor?

Üç sağlayıcı tarafından desteklenen üç ses motoru: OpenAI Realtime (model gpt-realtime-1.5), Google Gemini Live (gemini-2.5-flash-native-audio) ve Deepgram Voice Agent (nova-3). Üçü de Türkçe konuşur. Şirket yöneticisi hangi motoru kullanacağını tek bir ayardan seçer.

Metin pratiği ne zaman tercih edilir?

Kulaklığı olmayan, sessiz bir odası bulunmayan ya da klavye kullanmayı tercih eden temsilciler metin pratiğini seçer. Metin modu aynı rubriğe göre puanlanır ve sesli moddan kalite olarak geri kalmaz. Otobüs, ofis, kahve dükkânı. Her yerde çalışır.

Sağlayıcı API anahtarları tarayıcıya düşüyor mu?

Hayır. Her görüşme öncesi sunucu tarafında kısa ömürlü oturum token'ı (ephemeral credential) üretilir; tarayıcı yalnızca bu token'la sağlayıcıya bağlanır. Gerçek API anahtarları hiçbir zaman client bundle'ına düşmez. Detay için Veri Güvenliği sayfasına bakın.

Görüşmeler kayıt altına alınıyor mu?

Varsayılan olarak ses kaydı saklanmaz; ses metne dönüştürülür ve transkript işlenir. Transkriptler şirket hesabında varsayılan olarak 12 ay saklanır ve kurumsal hesaplarda özelleştirilebilir. Sağlayıcılarla yapılan sözleşme bu içeriğin model eğitiminde kullanılmamasını garantiler.

Ekibinizi simülatöre alın

15 dakika demo.
Aynı hafta kurulum.

15 dakikalık keşif görüşmesi yeterli. Şirketinizin ekibi için bu modülün nasıl yapılandırılacağını birlikte planlayalım.