Haberler Donanım ve Teknolojiler OpenAI, Yeni Nesil AI Asistanları Oluşturmak İçin Yeni Ses Modelini Tanıttı

OpenAI, Yeni Nesil AI Asistanları Oluşturmak İçin Yeni Ses Modelini Tanıttı

29 Ağustos 2025, 18:04

OpenAI, daha akıllı ve daha duyarlı sesli asistanlar oluşturmak için tasarlanmış yeni gpt-realtime modeliyle desteklenen Realtime API hizmetinin lansmanını duyurdu. Temel yenilik, uçtan uca ses işleme yeteneğidir. Geleneksel sistemlerin konuşmayı metne dönüştürdüğü, o metni analiz ettiği ve ardından robotik bir yanıt ürettiği yöntemlerin aksine, gpt-realtime doğrudan sesle çalışır. Bu yaklaşım, yanıt gecikmesini önemli ölçüde azaltır ve doğal konuşmanın tonlaması, duygusu ve ince nüanslarının çok daha doğru bir şekilde yeniden üretilmesine olanak tanır.

Yeni model, geliştirilmiş bağlamsal anlayış sergilemekte ve karmaşık talimatları kolaylıkla yerine getirebilmektedir. Bu modelle desteklenen bir asistan, sayıları kusursuz bir şekilde dikte edebilir, yasal uyarıları kelimesi kelimesine okuyabilir ve cümle ortasında diller arasında sorunsuz bir şekilde geçiş yapabilir. Ayrıca, gülme veya duraklama gibi sözsüz ipuçlarını tanımayı öğrenmiş ve konuşma tonunu buna göre uyarlamıştır.

Ses modeli aynı zamanda çok modaldır. Kullanıcılar ekran görüntüleri veya fotoğraflar gönderebilir ve asistan bunları analiz edip yorumlayabilir. Ayrıca, model SIP telefonisini desteklemekte ve bu sesli ajanların kurumsal PBX sistemlerine ve standart telefon ağlarına entegrasyonunu sağlamaktadır.

Realtime API ve gpt-realtime modeline erişim artık tüm geliştiricilere açıktır, ancak henüz genel kamu erişimine açılmayacak veya ChatGPT'ye entegre edilmeyecektir. Bu doğrudan konuşmadan konuşmaya teknoloji, mevcut sesli asistanların temel eksikliklerini — yavaş yanıt süreleri ve robotik sunum — ele alarak, bir AI ile telefon veya uygulama üzerinden konuşmanın başka bir kişiyle yapılan bir konuşmadan neredeyse ayırt edilemez hale geleceği bir döneme daha da yaklaşmamızı sağlamaktadır.

Bu lansman, OpenAI için bu ay biraz sarsıntılı bir başlangıçtan sonra gerçekleşti. Ağustos ayının başındaki beşinci nesil ChatGPT botunun piyasaya sürülmesi karışık yorumlarla karşılandı. Kullanıcı şikayetleri, şirketi hizmette hızlı ayarlamalar yapmaya ve hatta önceki modele geçici olarak erişimi geri getirmeye zorladı. Rekabet ortamı da ısınmakta; yakın zamanda, Çinli girişim DeepSeek, güncellenmiş DeepSeek-V3.1 modelini tanıttı, geliştiricileri bunun selefinden 2.5 kat daha hızlı olduğunu, 128K token bağlam penceresini desteklediğini ve tamamen ücretsiz kaldığını iddia ediyor.

GPT-5'in teknik aksaklıkları ve rakiplerden gelen ilerlemeler arasında, OpenAI muhtemelen amiral gemisi modelini geliştirmeye ve ekosistemini genişletmeye odaklanarak kullanıcı güvenini geri kazanmaya ve pazar konumunu sağlamlaştırmaya çalışmaktadır.

Gönderi çevrildi Orijinalini göster (EN)

Haberler Donanım ve Teknolojiler OpenAI

Yazar hakkında

Arkadiy Andrienko

Makalelerin ve haberlerin yazarı

VGTimes'ta teknik gazeteci olarak, en yeni grafik işlemcileri tartışmaktan ve klasik RPG'lerin inceliklerine dalmaktan aynı derecede keyif alıyorum. 2018 yılından beri oyunlar ve ekipmanlar hakkında yazıyorum, ses mühendisliği alanındaki deneyimim, ses teknolojilerinin inceliklerini iyi anlamamı sağladı ve her zaman oyun ekipmanları alanında yeni bir şeyler arayışındayım. Teknolojiler hakkında yazmadığım zaman, muhtemelen Fallout'ta post-apokaliptik çorak toprakları keşfediyorum, RimWorld'de bir koloni yönetiyorum veya Hearts of Iron IV'te ordulara komuta ediyorum. Benim için oyunlar sadece bir hobi değil - bu, yaratıcılığımı besleyen ve sürekli gelişen teknoloji dünyasıyla bağlantımı sürdüren bir tutku.

...Genişlet

Yorumlar0