23. TRAI Meet-Up’da “Ses Tanıma ve Yapay Zekâ” Konuşuldu

Türkiye Yapay Zekâ İnisiyatifi’nin düzenlediği 23. TRAI Meet-up’ı İTÜ Arı3’te gerçekleştirildi. 23. TRAI Meet-Up’ının konusu “Ses Tanıma ve Yapay Zeka”ydı.

İlk konuşmacımız olarak SesTek’ten Ceren Demirkol sahneye çıktı. İlk olarak ses teknolojisinin kullanım alanlarından bahsetti. Doğal diyalog aşamalarını anlattı. Bu aşamalarda öncelikle kapsamın belirlenmesini, daha sonra analizlerin yapılmasını ve son olarak tasarımın gerçekleştirilmesi gerektiğini ve tüm bu aşamalardan sonra ise diyalog yönetimi aşamasının geldiğini söyledi. Daha sonra ise yapay sinir ağları teknolojisi kullanılıyor. Tahminleme yapılırken ilk olarak Feed Forward Neural Network, sonrasında  Convolutionla Neural Network ve son olarak Recurrent Neural Network teknolojileri kullanılıyor. Girdinin ses olduğu durumlarda ise iki aşama kullanılıyor. Birincisi akustik ses tanıma modeli, ikincisi ise dil modeli. Teker teker sesi tanımaktansa gramer tabanlı yapılıyor ve son olarak da yanıtlama sürecine geçiliyor.

GarantiBBVA’dan Esra Erkuş diğer konuşmacımızdı. UGİ’yi dinleyicilere tanıtarak konuşmasına başladı. UGİ bir sesli asistan ve küçük bir robot olarak ortaya çıktı. İlk olarak isminin Mia olduğunu söyledi ve değişim sürecinden detaylıca bahsetti. 200’e yakın fonksiyonu olan UGİ’yi 3 milyon müşteri kullandı ve 350 bin düzenli aylık kullanıcısı var. Toplamda ise 350 milyon etkileşim aldı. UGİ’yi çağrı merkezlerinin ham verisini kullanarak geliştirdiler. Erkuş sesli asistanlarının nasıl çalıştığını, yapabileceği işleri ve özelliklerini dinleyicilere anlattı. Müşterilerin UGİ’yi yönlendirici bir asistan olarak kullandıklarını söyledi. Microsoft’tan Cavit Yantaç diğer konuşmacımız olarak sahnede yerini aldı. Bilindiği üzere insanı diğer tüm canlılardan ayıran özelliğinin konuşabilmesi olduğunu ve yapay zekanın en zorlandığı kısımlardan birinin de bu alan olduğunu belirtti. Öyle ki Amazon, Google ve Microsoft gibi devlerin bu alana milyarlarca dolar harcamakta olduğunu söyledi.

Sesin çıkmasının ve beyin tarafından algılama süreçlerini detaylı bir şekilde anlattı. Bilgisayarın dili anlaması da insanınkine çok benzere şekilde. Her bir harf, kelime ve cümle bilgisayarda dalgalar olarak algılanıyor ve mantıklı bir anlam çıkarılıyor. Yantaç, çok farklı dillerde ve aksanlardaki konuşmaları anlamanın ve anlamlı hale getirilip sunulabilmesinin çok ciddi bir çalışma gerektirdiğini ve Microsoft’un ses tanıma sisteminde de aynı ciddiyetle çalışıldığını söyledi. Bu konu itibariyle ses tanımadaki derin öğrenme teknikleri ve gelişmeleri de bir hayli önemli. Microsoft’ta bu konuda çalışmalar yapmakta ve çeşitli projeler üretmekte. Bunlarda biriside ses tanımalı modern toplantı ortamı. 

Toplantı ortamındaki sesler gerçek zamanlı olarak yazıya dönüştürülüp daha sonrasında ise bir iç görü/özet çıkarılıyor. Konuşan her birey ayrı ayrı tanınıyor ve birbiri üstüne binen sesler de dahil olmak üzere tüm konuşmalar yazıya dönüştürülüp aynı zamanda gerçek zamanlı olarak bir başka dile çevrilebiliyor.

Le Chatbot’tan Umut Karlıklı son konuşmacımız olarak sahneye çıktı. Sesli asistanlarla konuşurken normal bir insanla konuştuğumuz gibi konuşmadığımızı, daha farklı bir jargonla konuştuğumuzu söyledi. Sesli asistanın bizi anlamayacağı sanılıp dil bilgisi ve nezaket kurallarına daha uygun konuşulduğu tespitini bizlerle paylaştı. Her geçen gün büyük gelişmelerin olduğu ses tanıma teknolojisi sayesinde doğal bir şekilde konuşulduğunda da çoğu sesli asistan bunu çok rahat bir şekilde anlayacak durumda. İnsanların sesli asistanlarla doğal etkileşim kurmakta zorlandıklarını, çabuk sıkıldıklarını, sanal asistanlardan çabuk vazgeçme eğiliminde olduklarını ve bunun sebeplerini ayrıntılarıyla anlattı. İnsanların sohbeti sürdürmek için onarım, düzeltme, açıklığa kavuşturma gibi stratejilere başvurduklarını ve bu stratejilere cevap vermeyen sanal asistanlarla sohbetin sekteye uğrayacağını söyledi. Önerileri olarak da bağlamın iyi belirlenmesini, karakter özelliklerinin ve yeteneklerinin iyi anlatılmasını, sohbet akışının kontrol edilmesini ve hata/çözüm senaryoların oluşturulması gerektiğini söyledi.

Gelecek etkinlik: TRAI Meet-up #24 “Bankacılık ve Yapay Zekâ”

 

Paylaş
TRAI

Son Gönderiler

OpenAI, Yeni Nesil Yapay Zeka Modeli GPT-4.5’i Tanıttı

OpenAI, uzun süredir merakla beklenen yeni yapay zeka modeli GPT-4.5’i resmen duyurdu. GPT-4.5, OpenAI’nin bugüne… Devamı

2 gün Önce

World AI Cannes Festival 2025: Türkiye Yapay Zeka İnisiyatifi’nden İzlenimler

Geçtiğimiz hafta, Türkiye Yapay Zeka İnisiyatifi (TRAI) olarak katıldığımız World AI Cannes Festival (WAICF), Avrupa’nın yapay zeka ekosisteminde… Devamı

1 hafta Önce

90. TRAI Meet-Up’ta “Fintech & Insurtech Dünyasında Yapay Zeka Uygulamaları” Konuşuldu

TRAI Meetup 90: Fintech & Insurtech Dünyasında Yapay Zeka Uygulamaları" etkinliği, finans ve sigorta sektörlerinde… Devamı

2 hafta Önce

TRAI Yapay Zeka Hukuk ve Yargı Çalışma Grubu Webinarı Gerçekleşti

'TRAI ‘Yapay Zeka, hukuk ve Yargı Çalışma grubu’ tarafından 12 Şubat 2025 tarihinde, moderatörlüğünü grup… Devamı

2 hafta Önce

‘Agentic AI’ın devreye girmesiyle iş dünyasında yeni bir dönüşüm dalgası yaşanacak”

2024 yılı, Türkiye ve dünya genelinde yapay zekanın dönüştürücü gücünü en net şekilde gösterdiği bir… Devamı

2 hafta Önce

Yapay Zeka Yarışında Yeni Oyuncu: Qwen 2.5 Max

Çinli teknoloji şirketi Alibaba, yapay zeka alanındaki rekabete yeni bir boyut kazandırarak, en son sürümü… Devamı

1 ay Önce