Herior-Watt Üniversitesi’nde Soundscaping ve farklı dillerde konuşmanın anlaşılabilirliği üzerine akademik çalışmalar yürüten Ses Mühendisi Kıvanç Kitapçı’nın kendi bloğunda yayınladığı 24 Şubat 2014′te gündeme gelen Tayyip Erdoğan ve Bilal Erdoğan arasında geçen telefon görüşmesinin analizini yayınlıyoruz:

24 Şubat 2014 gecesi internete sızdırılan Tayyip Erdoğan ve oğlu Bilal Erdoğan arasındaki telefon goruşmesi kaydının sahte olup olmadığı ile ilgili ortaya bir sürü fikir atıldı. Kimi yalandır mümkün değil dedi, kimi bunları yaptığını zaten biliyorduk kanıtlanmış oldu dedi. Peki böyle bir konuşma kaydının sahtesini oluşturmak mümkün mü, mümkünse nasıl mümkün? Sahte olup olmadığını nasıl anlarız?

Anlamadım BBCM!

Konuşma kayıtları 2 şekilde sahte olabilir. Birinci yöntem (yapılması daha kolay), Tayyip Erdoğan ve Bilal Erdoğan olmayan iki kişi sesleri taklit ederek bir oyun sahneye koyarlar ve bunu kaydederler. İkinci yöntem (inandırıcı olması en iyi teknoloji kullanılsa bile imkansıza yakın olan yöntem) Tayyip Erdoğan ve Bilal Erdoğan’ın daha önceki ses kayıtlarından alınan farklı kelimeler bir araya getirilir, normalize edilir, frekanslarıyla oynanır, modulasyona sokulur, (aklıma gelmeyen diğer teknik terimleri de siz ekleyebilirsiniz) ve sonuçta ortaya yamalı bir ses kaydı çıkar.

İkinci yöntemi test etmek için hiç uğraşmayacağım, çünkü bu hayal ürünü teknik, yani montaj, insan kulağı tarafından rahatlıkla anlaşılır. Ayrıca dün internette çokça dolaşan Ali Büyük’ün yaptığı spectrum analizi de bunu kanıtlar niteliktedir. Ali Büyük ses kaydının farklı bölümlerinden sample’lar alıp bunların frekans spectrum’larını kıyaslamış, ve kaydın bir bütün olduğunu (yani montaj olmadığını) kanıtlamaya çalışmıştı.

Peki ya bahsettiğim ilk yöntem? Yani sesler Tayyip Erdoğan’a ve Bilal Erdoğan’a mı ait? Bu bir tiyatro oyunu mu? Bunu anlayabilir miyiz?

Hem konuşma akustiği hem dil bilimi doktorasının sonuna gelmiş bir nerd olarak görev edindim. Ben bunu anlarım arkadaş. Sizin de daha rahat anlamanız için çok kısa olarak ön bilgi vereyim.

NASIL KONUŞUYORUZ?

Cutaway-view-of-the-vocal-t1

Cutaway-view-of-the-vocal-t1Insan sesi ilk olarak ses tellerinin vibrasyonuyla oluşur. Fakat bu vibrasyon anlamlı konuşmanın oluşması için yeterli değildir. Ses tellerinde oluşan ilk ses (F0 frekansı), sırasıyla gırtlak, ağız boşluğu, dil, diş, ve en son dudaklarda modülasyona uğrar. Bu işlem sonucunda anlamlı sesler çıkartmaya başlarız (genellikle!?). Haliyle konuşma sesinin iki temel komponenti vardır. F0 frekansı ve modülasyon sonucu eklenen frekanslar (yani harmonic’ler).

Bir insan başka bir insanın sesini taklit ederken sadece harmonic’lerle oynayabilir. F0 frekansını değiştirmek için ses tellerine tıbbi operasyon gerekir. F0 frekansı parmak izi gibidir, her insanda farklıdır. Dile, aksana, lehçeye, cinsiyete, ve hatta o onda içinde bulunulan duygusal duruma göre değişiklik gösterir. Ama işin acı yanı bunu kulağımızla anlamamız mümkün değildir. Yani aslında insan sesi sadece harmonic’ler değiştirilerek taklit edilebilir (yetenek gerekli evet), ve bir insanı kandırabilir. Ama sadece bir insanı kandırabilir. Elimin altında bir akustik laboratuarı var. Beni kandıramaz.

O ZAMAN NE YAPIYORUZ?

Öncelikle uyumuyoruz. Nedenine gelince. Elimizde sahte olup olmadığını anlamaya calıştığımız ses kaydı var. Bunu kıyaslamak için sahte olmadığına emin olduğumuz ses kayıtlarına ihtiyacımız var. Youtube sağolsun, istemediğimiz kadar (gerçekten) Tayyip Erdoğan konuşmasına ulaşabiliyoruz. İzleyeceğimiz yöntem şu. Tayyip – Bilal Erdoğan telefon görüşmesinden net olarak anlayabildiğimiz 20 adet kelimeyi alıyoruz. Bu acısız kısım. Korkunç olan kısım ise bu kelimelerin geçtiği ve sahte olmadığına emin olduğumuz Tayyip Erdoğan konuşmalarını bulmak.

BİR GECE YOUTUBE, 5 SAAT TAYYİP!

Bir ömür yetecek Tayyip Erdoğan konuşmasının üzerinden geçtikten sonra kelimeleri buldum ve ayrı ses dosyaları halinde ayırdım. Ve son aşama: F0 Contour analizi. Bu analizi yapmak için ünlü linguistic yazılımı Praat’i kullanacağız. Asağıda “Erdoğan” kelimesinin karşılaştırmasını veriyorum.

sample1

Tayyip Erdoğan – Bilal Erdoğan telefon görüşmesi kaydı (Erdoğan)

 

sample2

Kontrol için youtube’dan bulunan sample (Erdoğan)

Öncelikle sizin de gördüğünüz gibi, spectrum analizi farklılıklar gösteriyor. Bu iki kaydın birebir aynı olmadığının kanıtıdır. F0 Contour çizgisi mavi olan. Şekillerinin birebir aynı olması iki konuşmacının aynı aksanla konuştuklarını ve vurguları ayni noktalarda yaptıklarını açıklar. Daha da önemli olan bilgi F0 merkez frekansı. Orjinal kayıtta 205.3 Hz olan frekans Youtube’dan alınan kontrol kaydında 213 Hz. Birbirlerine fazlasıyla yakIn.

Sonuç: 

Peki bu bilgiler bize ne soylüyor. Bu bilgiler bize %5’lik bir hata payı bırakarak bu iki kayıttaki sesin aynı kişiye ait olduğunu söylüyor. İşlem uzun sürdüğünden ve kendimi daha fazla Tayyip konuşmasi dinleyebilecek gibi hissetmediğimden şimdilik 12 kelime üzerinde karşılaştırma yapabildim. Normal şartlar altında fazlasıyla yeterli olan bu sayıyı önümüzdeki günlerde ne olur ne olmaz diyerek arttırmayi planlıyorum.

(muhimhadiseler.org)

başbakanın ses kaydı