Ses üniktir, kayıtlar gerçek!

Ebru Çapa / Hürriyet

Müzisyen ve ses teknisyeni Atilla Özdemiroğlu, “İnsan sesi üniktir (tek, eşi olmayan). Bankaların güvenlik sistemlerinde bile kullanılan, insanın kendi sesidir. O kadar üniktir ki bilgisayarlara kendi sesinizden komut verebilirsiniz. Bu, ses tanımlamanın algoritmalarıyla ilgili teknik, derin bir meseledir. Ses bir kimliktir. Dünyadaki yedi milyar insanın her birinin sesi, birbirinden ayrıştırılabilir durumda” diyor.

Üzerinde bilirkişi ihalesi kaldı. Müzisyen ve ses teknisyeni Atilla Özdemiroğlu’na göre son kayıtlarda, ne dublaj, ne montaj ne de bilgisayar marifetiyle türetilmiş herhangi bir kelime var.

Müzisyen ve ses teknisyeni Attila Özdemiroğlu, Başbakan Recep Tayyip Erdoğan ile oğlu Bilal Erdoğan’ın arasında geçtiği iddia edilen son kayıtlarda, ne dublaj, ne montaj ne de bilgisayar marifetiyle türetilmiş herhangi bir kelime bulunduğunu söylüyor.

Attila Özdemiroğlu, müzisyenliğinin yanında, alaylı bir ses teknisyeni. Babasının Ankara Yüksek Teknik Öğretmen Okulu’nda elektrik ve elektronik öğretmeni olmasından dolayı, 1950’li yıllarda, osiloskoplu laboratuvarı bulunan bir evde büyüyüp, yaz tatillerinde dayısının elektronik tamircisinde çalışıp, askeri telsiz, transistörlü radyo, ilerleyen yıllarda da televizyon tamir ederek serpilmiş, bacak kadarken bile elinden Popular Electronics dergisini düşürmemiş bir çocuk. Bugüne dek kullandığı amplikatörleri hep kendisi yapmış, stüdyo kurmuş, ülkenin tonmaister ve ses teknisyeni yetiştiren ilk kursunu açmış; ömrünü müzisyenliğin yanında, ses teknolojisine, elektroniğe de adamış bir isim. Ankara Atatürk Lisesi’nde gördüğü fen eğitiminin ardından üniversitede hukuk okusa da bilimin peşini hiç bırakmamış.

“DALGA SESİNDEN İNSAN SESİ YAPILAMAZ”

Özdemiroğlu, son haftalarda sanal ortama sızdırılan telefon kayıtlarının Alo Fatih namlı ilk örnekleri dökülmeye başladığında, Bülent Arınç’ın bir yorumu üzerine, mevzu mesleğini birebir alakadar ettiği için, tabiri caizse bir “Yok artık!” tweet’i attı:

“Bir sabah Twitter’da bir habere rastladım; konu mesleğimle ilgiliydi. Bülent Arınç, Alo Fatih kayıtlarıyla ilgili ‘Bunlar montaj; artık deniz sesinden insan sesi bile yapılabiliyor’ diyordu. Benim de komiğime gitti tabii. Tek bir tweet’le cevap verdim; niyetim de öyle uzatmak değildi. Sayın Bülent Arınç yanlış biliyor. White noise dediğimiz elektronik gürültüden filtre, belirli devrelerden, envelope generator dediğimiz devrelerden dalga sesi yapmak mümkündür ama dalga sesinden insan sesi yapılamaz. Hele deniz sesinden hiç yapılamaz. Ben bunu böyle yazınca ve karşılığında saldırılar gelince ben de ister istemez teknik bilgimi dökmeye başladım.”

Akabinde olayların gelişmesi ve peş peşe yeni kayıtların sızdırılmasıyla da üzerinde bilirkişi ihalesi kaldı desek, yalan olmaz.

“Bol küfür yiyorum, hakaret işitiyorum; ‘Biz seni adam sanmıştık’ diyorlar. Tehdit de geliyor, ‘Aman kendine dikkat et Attila Abi’ diye iyiniyetli uyaran da çok çıkıyor ama ne yapayım yani. Onların haline üzülüyorum daha çok. Sorgulamaya hiç tahammülü olmayan bir biat... Ben bilim tarafından bakarım hayata; politik kimliğimi de o taraftan koyarım. Çocuklarımın geleceği adına, bunun sonuçları ne olursa olsun, doğru bildiğimi söylemekle yükümlüyüm ben.”

Başbakan Recep Tayyip Erdoğan ile oğlu Bilal Erdoğan arasında geçtiği iddia edilen diyalogların yer aldığı telefon kaydındaki seslerin dublaj olması mümkün mü?

Dublaj, kayıtlara dair en kolay iddia edilecek şeydir ama aksi de anında ispatlanabilir. İnsan sesi taklit edilebilir şeydir, bunu herkes biliyor. Taklit yapan, çok çok da benzeten insanlarımız var ama teknik bir analizle doğrusu anında ortaya çıkar. İnsan sesi üniktir (tek, eşi olmayan).

İnsan kimliğini tanımlayan belirli şeyler vardır. Fotoğraf en az geçerli şeylerden biridir; üzerinde oynanabilir. Biraz daha güçlüsü, parmak izidir ki o da silinebiliyor. En son bulunan gözdür, iristir. Fakat dünyada artık en geçerli olan, bankaların güvenlik sistemlerinde bile kullanılan, insanın kendi sesidir. O kadar üniktir ki bilgisayarlara kendi sesinizden komut verebilirsiniz. Bu, ses tanımlamanın algoritmalarıyla ilgili teknik, derin bir meseledir. Ses bir kimliktir. Dünyadaki yedi milyar insanın her birinin sesi, birbirinden ayrıştırılabilir durumda. Ve bu konuda başarı şansı da minimum yüzde 97. Minimum diyorum, dikkatinizi çekerim...

Konuşmaların, anlamı saptırma amacıyla montajlanmış olabilme ihtimali nedir?

Dört tane montaj noktası var. Böyle bir rapor gelirse, destekleyeceğim. (Kahkaha atıyor.) Beş ayrı konuşmanın bileşiminden oluşmuştur o kayıt, konuşmaların arasında dört tane de montaj noktası vardır. Bakın orası doğru. Bir tek de orası doğru.

Haricinde montaj olma ihtimali, teknikman en kolay tespit edilebilir şey. Montajı ispatlayabilecek birçok parametre var, en temellerini sayayım size: Söz konusu hele bir elektronik kayıtsa ki bir telefon kaydıdır bizim elimizdeki malzeme, önce kulakla baştan aşağı dinleyip bir ekdurumu var mı diye bakarız. Bunu belli edecek parametreler nelerdir, birincisi mikrofon ya da hat değişti mi, çünkü o durumda karakter de değişir.

İkincisi, bulunduğunuz oda değişti mi, yani akustik ortam değişti mi; çünkü konuşmanın atmosferi başka bir boyuta sıçrar...

Üçüncüsü, bulunduğunuz ortamdaki ambiant noise dediğimiz, çevre gürültüleri değişti mi; bakın mesela şimdi okul dağıldı, dışarıdan gelen çocuk seslerini duyuyoruz. Bunlara baktıktan sonra da hala şüphemiz varsa, wave form dediğimiz, dalga biçimini bilgisayarlarımızda açarız ve şüphelendiğimiz alanları detaylı olarak inceleriz; bir dalga bozulması, bir dalga farklılaşması, sıçraması var mı diye... Daha birçok açıdan da incelenebilir ama bu üçü bile yeterlidir.

“DUBLAJ YA DA MONTAJ OLMADIĞINDAN EN UFAK KUŞKUM YOK”

Bilgisayar marifetiyle yoktan kelimelerin üretilip konuşmaya eklendiği iddiası doğru olabilir mi? Yoktan bir kelime nasıl var edilir?

Edilemez. Yoktan bir kelime var e-di-le-mez. Var edilirse, robotik bir kelime olur. Ben isterseniz size yapmaya çalışayım, böyle bir teknoloji yok. İmkansız. Böyle bir teknoloji olmadığı gibi bana sorarsanız, daha uzun bir süre de olmayacak. Çünkü ses, konuşma dediğimiz, feci komplike bilgiler içeriyor. Çok çok derin bilgiler içerir. Ciğer yapınızdan başlar, ağız boşluğunuzun, dişlerinizin biçiminden, ses tellerinizden, burun boşluğunuzdan, küçükken bunu nasıl geliştirdiğinizden, bebekken nasıl ağladığınızdan, o yapının nasıl geliştiğine kadar birçok fizyolojik özellik bir yana, hangi ortamda büyüdünüz, kelimeleri nasıl vurguluyorsunuz, telaffuzunuz, aksanınız benzeri, türlü uzmanlık alanlarını da alakadar eden boyutları vardır.

Elektronik tarama ile forensic uzmanlarının bilgilerini birleştirdiğiniz zaman bunların ortaya çıkmamasının imkanı yok. Benim bu kayıtta dublaj ya da montaj olmadığından yana, en ufak bir kuşkum yok.

Nasıl bir inceleme neticesinde böylesine kesin bir kanaate varabildiniz?

Bu son iddia edilen kaydı, hepsine güvendiğim, kimi Avustralya’dan mezun, kimi Amerika’da doktorasının son günlerinde olan, şuradan buradan, işinde uzman arkadaşlara gönderdim. Sekiz kişilik bir ekip kendiliğinden oluştu; herkes işini gücünü bırakıp, bunula uğraştı, kendi incelemesini yaptı; hepsinden de aynı benimki gibi rapor aldım.

Ses mühendisliğinin, ses teknisyenliğinin ötesinde insanlar bunlar. Forensic, yani adli ses analizi, bambaşka bir iştir. Bu kişilerin üçü forensic uzmanı, adi incelemeye vakıf...

Diğerleri ses mühendisi diyebileceğimiz kategorideler. Aynı zamanda dil uzmanı da gerekli, sadece elektronik bilgisi de yetmez. Çünkü konuşmada sadece ses benzerliği değildir önemli olan, artikülasyon da fark yaratır. Bir arkadaşımız üç gün boyunca sabahlayarak, başka tarihlerden konuşmalarla kıyaslama suretiyle, 12 kelimeyi deşifre etti, 12’si birden tuttu. Bu işi, profesyonel olarak yaptırmaya kalksanız, 13 bin dolardır şirketlerde bedeli. Beş ayrı konuşmanın arasındaki dört montaj noktası haricinde, montaj olmadığı konusunda kimsenin en ufak bir şüphesi yok. Sözcük birleştirme, üretme konusunda da artık gülüyor herkes, ne yapsınlar yani...

En komik aşama, son derece ciddi olması gereken kurumlardan geldi ama. Biri montajı kanıtlayan inceleme TRT’nin laboratuvarlarında yapıldı beyanatı, biri de Bilim Sanayi ve Teknoloji Bakanı Fikri Işık’ın; ‘Ben montaj olduğunu hissediyorum, incelemeye lüzum yok’ açıklaması. TÜBİTAK’dan beş kişi görevden alındı değil mi; çünkü bilim adamları böyle bir rapor veremezler. Her türlü kariyerleri biter.

Kaleidoscope Sound’dan montaj iddiasını doğrulayan rapor verildiği haberlerinin ardından şirketin bunu yalanlaması iyi oldu. Oturmuş nasıl olabilir diye mail yazıyordum ki yalanlama geldi. İçeriden birileri para almıştır o sahte raporla ilgili, bu çok açık. Doğrusunu kim ifşa ettiyse teşekkür ederim, kendime vazife edinmiştim; bildiğim, güvendiğim bir stüdyo nasıl böyle bir şey yapar diye. Kaç tane stüdyo var dünyada biliyor musunuz; şurada hemen arkadaki sokakta da var bir tane; ben de hemen isterseniz antetli bir kağıda yazıp verebilirim; ben daha ciddi yazarım üstelik dil bildiğimden dolayı... Bir raporun ciddi olabilmesi için adli yetkili olması lazım; bu stüdyo adli yetkilidir; o yüzden hayret etmiştim.

Avatar
Adınız
Yorum Gönder
Kalan Karakter:
Yorumunuz onaylanmak üzere yöneticiye iletilmiştir.×
Dikkat! Suç teşkil edecek, yasadışı, tehditkar, rahatsız edici, hakaret ve küfür içeren, aşağılayıcı, küçük düşürücü, kaba, müstehcen, ahlaka aykırı, kişilik haklarına zarar verici ya da benzeri niteliklerde içeriklerden doğan her türlü mali, hukuki, cezai, idari sorumluluk içeriği gönderen Üye/Üyeler’e aittir.