MP3

MP3 Logosu

Asıl adı MPEG-1 ya da MPEG-2 Audio Layer III, halk arasında kısaca MP3 olarak bilinir. MP3, dijital ses için bir ses kodlama biçimi olup, kayıplı (lossy) veri sıkıştırma yöntemini kullanır. Tüketiciler için kullanılan ses akışı (audio streaming) için en yaygın olarak kullanılan biçim olmakla birlikte pek çok dijital ses oynatıcıları için en çok kullanılan dijital ses sıkıştırma yöntemidir.

Kayıplı sıkıştırma yönteminin genel olarak kullanılma amacı, bir ses kaydını oynatabilmek için gerekli olan en düşük miktarda veriyi kullanırken o ses kaydının sıkıştırılmamış orijinal haline en yakın ses kalitesini sunabilmektir. 128 kbit/s ayarını kullanan bir MP3 dosyası, saniyede 44.100 örnek x örnek başına 16 bit x 2 kanal = 1.421.200 bit/s kalitesindeki bir CD dosyasından 11 kat daha az dosya boyutuna sahiptir. Bir MP3 dosyası, daha yüksek ya da düşük bit oranları kullanılarak da oluşturabilir ve bu sayede ortaya çıkan MP3 dosyasının boyutu, ses kalitesine oranla daha yüksek ya da düşük olur.

MP3 dosyalarında kullanılan sıkıştırma tekniği, ses üzerinde bulunan ve pek çok kişinin işitmediği frekanslardaki bölümlerin doğruluğunun azaltılması ile oluşturulur. Bu yönteme genel olarak algısal kodlama adı verilir. Yöntem, psiko-akustik modelleri kullanarak insan kulağının işitmediği kısımları kaldırır ve ardından geriye kalan veriyi verimli bir şekilde kaydeder.

MP3, Moving Picture Experts Group (MPEG) (Türkçe: Hareketli Resim Uzmanları Grubu) tarafından, ilk olarak grubun MPEG-1 standardı ve daha sonra MPEG-2 standardı için yaptıkları çalışmaların bir parçası olarak geliştirildi. Sesi için oluşturulan alt gruplardan ilki, Fraunhofer IIS, Hannover Üniversitesi, AT&T Bell Laboratuvarları, Thomson-Brandt, CCETT ve diğer bazı kurumlarda görevli olan mühendislerden oluşuyordu. MPEG-1 Audio Layer (MPEG-1 Ses Katmanı) I, II ve III'ü bünyesinde barındıran MPEG-1 Audio (MPEG-1 Part 3), ISO/IEC standardı bünyesinde 1991 yılında komite taslağı olarak kabul edildi ve taslak son halini 1992 yılında aldı. Çalışmaların sonuçları ise 1993 yılında (ISO/IEC 11172-3:1993) yayımlandı. Eski teknolojilerle uyumlu olan ve fazladan bit oranları ve örnekleme oranları içeren MPEG-2 Audio (MPEG-2 Part 3) ise 1995 yılında yayımlandı (ISO/IEC 13818-3:1995).

MP3'ün Tarihi

MP3 kayıplı ses veri sıkıştırma algoritması, işitsel maskeleme adı verilen ve insan kulağındaki algısal sınırlamalardan faydalanır. 1894 yılında Amerikalı bir doktor olan Alfred M. Mayer, bir ses tonunun duyulabilirliğinin, düşük bir frekansa sahip başka bir ses tonu kullanılarak engellenebileceğini keşfetti. 1959 yılında Richard Ehmer, bu iddiayı destekleyen işitsel kavislerin tam bir listesini yayımladı. Ernst Terhardt ve arkadaşları, yüksek miktarda tutarlılığa sahip işitsel maskelemeyi tanımlayan bir algoritmayı tanımladı.

Psikoakustik maskeleme kod çözücüsünün ilk kez 1979 yılında, Bell Telefon Laboratuvarları'nda görevli Manfred R. Schroeder ve arkadaşlarının yanı sıra yine aynı firmada görevli M. A. Krasner tarafından kullanıldığına inanılır. Krasner, konuşmaya yönelik bir donanımı yayımlayan ve onu üreten ilk kişi olmuştur ancak onun bu çalışmaları, psiko-akustik kod çözücülerinin geliştirilmesi üzerine ilk zamanlarda doğrudan bir etki etmemiştir. Manfred Schroeder, akustik ve elektrik mühendisleri arasında tanınan bir isimdi ancak onun bu çalışması pek ilgi görmedi zira çalışma, konuşmanın doğal yapısı sonucu ortaya çıkan bazı olumsuz sonuçların yanı sıra lineer tahminli kodlama (linear predictive coding - LPC) üzerine odaklanıyordu. Hem Krasner hem de Schroeder, Eberhard F. Zwicker'ın kritik bantlar üzerinde yaptığı düzenleme ve maskeleme çalışmalarından ilham almışlardı. Algısal ses sıkıştırma algoritmalarına yönelik bir makale, IEEE'nin düzenlediği bir bültende yayımlandı. 1988 yılının Şubat ayında yayımlanan bu bülten, ses sıkıştırma teknolojilerine odaklanıyordu ve bu teknolojilerden bazıları, işitsel maskeleme yöntemini baz alıyorlardı. Bazı firmalar, bu yöntemi kullanan bazı donanımları bile geliştirmişlerdi.

MP3'ten hemen önce gelen teknoloji olarak Frekans Alanında Optimum Kodlama (Optimum Coding in the Frequency Domain - OCF) ve Algısal Dönüşüm Kodlama (Perceptual Transform Coding - PXFM) gösterilir. Bu iki kod çözücünün yanı sıra Thomson-Brandt'ın çalışmaları, ASPEC adı verilen bir kod çözücü altında toplandı ve MPEG'in düzenlediği bir kalite yarışmasına sunuldu ve yarışmayı kazandı ancak daha sonra ödül, teknolojiyi kullanmak çok zor olduğu için geri alındı. Algısal ses kod çözücü donanımına ilk örnek olarak, Motorola 56000 DSP çiplerini temel alan bir psiko-akustik dönüşüm kodlayıcısı idi. Krasner'in donanımı gündelik kullanım için pek elverişli değildi.

Almanya'nın Erlangen-Nuremberg Üniversitesi'nde bir doktora öğrencisi olan Karlheinz Brandenburg, 1980lerin başında dijital müzik sıkıştırma üzerine çalıştı ve çalışmalarında insanların müziği nasıl algıladıklarına odaklandı. Brandenburg, doktora çalışmasını 1989 yılında tamamladı. MP3, doğrudan OCF ve PXFM soyundan gelmektedir ve AT&T-Bell Laboratuvarları bünyesinde James D. Johnston ("JJ") ile birlikte doktora sonrasında çalışan Brandenburg ile Fraunhofer Tümleşik Devreler Enstitüsü'nün çalışmaları sonucunda ortaya çıkmıştır. Bu çalışmalara pisko-akustik alt-bant kodcularının MP2 biriminin de küçük bir katkısı olmuştur. 1990 yılında Brandenburg, Erlangen-Nuremberg Üniversitesi'nde Yardımcı Profesör oldu. Oradayken, Fraunhofer Sosyetesi'ndeki bilim adamları ile birlikte müzik sıkıştırma üzerine yönelik çalışmalarını sürdürdü. Brandenburg, 1993 yılında Fraunhofer Enstitüsü'ne katıldı.

Suzanne Vega'nın "Tom's Diner" şarkısı, Karlheinz Brandenburg tarafından MP3'ün geliştirilmesi için kullanılan ilk şarkı olmuştur. Brandenburg bu şarkıyı tekrar tekrar dinleyerek MP3 kodlaması üzerinde ince ayar yapmış ve MP3 teknolojisinin Vega'nın sesindeki incelik üzerinde herhangi olumsuz bir etkisi olmadığından emin olmak istemiştir.

Kaynak: Wikipedia