Übersicht der Audio-Dateiformate

Zuletzt aktualisiert am 23. April 2026 von Sören Ramspeck mit der Erfahrung von mehr als 128.379.675 umgewandelten Dateien seit 2013.

Wer Audiodateien umwandeln, abspielen oder archivieren möchte, der steht vor einer erstaunlichen Vielfalt an Formaten. Egal ob MP3, AAC, WAV oder OPUS, die Liste ist lang und die Unterschiede sind mitunter nur sehr fein. Unser Ratgeber erklärt alle relevanten Audio-Dateiformate und wofür sie entwickelt wurden, wo sie heute zum Einsatz kommen und welches Format für welchen Anwendungsfall die beste Wahl ist.

Grundlagen: Codec, Container und Kompression

Leser die mit diesen Begriffen gut vertraut sind können diesen Abschnitt gern überspringen und direkt bei den Musikformaten fortfahren.

Codec

Ein Codec (Coder/Decoder) bezeichnet das Verfahren mit dem Audiodaten (und auch Videodaten) komprimiert und wieder entpackt werden. MP3, Vorbis oder FLAC sind Codecs.

Container

Ein Container hingegen ist das Dateiformat, das einen oder mehrere Codecs „verpackt“ oder „zusammenhält“. So ist eine M4A-Datei ein MPEG4-Container, der AAC-Audio oder Apple Lossless enthalten kann. Die Dateiendung verrät also nicht immer direkt den verwendeten Codec, sondern gibt Hinweise auf den verwendeten Container.

Kompression

Bei der Kompression unterscheidet man drei Ansätze:

Kompressionsart	Beschreibung	Beispiele
Verlustbehaftet (lossy)	Entfernt Tonanteile, die das menschliche Ohr kaum oder gar nicht wahrnimmt. Das sorgt für kleine Dateien, aber die entfernten Informationen sind unwiederbringlich verloren.	MP3, AAC, OGG Vorbis, Opus
Verlustfrei (lossless)	Komprimiert die Daten ohne Informationsverlust, wie ein ZIP für Audio. Die Originaldaten lassen sich exakt wiederherstellen.	FLAC, ALAC, APE, WavPack
Unkomprimiert	Rohe PCM-Audiodaten ohne jede Kompression. Maximale Qualität, aber auch maximale Dateigröße.	WAV, AIFF

Musikformate (verlustbehaftet)

Die verlustbehafteten Musikformate sind das womit die meisten täglich in Berührung kommen: beim Musikhören, Streamen oder Herunterladen.

MP3 – das wohl bekannteste Musikformat

MP3 (MPEG-1 Audio Layer III) ist das bekannteste Audioformat der Welt. Entwickelt in den späten 1980er und frühen 1990er-Jahren am Fraunhofer Institut für Integrierte Schaltungen (IIS) in Erlangen, wurde MP3 1993 als Teil des MPEG-1 Standards veröffentlicht.^[1] Der eigentliche Durchbruch gelang MP3 Ende der 1990er Jahre mit den ersten tragbaren MP3-Playern. Seitdem ist MP3 praktisch zum Synonym für digitale Musik geworden.

Im April 2017 wurde das Lizenzprogramm von Technicolor und Fraunhofer IIS für MP3 eingestellt, die letzten Kernpatente sind ausgelaufen.^[2] Das Format ist seither vollständig lizenzfrei nutzbar, was ein weiterer Grund für seine bis heute äußert weite Verbreitung ist.

Typische Bitraten liegen zwischen 128 und 320 kbps. Moderne Encoder wie LAME (libmp3lame) liefern bei 192 kbps und darüber eine Qualität, die in Blindtests von den meisten Hörern nicht mehr von CD-Qualität unterschieden werden kann. ^[3]

Die Zeiten, in denen MP3 hörbar „blechern“ klangen sind mit aktuellen Encodern vorbei, auch wenn sich Vorurteile gegenüber MP3 bei einigen audiophilen und Verfechtern der Lossless-Formate halten.

AAC – leistungsstarker Mitspieler zu MP3

AAC (Advanced Audio Coding) wurde 1997 von einem Konsortium unter der Beteiligung von Fraunhofer IIS, Dolby, Sony und AT&T als Teil des MPEG-2 Standards verabschiedet. ^[4]. Den Durchbruch erlebte AAC schließlich 2003, als Apple den iTunes-Store startete und AAC als Standard-Musikformat wählte. Heute ist AAC Standard in MP4-Containern, auf Apple-Geräten, bei YouTube und vielen Streaming-Plattformen.

AAC wird häufig als „Nachfolger“ oder „Ablösung“ von MP3 bezeichnet. Technisch gesehen nutzt AAC auch ein moderneres psychoakustisches Modell und effizientere Kompressionsverfahren ^[5], in der Praxis ist der Qualitätsunterschied jedoch geringer als oft dargestellt. Bei den in der Praxis relevanten Bitraten ab 128 kbps nehmen sich AAC und MP3 mit modernen Encodern kaum noch etwas. Viele ältere Vergleiche basieren auf MP3-Encodern die deutlich schlechter arbeiten als heutiges LAME. Wahrscheinlich hält sich die Behauptung aus dieser Zeit noch hartnäckig. Bei sehr niedrigen Bitraten unter 96 kbps hat AAC durch Techniken wie SBR (Spectral Band Replication) allerdings noch messbare Vorteile. Doch so geringe Bitraten werden in der Praxis nur noch sehr selten benötigt.

Anders als MP3 unterliegt AAC noch dem Patentschutz. Die letzten Basispatente laufen voraussichtlich 2028 aus, einige Erweiterungen wie HE-AAC auch erst 2031. ^[6]. AAC-Dateien findet man häufig in M4A-Containern oder in rohen AAC-Dateien.

OGG Vorbis – die offene Alternative

OGG Vorbis ist ein vollständig offenes und patentfreies Audioformat, das von der Xiph.Org Foundation entwickelt wurde. „Vorbis“ ist hierbei der Codec und „OGG“ bezeichnet den Container. Die erste stabile Version (1.0) erschien im Juli 2002.^[7]. Die Entwicklung begann als direkte Antwort auf die damaligen Lizenzgebühren von MP3.

Technisch liefert Vorbis bei vergleichbaren Bitraten eine solide Qualität. Das Format konnte sich im Consumer-Bereich jedoch nie durchsetzen, es fehlte die Hardware-Unterstützung oder ein großer Konzern, der Vorbis hardwarseitig unterstützt. Allerdings hat Vorbis seine feste Heimat bei Spotify gefunden, denn Spotify nutzt OGG Vorbis in den Bitraten 96, 160 und 320 kbps sowohl auf Desktop als auch in den mobilen Apps. ^[8] Auch in modernen Videospielen wird Vorbis gern genutzt, da es lizenzfrei eingebunden werden kann.

Opus – der neueste verlustbehaftete Audiocodec

Opus ist der technisch vielseitigste und modernste verlustbehaftete Audiocodec. Opus wurde 2012 von der IETF als RFC 6716 standardisiert ^[9] und ist ein Gemeinschaftsprojekt der Xiph.Org (also wie Vorbis) und Microsoft (ex. Skype). Der Codec ist ebenfalls vollständig offen und lizenzfrei.

Das Besondere an Opus ist, dass der Codec ein äußerst breites Spektrum, von schmalbandiger Sprache mit 6 kbps bis zu hochauflösender Musik mit 510 kbps abbilden kann. Dabei wechselt er nahtlos zwischen einem Sprachencoder (basierend auf SILK, entwickelt von Skype) und einem auf CELT basierenden Musik-Encoder.^[9] Diese Vielseitigkeit macht Opus zum Standard in WebRTC, also der Kerntechnologie hinter Browser-Telefonie und Videokonferenzen.^[10] Auch WhatsApp, Signal, Discord und Telegram nutzen Opus für Sprachnachrichten und Anrufe.

Trotz seiner technologischen Überlegenheit ist auch Opus kein neues MP3 geworden. In Consumer-Bereich fehlt die Sichtbarkeit und die meisten Nutzer kommen mit Opus nur in Berührung ohne es zu wissen: bei der Nutzung der vorgenannten Apps oder WEBM-Videos bei zum Beispiel YouTube.

WMA – Microsofts Ansatz mit DRM

WMA war Microsofts Versuch ein eigenes, verlustbehaftetes, Audioformat zu etablieren. WMA wurde im Jahre 1999 eingeführt und lieferte bei gleichen Bitraten etwa mit MP3 ebenbürtige Qualität. Was die Musikindustrie jedoch besonders freute: WMA bietet integriertes DRM (Digital Rights Management). So sollte die Weitergabe unterbunden werden. Microsofts Zune-Player setzten auf WMA, konnten sich aber nicht wirklich am Markt etablieren.

Heute ist WMA praktisch irrelevant geworden. Selbst Microsoft hat das Format aus seinen aktuellen Produkten zugunsten von AAC und MP3 aufgegeben. Heute sind WMA-Dateien meist aus älteren Musiksammlungen oder Sprachaufnahmen.

MP2 – MP3’s Eltern

MP2 (MPEG-1 Audio Layer II) ist der direkte Vorgänger von MP3 und wurde ebenfalls vom Fraunhofer IIS entwickelt. Obwohl MP2 im Consumer-Bereich längst von MP3 verdrängt wurde, ist das Format im Rundfunk nach wie vor fester Standard, denn DAB Radio und DVB-Fernsehton nutzen MP2 noch bis heute.^[11]. Warum? Weil MP2 robuster gegen Störungen und Übertragungsfehler ist, und die lassen sich bei Funk bekanntlich nicht vermeiden.

AC3 (Dolby Digital) – Kinostandard

AC3 ist streng genommen eigentlich kein reines Audioformat, sondern ein Mehrkanal Audio-Codec von Dolby Labs. Es unterstützt bis zu 5.1-Kanal Surround-Sound und ist der Standard-Audiocodec auf DVDs, vielen Blu-Ray-Filmen und im digitalen Fernsehen (löst MP2 ab). ^[12] Auch zahlreiche Streaming-Dienste nutzen Dolby Digital oder den Nachfolger EAC3 (Enhanced AC3, auch Dolby Digital Plus genannt) für ihre Mehrkanal-Tonspuren. Reine .ac3-Dateien kommen sehr selten vor, der Codec wird meist in Video-Containern wie MKV oder MP4 genutzt.

Verlustbehaftete Musikformate im Vergleich

Format	Erscheinungsjahr	Typische Bitrate	Lizenz	Haupteinsatz heute
MP3	1993	128-320 kbps	frei seit 2017	Universal, Downloads, lokale Sammlung
AAC	1997	128-256 kbps	patentiert (bis ~2028)	Apple, YouTube, Streaming
OGG Vorbis	2002	96-320 kbps	frei	Spotify, Videospiele
Opus	2012	6-510 kbps	frei	WebRTC, Messenger, YouTube
WMA	1999	64-320 kbps	proprietär	kaum noch relevant
MP2	1993	128-384 kbps	frei seit 2017	DAB-Radio, DVB-Fernsehton
AC3	1991	192-640 kbps	proprietär (Dolby)	DVD, Blu-ray, Streaming (Surround)

Sprachformate

Sprache und Musik stellen grundlegend andere Anforderungen an den eingesetzten Audiocodec. Während menschliche Sprache nur den Frequenzbereich von etwa 200 bis 4.000 Hz benutzt, benötigt Musik eher 20 bis 20.000 Hz. Sprachcodecs können den kleineren Bereich gezielt ausnutzen um so bei sehr niedrigen Bitraten verständliche Ergebnisse zu liefern. Hinzu kommt oft die Anforderung nach einer niedrigen Verzögerung (Latenz), etwa bei Telefonie oder Videokonferenzen. Wer etwas älter ist wird sich sicher noch an schlechte Telefonverbindungen erinnern in denen man sich gegenseitig ins Wort fällt.

AMR – GSM-Mobilfunkstandard

AMR (Adaptive Multirate) wurde vom ETSI für GSM-Mobilfunknetze entwickelt und 1999 als 3GPP-Standard übernommen. ^[13] AMR ist mit einem Frequenzbereich von 200 bis 3400 Hz schmalbandig und kann, wie der Name schon impliziert, dynamisch zwischen 4,75 und 12,2 kbps an die verfügbare Bandbreite anpassen. Für Sprache ist das vollkommen ausreichend, für Musik jedoch gänzlich ungeeignet.

Android Geräte und ältere iOS-Versionen nutzen AMR als Standard für Sprachaufnahmen. Auch MMS-Sprachnachrichten und einige VoIP-Apps verwenden AMR. Zum Teilen sollten AMR-Dateien jedoch in MP3 oder AAC konvertiert werden, da nicht jeder Player AMR unterstützt.

3GP und 3GPP – beständige Nutzung

3GPP (Third Generation Partnership Project) ist ein Containerformat, das speziell für 3G-Mobiltelefone entwickelt und 2003 veröffentlicht wurde. 3GPP ist optimiert für wenig Speicherplatz und langsame Verbindungen.^[14] Es basiert technisch auf dem MPEG-4 Part 12 Container und kann für Audio die Codecs AMR oder AAC verwenden.

3GPP ist zwar primär ein Videoformat, begegnet einem jedoch als reine Audiodatei. In Androids MediaRecorder-API ist das OutputFormat.THREE_GPP mit dem Encoder AMR_NB als Standard-Beispiel für Audioaufnahmen dokumentiert^[15] und viele ältere und günstigere Android-Geräte nutzen dieses Format noch bis heute für Sprachaufnahmen. Auch Samsung verwendete lange die Dateiendung .3ga (3rd Generation Audio) für die Voice-Recorder-App. ^[16] Auch im MMS-Bereich sind .3gp-Dateien als Sprach- und Kurzvideo-Container nach wie vor verbreitet.

Die meisten 3GPP-Dateien, die heute im Umlauf sind, stammen jedoch von älteren Mobiltelefonen. Für die Weitergabe empfiehlt sich eine Umwandlung in MP3 für reine Tonaufnahmen oder MP4 für Videos. VLC und der Windows Media Player können .3gp-Dateien in der Regel ohne Probleme abspielen.

QTA (QuickTime Audio) – Apples Neuentwicklung

QTA ist Apples jüngstes Audioformat, eingeführt Ende 2024 mit iOS 18.2 für das iPhone 16 Pro und Pro Max. QTA ist eine Alternative für das bisherige .m4a-Format für Sprachmemos auf diesen Geräten ab und bringt eine grundlegende Neuerung mit: räumliches Audio (Spatial Audio).

Technisch basiert QTA auf First Order Ambisonics (FOA). Die vier Mikrofone des iPhone (ab iPhone 16) erfassen ein dreidimensionales Klangfeld das in vier „Kanälen“ gespeichert wird. Der dabei verwendete Codec heißt APAC (Apple Positional Audio Codec). APAC ist ein neuer, proprietärer Codec den Apple ursprünglich für immersives Video auf der Vision Pro (Apples VR-Brille) entwickelt hat. .^[17] QTA-Dateien enthalten zusätzlich eine Stereo-AAC-Spur als Fallback für ältere Geräte.^[18] Durch die räumlichen Audiodaten lassen sich Hintergrundgeräusche nachträglich besser isolieren und entfernen, beispielsweise in Logic Pro.^[19]

QTA zeigt, wohin die Reise geht: weg von einfachen Mono- oder Stereo-Aufnahmen, hin zu räumlichem Audio, das nachträglich noch besser bearbeitet und an die Hörposition angepasst werden kann.

Opus als Sprachcodec

Opus habe ich bereits bei den Musikformaten vorgestellt, verdient im Sprachbereich aber eine eigene Erwähnung. Denn hier spielt Opus seine größte Stärke aus: Der Codec liefert bei 12-20 kbps bereits hervorragende Sprachqualität und ist gleichzeitig latenzarm genug für Echtzeitkommunikation. Opus ist heute der Standard-Sprachcodec in WebRTC^[10] und damit in allen Browser-basierten Telefonie- und Videolösungen, in WhatsApp, Signal, Discord, Telegram und vielen weiteren Anwendungen. Es ist keine Übertreibung zu sagen, dass Opus der am häufigsten genutzte Sprachcodec im Internet ist, auch wenn wahrscheinlich die wenigsten Nutzer je davon gehört haben.

Verlustfreie und unkomprimierte Formate

Verlustfreie Formate speichern Audio ohne Qualitätsverlust. Die Originaldaten lassen sich also bitgenau rekonstruieren. Im Gegensatz zu MP3 oder AAC geht also nichts verloren. Der Preis dafür sind allerdings deutlich größere Dateien. Unkomprimierte Formate wie WAV erzeugen hierbei die größten Datenmengen.

FLAC – frei und verlustfrei

FLAC (Free Lossless Audio Codec) ist der mit Abstand populärste verlustfreie Audiocodec. Entwickelt wurde FLAC (wie Opus und Vorbis) von der Xiph.Org Foundation und ist seit 2001 verfügbar, vollständig offen und lizenzfrei.^[20] FLAC komprimiert Audio, je nach Inhalt, verlustfrei auf etwa 50-70 % der Originalgröße.

FLAC hat sich als Standard in der audiophilen Szene etabliert und wird von Streaming-Diensten wie Tidal, Qobuz und Amazon Music für verlustfreies Streaming verwendet. Seit September 2025 bietet auch Spotify verlustfreies Streaming im FLAC-Format an (24 Bit / 44,1 kHz für Premium-Nutzer).^[21] Android unterstützt FLAC nativ. Nur Apple hat sich gegen FLAC gesträubt, und nutzt ALAC:

ALAC – frei und verlustfrei mit „Apfelgeschmack“

ALAC (Apple Lossless Audio Codec) ist Apples Antwort auf FLAC. Eingeführt 2004, liefert ALAC eine vergleichbare Kompression und identische Qualität wie FLAC; schließlich sind beide verlustfrei. Seit 2011 ist ALAC Open Source ^[22], was die technischen Unterschiede zu FLAC endgültig auf die Container-Frage reduziert. ALAC wird in Apples .m4a-Container verpackt und ist nahtlos in iTunes, Apple Music und weitere Apple-Geräte integriert. Wer im Apple-Ökosystem verlustfrei hören will, kommt an ALAC praktisch nicht vorbei. Apple Music nutzt ALAC für sein „Lossless“-Angebot.^[23] ALAC ist also FLAC mit Apfelgeschmack 😉 und spielt außerhalb der Apple-Welt keine Rolle, dort ist FLAC die erste Wahl.

WAV – Urgestein der Audiodateien

WAV (Waveform Audio File Format) wurde 1991 von Microsoft und IBM eingeführt und speichert unkomprimierte PCM-Audiodaten (Pulse Code Modulation). Aufgrund der Einfachheit des Formates stellt es keine großen Anforderung an die Rechenleistung und war in früheren Windows-Versionen der Standard beim integrierten Audio-Recorder. Noch heute ist WAV das Standard-Austauschformat in Tonstudios und bei der professionellen Audioproduktion. Die Qualität ist maximal, denn es findet keinerlei Kompression statt. Dafür sind die Dateien allerdings entsprechend groß: rund 10 MB pro Minute bei CD-Qualität (44,1 kHz, 16 Bit, Stereo).

Für die Archivierung oder den Transport von Musik ist WAV aufgrund der Dateigröße unpraktisch. Hier ist FLAC die bessere Wahl: gleiche Qualität, aber nur etwa die Hälfte der Dateigröße.

AIFF

AIFF (Audio Interchange File Format) ist das Apple-Pendant zu WAV. Entwickelt 1988 von Apple, basiert AIFF ebenfalls auf unkomprimierten PCM-Daten. Im Studio-Bereich auf dem Mac war AIFF lange die Standardwahl, wird heute aber zunehmend durch FLAC oder ALAC ersetzt. Technisch gibt es zwischen WAV und AIFF keinen klanglichen Unterschied, denn beide speichern die gleichen Rohdaten, nur in unterschiedlichen Container-Strukturen.

APE und WavPack

Neben FLAC und ALAC existieren weitere verlustfreie Codecs, die in bestimmten Nischen eine Rolle spielen. APE (Monkey’s Audio) erreicht eine etwas bessere Kompressionsrate als FLAC, ist aber deutlich rechenintensiver und wird nur von wenigen Playern unterstützt. In audiophilen Foren, besonders im asiatischen Raum, trifft man APE gelegentlich an.

WavPack bietet eine interessante Besonderheit: einen Hybrid-Modus, der eine verlustbehaftete und eine verlustfreie Schicht in separaten Dateien speichert. Wer nur die .wv-Datei behält, hat eine kompakte lossy-Version. Wer die .wvc-Korrekturdatei dazunimmt, kann das Original bitgenau rekonstruieren.^[24] In der Praxis ist WavPack allerdings ähnlich selten anzutreffen wie APE.

Verlustfreie Formate im Vergleich

Format	Kompression	Typische Dateigröße (3 Min.)	Lizenz	Haupteinsatz
FLAC	verlustfrei, ~50-70 %	~15-20 MB	frei	Archivierung, Streaming (Tidal, Qobuz, Spotify), Android
ALAC	verlustfrei, ~50-70 %	~15-20 MB	Open Source (seit 2011)	Apple Music, iTunes, Apple-Geräte
WAV	keine (PCM)	~30 MB	frei	Tonstudio, professionelle Produktion
AIFF	keine (PCM)	~30 MB	frei	Mac-Studios, ältere Apple-Workflows
APE	verlustfrei, ~45-65 %	~14-18 MB	frei	Nische, audiophile Sammler
WavPack	verlustfrei oder hybrid	~15-20 MB	frei	Nische, Archivierung mit Hybrid-Option

Container und Dateiendungen: das große Missverständnis

Eines der häufigsten Missverständnisse bei Audioformaten: die Dateiendung verrät nicht unbedingt, welcher Codec in der Datei steckt. Der Grund dafür ist das Container-Prinzip, bei dem der Container nur die äußere Hülle ist die den Codec beinhaltet.

M4A – ein Container, zwei Welten

M4A ist ein MPEG-4-Audio-Container und das beste Beispiel für diese Verwirrung: Eine .m4a-Datei kann verlustbehaftetes AAC-Audio oder verlustfreies ALAC-Audio enthalten. Von außen ist das nicht zu erkennen. Erst ein Blick in die Metadaten (z.B. mit ffprobe oder MediaInfo) zeigt den tatsächlichen Codec. Apple nutzt .m4a konsequent für beide Varianten, was regelmäßig zu Verwirrung führt, wenn Nutzer glauben, ihre gesamte iTunes-Bibliothek sei „verlustfrei“, obwohl die meisten Dateien AAC enthalten oder Dateien auf einem anderen Gerät plötzlich nicht abspielbar sind.

Die OGG-Familie

Die Geschichte der OGG-Dateiendungen ist ein lehrreiches Beispiel dafür, wie gut gemeinte Standards in der Praxis kollidieren können. Ursprünglich wurde .ogg für alle Inhalte im Ogg-Container verwendet. Als aber neben Vorbis-Audio auch Theora-Video und andere Codecs in den Container kamen, führte die Xiph.Org Foundation 2008 mit RFC 5334 differenzierte Endungen ein:^[25]

Endung	MIME-Type	Inhalt
.ogg	audio/ogg	Vorbis-Audio (Legacy)
.oga	audio/ogg	Beliebiges Audio im Ogg-Container
.opus	audio/ogg	Opus-Audio im Ogg-Container
.ogv	video/ogg	Video im Ogg-Container
OGX	application/ogg	Multiplexte Inhalte (Mischformen)

In der Praxis sorgt diese Vielfalt bis heute für Probleme. Ein aktuelles Beispiel: Android 15 erzeugt .OGX-Dateien beim Download von .ogg-Dateien, wenn der Webserver den veralteten MIME-Type application/ogg statt audio/ogg sendet.^[26] Die Dateien selbst sind völlig in Ordnung, nur die Endung stimmt nicht. Betroffen waren unter anderem Wikimedia und Fandom/Wikia. Details dazu in der Analyse: Das plötzliche Auftreten von OGX-Dateien.

WebM

WebM ist Googles offener Multimedia-Container, der auf dem Matroska-Format (MKV) basiert.^[27] Für Audio nutzt WebM entweder Vorbis oder Opus als Codec und YouTube verwendet WebM/Opus für seine Audio-Streams. Reine WebM-Audiodateien sind im Alltag eher selten anzutreffen, der Container begegnet einem vor allem im Web-Kontext.

Audio-Sonderformate

MIDI

MIDI (.MID) fällt aus der Reihe: Eine MIDI-Datei enthält keine eigentlichen Audiodaten, sondern Steueranweisungen. Im Prinzip „Noten für den Computer“. Welche Töne gespielt werden, wie laut und wie lang, wird gespeichert, und wie das dann am Ende klingt, hängt vom Wiedergabegerät und dessen Klangerzeugung ab. Während eine MP3-Datei immer gleich klingt, ist MIDI „Interpretationssache“, genau wie einem Notenblatt, das von verschiedenen Musikern unterschiedlich gespielt wird.

MIDI findet heute vor allem in der Musikproduktion Verwendung, wo es als universelle Schnittstelle zwischen Software-Instrumenten, Synthesizern und DAWs (Digital Audio Workstations) dient. Die aktuelle Spezifikation MIDI 2.0 wurde 2020 verabschiedet und erweitert den Standard um höhere Auflösung und bidirektionale Kommunikation.^[28] Auch im Karaoke-Bereich sind .mid-Dateien verbreitet: Sie enthalten neben den Noten häufig auch den Songtext.

DSD (DSF / DFF)

DSD (Direct Stream Digital) ist ein vollkommen anderer Ansatz zur digitalen Audioaufzeichnung. Während alle bisher genannten Formate auf PCM-Abtastung basieren (also Amplitudenwerte in regelmäßigen Zeitabständen), arbeitet DSD mit 1-Bit-Sigma-Delta-Modulation bei extrem hohen Abtastraten (2,8 MHz und höher, zum Vergleich: CD-Audio arbeitet mit 44,1 kHz).

DSD wurde von Sony und Philips für die Super Audio CD (SACD) entwickelt.^[29] Ob DSD tatsächlich hörbar besser klingt als hochauflösendes PCM, ist unter Audiophilen umstritten. Sicher ist: Die Dateien sind sehr groß und die Softwareunterstützung begrenzt. DSD-Dateien tragen die Endung .dsf oder .dff und sind ausschließlich in der audiophilen Nische anzutreffen.

RealAudio

RealAudio (.ra, .ram) war in den späten 1990er- und frühen 2000er-Jahren das dominierende Format für Audio-Streaming im Internet und der RealPlayer war auf zahllosen Rechnern installiert. Heute ist der RealPlayer lange eingestellt (danke!), RealAudio vollständig bedeutungslos und abgelöst durch effizientere Codecs und universellere Streaming-Protokolle. Man begegnet .ra-Dateien nur noch bei alten Dateien.

CAF (Core Audio Format)

CAF ist Apples universeller Audio-Container, eingeführt mit macOS 10.4 (2005). CAF kann praktisch jeden Audiocodec aufnehmen und hat keine Dateigrößenbeschränkung, anders als WAV, das bei 4 GB an die Grenze des RIFF-Headers stößt.^[30] In der Praxis begegnet man .caf-Dateien fast nur in der Apple-Entwicklung und bei der iOS-Programmierung.

Zusammenfassung

Gesamtübersicht aller Audioformate

Format	Typ	Codec / Container	Lizenz	Typische Bitrate / Größe	Hauptverbreitung
MP3	lossy	Codec	frei seit 2017	128-320 kbps	Universal
AAC	lossy	Codec (oft in M4A)	patentiert (~2028)	128-256 kbps	Apple, YouTube, Streaming
OGG Vorbis	lossy	Codec in OGG-Container	frei	96-320 kbps	Spotify, Videospiele
Opus	lossy	Codec (OGG oder WebM)	frei	6-510 kbps	WebRTC, Messenger, YouTube
WMA	lossy	Codec + Container	proprietär	64-320 kbps	veraltet (Windows)
MP2	lossy	Codec	frei seit 2017	128-384 kbps	DAB-Radio, DVB
AC3	lossy	Codec	proprietär (Dolby)	192-640 kbps	DVD, Blu-ray, Surround
AMR	lossy (Sprache)	Codec	patentiert	4,75-12,2 kbps	Mobilfunk, Sprachaufnahmen
3GPP	lossy (Sprache/Video)	Container (AMR/AAC)	frei	variabel	Mobiltelefone, MMS, ältere Android-Geräte
QTA	lossy + Spatial	Container (AAC + APAC)	proprietär (Apple)	~560 kbps (gesamt)	iPhone 16 Pro Sprachmemos
FLAC	lossless	Codec + Container	frei	~700-1000 kbps	Archivierung, Tidal, Qobuz, Spotify
ALAC	lossless	Codec (in M4A)	Open Source	~700-1000 kbps	Apple Music
WAV	unkomprimiert	Container (PCM)	frei	~1411 kbps (CD)	Tonstudio, Produktion
AIFF	unkomprimiert	Container (PCM)	frei	~1411 kbps (CD)	Mac-Studios
MIDI	Steuerdaten	Kein Audio	frei	wenige KB	Musikproduktion, Karaoke
DSD	1-Bit lossless	Codec (DSF/DFF)	patentiert	~5600 kbps (DSD64)	Audiophile Nische, SACD

Warum nutzen wir, was wir nutzen?

Wer die Formatvielfalt verstehen will, muss die Ökosysteme dahinter verstehen. Die Verbreitung eines Audioformats hängt nur bedingt von seiner technischen Qualität ab, viel entscheidender sind Timing, Patente und die Marktmacht der Unternehmen, die ein Format unterstützen.

Warum ist MP3 noch immer dominant?

MP3 hatte einen Zeitvorsprung von fast einem Jahrzehnt gegenüber seinen Alternativen. Als AAC und OGG Vorbis erschienen, war MP3 bereits der universelle Standard und jedes Gerät, jede Software, jedes Betriebssystem konnte MP3 abspielen. Dazu kommt, dass MP3 seit 2017 vollständig patentfrei ist.^[2] Es gibt schlicht keinen zwingenden Grund auf ein anderes Format zu wechseln.

Apple: das geschlossene Ökosystem

Apple setzt konsequent auf eigene oder von Apple bevorzugte Formate: AAC für verlustbehaftete Musik (iTunes Store, Apple Music), ALAC für verlustfreies Streaming (Apple Music Lossless)^[23], und seit Ende 2024 QTA mit dem proprietären APAC-Codec für räumliche Sprachaufnahmen.^[17] Diese Strategie hat Methode: Apple kontrolliert den gesamten Stack vom Codec über den Container bis zum Endgerät. Das garantiert eine nahtlose Integration und bindet Nutzer an das Ökosystem. Bezeichnend ist, dass Apple FLAC bis heute nicht nativ unterstützt, obwohl es technisch keinen Grund gibt, es nicht zu tun.

Google: der offene Ansatz

Google verfolgt eine andere Strategie und setzt auf offene Formate wie OGG Vorbis und Opus im WebM-Container.^[27] YouTube nutzt Opus für seine Audio-Streams, Android unterstützt FLAC, Opus und Vorbis nativ. Google finanziert die Entwicklung von Opus sogar aktiv mit und treibt die Verbreitung über WebRTC voran.^[10] Der Nachteil des offenen Ansatzes: es fehlt die enge vertikale Integration, die Apple bietet. Nicht jedes Android-Gerät behandelt alle offenen Formate gleich gut, und die Fragmentierung des Android-Ökosystems sorgt regelmäßig für Kompatibilitätsprobleme, wie das OGX-Beispiel unter Android 15 gezeigt hat.^[26]

Streaming-Dienste: Wer nutzt was?

Streaming-Dienst	Format (Standard)	Format (HiFi/Lossless)
Spotify	OGG Vorbis (bis 320 kbps)^[8]	FLAC (24 Bit/44,1 kHz, seit 09/2025)^[21]
Apple Music	AAC 256 kbps	ALAC (bis 24 Bit/192 kHz)^[23]
YouTube Music	Opus (in WebM)	–
Tidal	AAC 320 kbps	FLAC (bis 24 Bit/192 kHz)
Amazon Music	AAC	FLAC (HD/Ultra HD)
Qobuz	–	FLAC (bis 24 Bit/192 kHz)
Deezer	MP3 128 kbps	FLAC (CD-Qualität)

Die vorstehende Streaming-Tabelle zeigt das Muster deutlich: Apple setzt auf AAC und ALAC, Google auf Opus, und der Rest der Branche schwankt zwischen AAC und FLAC. Spotify war lange ein Sonderfall mit OGG Vorbis als einzigem verlustbehafteten Format, hat 2025 aber mit FLAC für die verlustfreie Wiedergabe nachgezogen.

Fazit: Welches Format für welchen Zweck?

Das „beste“ Audioformat gibt es nicht, aber für jeden Einsatzzweck gibt es eine sinnvolle Wahl:

Einsatzzweck	Empfehlung	Grund
Musik hören (allgemein)	MP3 oder AAC	Universelle Kompatibilität, gute Qualität ab 192 kbps
Musik archivieren	FLAC	Verlustfrei, offen, breite Unterstützung
Musik im Apple-Ökosystem	AAC / ALAC	Nahtlose Integration in iTunes und Apple Music
Sprachaufnahmen	MP3 oder AAC	Gute Kompatibilität beim Weitergeben
Web und Streaming	Opus	Beste Effizienz, offen, WebRTC-Standard
Professionelle Produktion	WAV oder AIFF	Unkomprimiert, maximale Flexibilität
Maximale Kompatibilität	MP3	Wird von jedem Gerät und jeder Software unterstützt

Die Welt der Audioformate ist über die Jahrzehnte gewachsen und wird es weiter tun. Neue Entwicklungen wie Apples QTA zeigen, dass die Reise noch längst nicht vorbei ist, denn räumliches Audio und adaptive Codecs werden in den kommenden Jahren sicher weiter an Bedeutung gewinnen. Für den Alltag gilt jedoch: Mit MP3 und FLAC ist man auf der sicheren und kompatiblen Seite.

Quellen

[1] Fraunhofer IIS: mp3 – Übersicht und Geschichte
[2] Fraunhofer IIS Audio Blog: Alive and Kicking – mp3 Software, Patents and Licenses (2017)
[3] LAME MP3 Encoder
[4] Fraunhofer IIS: MP3 and AAC Explained (PDF, AES-17-Conference)
[5] Wikipedia: Advanced Audio Coding – Technical Details
[6] Via Licensing (ehem. Access Advance): AAC Patent Portfolio
[7] Xiph.Org Foundation: Vorbis – Open Audio Codec
[8] Spotify Support: Audio Quality
[9] RFC 6716: Definition of the Opus Audio Codec (IETF, 2012)
[10] W3C: WebRTC 1.0 – Real-Time Communication Between Browsers
[11] ETSI: Digital Audio Broadcasting (DAB) Standards
[12] Dolby: Dolby Digital – Technologie-Übersicht
[13] 3GPP: Media Codecs – AMR Speech Codec
[14] 3GPP: Specifications – 26 Series (Codecs und Medienformate)
[15] Android Developers: MediaRecorder.OutputFormat – THREE_GPP
[16] Samsung Community: Voice Recorder und 3gp4 Codec (M4A/3GA)
[17] Apple Developer: Apple Positional Audio Codec (PDF)
[18] Online-Umwandeln.de: QTA Dateiformat – ffprobe-Analyse
[19] Apple Support: Apply Spatial Playback Processing to QTA Files in Logic Pro
[20] Xiph.Org Foundation: FLAC – Free Lossless Audio Codec
[21] Spotify for Artists: Audio File Formats (FLAC-Unterstützung)
[22] Apple Lossless Audio Codec – Open Source (GitHub/macOS Forge)
[23] Apple Support: About Lossless Audio in Apple Music
[24] WavPack: Technical Documentation – Hybrid Mode
[25] RFC 5334: Ogg Media Types (IETF, 2008)
[26] Online-Umwandeln.de: Das plötzliche Auftreten von OGX-Dateien – eine Analyse (2026)
[27] The WebM Project – An Open Web Media Project
[28] MIDI Association: Details About MIDI 2.0
[29] Sony: Super Audio CD – Overview
[30] Apple Developer Documentation: Core Audio Format

5.0/5(1 Stimme)