Übersicht der Audio-Dateiformate
Wer Audiodateien umwandeln, abspielen oder archivieren möchte, der steht vor einer erstaunlichen Vielfalt an Formaten. Egal ob MP3, AAC, WAV oder OPUS, die Liste ist lang und die Unterschiede sind mitunter nur sehr fein. Unser Ratgeber erklärt alle relevanten Audio-Dateiformate und wofür sie entwickelt wurden, wo sie heute zum Einsatz kommen und welches Format für welchen Anwendungsfall die beste Wahl ist.
Grundlagen: Codec, Container und Kompression
Leser die mit diesen Begriffen gut vertraut sind können diesen Abschnitt gern überspringen und direkt bei den Musikformaten fortfahren.
Codec
Ein Codec (Coder/Decoder) bezeichnet das Verfahren mit dem Audiodaten (und auch Videodaten) komprimiert und wieder entpackt werden. MP3, Vorbis oder FLAC sind Codecs.
Container
Ein Container hingegen ist das Dateiformat, das einen oder mehrere Codecs „verpackt“ oder „zusammenhält“. So ist eine M4A-Datei ein MPEG4-Container, der AAC-Audio oder Apple Lossless enthalten kann. Die Dateiendung verrät also nicht immer direkt den verwendeten Codec, sondern gibt Hinweise auf den verwendeten Container.
Kompression
Bei der Kompression unterscheidet man drei Ansätze:
| Kompressionsart | Beschreibung | Beispiele |
|---|---|---|
| Verlustbehaftet (lossy) | Entfernt Tonanteile, die das menschliche Ohr kaum oder gar nicht wahrnimmt. Das sorgt für kleine Dateien, aber die entfernten Informationen sind unwiederbringlich verloren. | MP3, AAC, OGG Vorbis, Opus |
| Verlustfrei (lossless) | Komprimiert die Daten ohne Informationsverlust, wie ein ZIP für Audio. Die Originaldaten lassen sich exakt wiederherstellen. | FLAC, ALAC, APE, WavPack |
| Unkomprimiert | Rohe PCM-Audiodaten ohne jede Kompression. Maximale Qualität, aber auch maximale Dateigröße. | WAV, AIFF |
Musikformate (verlustbehaftet)
Die verlustbehafteten Musikformate sind das womit die meisten täglich in Berührung kommen: beim Musikhören, Streamen oder Herunterladen.
MP3 – das wohl bekannteste Musikformat
MP3 (MPEG-1 Audio Layer III) ist das bekannteste Audioformat der Welt. Entwickelt in den späten 1980er und frühen 1990er-Jahren am Fraunhofer Institut für Integrierte Schaltungen (IIS) in Erlangen, wurde MP3 1993 als Teil des MPEG-1 Standards veröffentlicht.[1] Der eigentliche Durchbruch gelang MP3 Ende der 1990er Jahre mit den ersten tragbaren MP3-Playern. Seitdem ist MP3 praktisch zum Synonym für digitale Musik geworden.
Im April 2017 wurde das Lizenzprogramm von Technicolor und Fraunhofer IIS für MP3 eingestellt, die letzten Kernpatente sind ausgelaufen.[2] Das Format ist seither vollständig lizenzfrei nutzbar, was ein weiterer Grund für seine bis heute äußert weite Verbreitung ist.
Typische Bitraten liegen zwischen 128 und 320 kbps. Moderne Encoder wie LAME (libmp3lame) liefern bei 192 kbps und darüber eine Qualität, die in Blindtests von den meisten Hörern nicht mehr von CD-Qualität unterschieden werden kann. [3]
Die Zeiten, in denen MP3 hörbar „blechern“ klangen sind mit aktuellen Encodern vorbei, auch wenn sich Vorurteile gegenüber MP3 bei einigen audiophilen und Verfechtern der Lossless-Formate halten.
AAC – leistungsstarker Mitspieler zu MP3
AAC (Advanced Audio Coding) wurde 1997 von einem Konsortium unter der Beteiligung von Fraunhofer IIS, Dolby, Sony und AT&T als Teil des MPEG-2 Standards verabschiedet. [4]. Den Durchbruch erlebte AAC schließlich 2003, als Apple den iTunes-Store startete und AAC als Standard-Musikformat wählte. Heute ist AAC Standard in MP4-Containern, auf Apple-Geräten, bei YouTube und vielen Streaming-Plattformen.
AAC wird häufig als „Nachfolger“ oder „Ablösung“ von MP3 bezeichnet. Technisch gesehen nutzt AAC auch ein moderneres psychoakustisches Modell und effizientere Kompressionsverfahren [5], in der Praxis ist der Qualitätsunterschied jedoch geringer als oft dargestellt. Bei den in der Praxis relevanten Bitraten ab 128 kbps nehmen sich AAC und MP3 mit modernen Encodern kaum noch etwas. Viele ältere Vergleiche basieren auf MP3-Encodern die deutlich schlechter arbeiten als heutiges LAME. Wahrscheinlich hält sich die Behauptung aus dieser Zeit noch hartnäckig. Bei sehr niedrigen Bitraten unter 96 kbps hat AAC durch Techniken wie SBR (Spectral Band Replication) allerdings noch messbare Vorteile. Doch so geringe Bitraten werden in der Praxis nur noch sehr selten benötigt.
Anders als MP3 unterliegt AAC noch dem Patentschutz. Die letzten Basispatente laufen voraussichtlich 2028 aus, einige Erweiterungen wie HE-AAC auch erst 2031. [6]. AAC-Dateien findet man häufig in M4A-Containern oder in rohen AAC-Dateien.
OGG Vorbis – die offene Alternative
OGG Vorbis ist ein vollständig offenes und patentfreies Audioformat, das von der Xiph.Org Foundation entwickelt wurde. „Vorbis“ ist hierbei der Codec und „OGG“ bezeichnet den Container. Die erste stabile Version (1.0) erschien im Juli 2002.[7]. Die Entwicklung begann als direkte Antwort auf die damaligen Lizenzgebühren von MP3.
Technisch liefert Vorbis bei vergleichbaren Bitraten eine solide Qualität. Das Format konnte sich im Consumer-Bereich jedoch nie durchsetzen, es fehlte die Hardware-Unterstützung oder ein großer Konzern, der Vorbis hardwarseitig unterstützt. Allerdings hat Vorbis seine feste Heimat bei Spotify gefunden, denn Spotify nutzt OGG Vorbis in den Bitraten 96, 160 und 320 kbps sowohl auf Desktop als auch in den mobilen Apps. [8] Auch in modernen Videospielen wird Vorbis gern genutzt, da es lizenzfrei eingebunden werden kann.
Opus – der neueste verlustbehaftete Audiocodec
Opus ist der technisch vielseitigste und modernste verlustbehaftete Audiocodec. Opus wurde 2012 von der IETF als RFC 6716 standardisiert [9] und ist ein Gemeinschaftsprojekt der Xiph.Org (also wie Vorbis) und Microsoft (ex. Skype). Der Codec ist ebenfalls vollständig offen und lizenzfrei.
Das Besondere an Opus ist, dass der Codec ein äußerst breites Spektrum, von schmalbandiger Sprache mit 6 kbps bis zu hochauflösender Musik mit 510 kbps abbilden kann. Dabei wechselt er nahtlos zwischen einem Sprachencoder (basierend auf SILK, entwickelt von Skype) und einem auf CELT basierenden Musik-Encoder.[9] Diese Vielseitigkeit macht Opus zum Standard in WebRTC, also der Kerntechnologie hinter Browser-Telefonie und Videokonferenzen.[10] Auch WhatsApp, Signal, Discord und Telegram nutzen Opus für Sprachnachrichten und Anrufe.
Trotz seiner technologischen Überlegenheit ist auch Opus kein neues MP3 geworden. In Consumer-Bereich fehlt die Sichtbarkeit und die meisten Nutzer kommen mit Opus nur in Berührung ohne es zu wissen: bei der Nutzung der vorgenannten Apps oder WEBM-Videos bei zum Beispiel YouTube.
WMA – Microsofts Ansatz mit DRM
WMA war Microsofts Versuch ein eigenes, verlustbehaftetes, Audioformat zu etablieren. WMA wurde im Jahre 1999 eingeführt und lieferte bei gleichen Bitraten etwa mit MP3 ebenbürtige Qualität. Was die Musikindustrie jedoch besonders freute: WMA bietet integriertes DRM (Digital Rights Management). So sollte die Weitergabe unterbunden werden. Microsofts Zune-Player setzten auf WMA, konnten sich aber nicht wirklich am Markt etablieren.
Heute ist WMA praktisch irrelevant geworden. Selbst Microsoft hat das Format aus seinen aktuellen Produkten zugunsten von AAC und MP3 aufgegeben. Heute sind WMA-Dateien meist aus älteren Musiksammlungen oder Sprachaufnahmen.
MP2 – MP3’s Eltern
MP2 (MPEG-1 Audio Layer II) ist der direkte Vorgänger von MP3 und wurde ebenfalls vom Fraunhofer IIS entwickelt. Obwohl MP2 im Consumer-Bereich längst von MP3 verdrängt wurde, ist das Format im Rundfunk nach wie vor fester Standard, denn DAB Radio und DVB-Fernsehton nutzen MP2 noch bis heute.[11]. Warum? Weil MP2 robuster gegen Störungen und Übertragungsfehler ist, und die lassen sich bei Funk bekanntlich nicht vermeiden.
AC3 (Dolby Digital) – Kinostandard
AC3 ist streng genommen eigentlich kein reines Audioformat, sondern ein Mehrkanal Audio-Codec von Dolby Labs. Es unterstützt bis zu 5.1-Kanal Surround-Sound und ist der Standard-Audiocodec auf DVDs, vielen Blu-Ray-Filmen und im digitalen Fernsehen (löst MP2 ab). [12] Auch zahlreiche Streaming-Dienste nutzen Dolby Digital oder den Nachfolger EAC3 (Enhanced AC3, auch Dolby Digital Plus genannt) für ihre Mehrkanal-Tonspuren. Reine .ac3-Dateien kommen sehr selten vor, der Codec wird meist in Video-Containern wie MKV oder MP4 genutzt.
Verlustbehaftete Musikformate im Vergleich
| Format | Erscheinungsjahr | Typische Bitrate | Lizenz | Haupteinsatz heute |
|---|---|---|---|---|
| MP3 | 1993 | 128-320 kbps | frei seit 2017 | Universal, Downloads, lokale Sammlung |
| AAC | 1997 | 128-256 kbps | patentiert (bis ~2028) | Apple, YouTube, Streaming |
| OGG Vorbis | 2002 | 96-320 kbps | frei | Spotify, Videospiele |
| Opus | 2012 | 6-510 kbps | frei | WebRTC, Messenger, YouTube |
| WMA | 1999 | 64-320 kbps | proprietär | kaum noch relevant |
| MP2 | 1993 | 128-384 kbps | frei seit 2017 | DAB-Radio, DVB-Fernsehton |
| AC3 | 1991 | 192-640 kbps | proprietär (Dolby) | DVD, Blu-ray, Streaming (Surround) |
Sprachformate
Sprache und Musik stellen grundlegend andere Anforderungen an den eingesetzten Audiocodec. Während menschliche Sprache nur den Frequenzbereich von etwa 200 bis 4.000 Hz benutzt, benötigt Musik eher 20 bis 20.000 Hz. Sprachcodecs können den kleineren Bereich gezielt ausnutzen um so bei sehr niedrigen Bitraten verständliche Ergebnisse zu liefern. Hinzu kommt oft die Anforderung nach einer niedrigen Verzögerung (Latenz), etwa bei Telefonie oder Videokonferenzen. Wer etwas älter ist wird sich sicher noch an schlechte Telefonverbindungen erinnern in denen man sich gegenseitig ins Wort fällt.
AMR – GSM-Mobilfunkstandard
AMR (Adaptive Multirate) wurde vom ETSI für GSM-Mobilfunknetze entwickelt und 1999 als 3GPP-Standard übernommen. [13] AMR ist mit einem Frequenzbereich von 200 bis 3400 Hz schmalbandig und kann, wie der Name schon impliziert, dynamisch zwischen 4,75 und 12,2 kbps an die verfügbare Bandbreite anpassen. Für Sprache ist das vollkommen ausreichend, für Musik jedoch gänzlich ungeeignet.
Android Geräte und ältere iOS-Versionen nutzen AMR als Standard für Sprachaufnahmen. Auch MMS-Sprachnachrichten und einige VoIP-Apps verwenden AMR. Zum Teilen sollten AMR-Dateien jedoch in MP3 oder AAC konvertiert werden, da nicht jeder Player AMR unterstützt.
3GP und 3GPP – beständige Nutzung
3GPP (Third Generation Partnership Project) ist ein Containerformat, das speziell für 3G-Mobiltelefone entwickelt und 2003 veröffentlicht wurde. 3GPP ist optimiert für wenig Speicherplatz und langsame Verbindungen.[14] Es basiert technisch auf dem MPEG-4 Part 12 Container und kann für Audio die Codecs AMR oder AAC verwenden.
3GPP ist zwar primär ein Videoformat, begegnet einem jedoch als reine Audiodatei. In Androids MediaRecorder-API ist das OutputFormat.THREE_GPP mit dem Encoder AMR_NB als Standard-Beispiel für Audioaufnahmen dokumentiert[15] und viele ältere und günstigere Android-Geräte nutzen dieses Format noch bis heute für Sprachaufnahmen. Auch Samsung verwendete lange die Dateiendung .3ga (3rd Generation Audio) für die Voice-Recorder-App. [16] Auch im MMS-Bereich sind .3gp-Dateien als Sprach- und Kurzvideo-Container nach wie vor verbreitet.
Die meisten 3GPP-Dateien, die heute im Umlauf sind, stammen jedoch von älteren Mobiltelefonen. Für die Weitergabe empfiehlt sich eine Umwandlung in MP3 für reine Tonaufnahmen oder MP4 für Videos. VLC und der Windows Media Player können .3gp-Dateien in der Regel ohne Probleme abspielen.
QTA (QuickTime Audio) – Apples Neuentwicklung
QTA ist Apples jüngstes Audioformat, eingeführt Ende 2024 mit iOS 18.2 für das iPhone 16 Pro und Pro Max. QTA ist eine Alternative für das bisherige .m4a-Format für Sprachmemos auf diesen Geräten ab und bringt eine grundlegende Neuerung mit: räumliches Audio (Spatial Audio).
Technisch basiert QTA auf First Order Ambisonics (FOA). Die vier Mikrofone des iPhone (ab iPhone 16) erfassen ein dreidimensionales Klangfeld das in vier „Kanälen“ gespeichert wird. Der dabei verwendete Codec heißt APAC (Apple Positional Audio Codec). APAC ist ein neuer, proprietärer Codec den Apple ursprünglich für immersives Video auf der Vision Pro (Apples VR-Brille) entwickelt hat. .[17] QTA-Dateien enthalten zusätzlich eine Stereo-AAC-Spur als Fallback für ältere Geräte.[18] Durch die räumlichen Audiodaten lassen sich Hintergrundgeräusche nachträglich besser isolieren und entfernen, beispielsweise in Logic Pro.[19]
QTA zeigt, wohin die Reise geht: weg von einfachen Mono- oder Stereo-Aufnahmen, hin zu räumlichem Audio, das nachträglich noch besser bearbeitet und an die Hörposition angepasst werden kann.
Opus als Sprachcodec
Opus habe ich bereits bei den Musikformaten vorgestellt, verdient im Sprachbereich aber eine eigene Erwähnung. Denn hier spielt Opus seine größte Stärke aus: Der Codec liefert bei 12-20 kbps bereits hervorragende Sprachqualität und ist gleichzeitig latenzarm genug für Echtzeitkommunikation. Opus ist heute der Standard-Sprachcodec in WebRTC[10] und damit in allen Browser-basierten Telefonie- und Videolösungen, in WhatsApp, Signal, Discord, Telegram und vielen weiteren Anwendungen. Es ist keine Übertreibung zu sagen, dass Opus der am häufigsten genutzte Sprachcodec im Internet ist, auch wenn wahrscheinlich die wenigsten Nutzer je davon gehört haben.
Verlustfreie und unkomprimierte Formate
Verlustfreie Formate speichern Audio ohne Qualitätsverlust. Die Originaldaten lassen sich also bitgenau rekonstruieren. Im Gegensatz zu MP3 oder AAC geht also nichts verloren. Der Preis dafür sind allerdings deutlich größere Dateien. Unkomprimierte Formate wie WAV erzeugen hierbei die größten Datenmengen.
FLAC – frei und verlustfrei
FLAC (Free Lossless Audio Codec) ist der mit Abstand populärste verlustfreie Audiocodec. Entwickelt wurde FLAC (wie Opus und Vorbis) von der Xiph.Org Foundation und ist seit 2001 verfügbar, vollständig offen und lizenzfrei.[20] FLAC komprimiert Audio, je nach Inhalt, verlustfrei auf etwa 50-70 % der Originalgröße.
FLAC hat sich als Standard in der audiophilen Szene etabliert und wird von Streaming-Diensten wie Tidal, Qobuz und Amazon Music für verlustfreies Streaming verwendet. Seit September 2025 bietet auch Spotify verlustfreies Streaming im FLAC-Format an (24 Bit / 44,1 kHz für Premium-Nutzer).[21] Android unterstützt FLAC nativ. Nur Apple hat sich gegen FLAC gesträubt, und nutzt ALAC:
ALAC – frei und verlustfrei mit „Apfelgeschmack“
ALAC (Apple Lossless Audio Codec) ist Apples Antwort auf FLAC. Eingeführt 2004, liefert ALAC eine vergleichbare Kompression und identische Qualität wie FLAC; schließlich sind beide verlustfrei. Seit 2011 ist ALAC Open Source [22], was die technischen Unterschiede zu FLAC endgültig auf die Container-Frage reduziert. ALAC wird in Apples .m4a-Container verpackt und ist nahtlos in iTunes, Apple Music und weitere Apple-Geräte integriert. Wer im Apple-Ökosystem verlustfrei hören will, kommt an ALAC praktisch nicht vorbei. Apple Music nutzt ALAC für sein „Lossless“-Angebot.[23] ALAC ist also FLAC mit Apfelgeschmack 😉 und spielt außerhalb der Apple-Welt keine Rolle, dort ist FLAC die erste Wahl.
WAV – Urgestein der Audiodateien
WAV (Waveform Audio File Format) wurde 1991 von Microsoft und IBM eingeführt und speichert unkomprimierte PCM-Audiodaten (Pulse Code Modulation). Aufgrund der Einfachheit des Formates stellt es keine großen Anforderung an die Rechenleistung und war in früheren Windows-Versionen der Standard beim integrierten Audio-Recorder. Noch heute ist WAV das Standard-Austauschformat in Tonstudios und bei der professionellen Audioproduktion. Die Qualität ist maximal, denn es findet keinerlei Kompression statt. Dafür sind die Dateien allerdings entsprechend groß: rund 10 MB pro Minute bei CD-Qualität (44,1 kHz, 16 Bit, Stereo).
Für die Archivierung oder den Transport von Musik ist WAV aufgrund der Dateigröße unpraktisch. Hier ist FLAC die bessere Wahl: gleiche Qualität, aber nur etwa die Hälfte der Dateigröße.
AIFF
AIFF (Audio Interchange File Format) ist das Apple-Pendant zu WAV. Entwickelt 1988 von Apple, basiert AIFF ebenfalls auf unkomprimierten PCM-Daten. Im Studio-Bereich auf dem Mac war AIFF lange die Standardwahl, wird heute aber zunehmend durch FLAC oder ALAC ersetzt. Technisch gibt es zwischen WAV und AIFF keinen klanglichen Unterschied, denn beide speichern die gleichen Rohdaten, nur in unterschiedlichen Container-Strukturen.
APE und WavPack
Neben FLAC und ALAC existieren weitere verlustfreie Codecs, die in bestimmten Nischen eine Rolle spielen. APE (Monkey’s Audio) erreicht eine etwas bessere Kompressionsrate als FLAC, ist aber deutlich rechenintensiver und wird nur von wenigen Playern unterstützt. In audiophilen Foren, besonders im asiatischen Raum, trifft man APE gelegentlich an.
WavPack bietet eine interessante Besonderheit: einen Hybrid-Modus, der eine verlustbehaftete und eine verlustfreie Schicht in separaten Dateien speichert. Wer nur die .wv-Datei behält, hat eine kompakte lossy-Version. Wer die .wvc-Korrekturdatei dazunimmt, kann das Original bitgenau rekonstruieren.[24] In der Praxis ist WavPack allerdings ähnlich selten anzutreffen wie APE.
Verlustfreie Formate im Vergleich
| Format | Kompression | Typische Dateigröße (3 Min.) | Lizenz | Haupteinsatz |
|---|---|---|---|---|
| FLAC | verlustfrei, ~50-70 % | ~15-20 MB | frei | Archivierung, Streaming (Tidal, Qobuz, Spotify), Android |
| ALAC | verlustfrei, ~50-70 % | ~15-20 MB | Open Source (seit 2011) |
Apple Music, iTunes, Apple-Geräte |
| WAV | keine (PCM) | ~30 MB | frei | Tonstudio, professionelle Produktion |
| AIFF | keine (PCM) | ~30 MB | frei | Mac-Studios, ältere Apple-Workflows |
| APE | verlustfrei, ~45-65 % | ~14-18 MB | frei | Nische, audiophile Sammler |
| WavPack | verlustfrei oder hybrid | ~15-20 MB | frei | Nische, Archivierung mit Hybrid-Option |
Container und Dateiendungen: das große Missverständnis
Eines der häufigsten Missverständnisse bei Audioformaten: die Dateiendung verrät nicht unbedingt, welcher Codec in der Datei steckt. Der Grund dafür ist das Container-Prinzip, bei dem der Container nur die äußere Hülle ist die den Codec beinhaltet.
M4A – ein Container, zwei Welten
M4A ist ein MPEG-4-Audio-Container und das beste Beispiel für diese Verwirrung: Eine .m4a-Datei kann verlustbehaftetes AAC-Audio oder verlustfreies ALAC-Audio enthalten. Von außen ist das nicht zu erkennen. Erst ein Blick in die Metadaten (z.B. mit ffprobe oder MediaInfo) zeigt den tatsächlichen Codec. Apple nutzt .m4a konsequent für beide Varianten, was regelmäßig zu Verwirrung führt, wenn Nutzer glauben, ihre gesamte iTunes-Bibliothek sei „verlustfrei“, obwohl die meisten Dateien AAC enthalten oder Dateien auf einem anderen Gerät plötzlich nicht abspielbar sind.
Die OGG-Familie
Die Geschichte der OGG-Dateiendungen ist ein lehrreiches Beispiel dafür, wie gut gemeinte Standards in der Praxis kollidieren können. Ursprünglich wurde .ogg für alle Inhalte im Ogg-Container verwendet. Als aber neben Vorbis-Audio auch Theora-Video und andere Codecs in den Container kamen, führte die Xiph.Org Foundation 2008 mit RFC 5334 differenzierte Endungen ein:[25]
| Endung | MIME-Type | Inhalt |
|---|---|---|
| .ogg | audio/ogg | Vorbis-Audio (Legacy) |
| .oga | audio/ogg | Beliebiges Audio im Ogg-Container |
| .opus | audio/ogg | Opus-Audio im Ogg-Container |
| .ogv | video/ogg | Video im Ogg-Container |
| OGX | application/ogg | Multiplexte Inhalte (Mischformen) |
In der Praxis sorgt diese Vielfalt bis heute für Probleme. Ein aktuelles Beispiel: Android 15 erzeugt .OGX-Dateien beim Download von .ogg-Dateien, wenn der Webserver den veralteten MIME-Type application/ogg statt audio/ogg sendet.[26] Die Dateien selbst sind völlig in Ordnung, nur die Endung stimmt nicht. Betroffen waren unter anderem Wikimedia und Fandom/Wikia. Details dazu in der Analyse: Das plötzliche Auftreten von OGX-Dateien.
WebM
WebM ist Googles offener Multimedia-Container, der auf dem Matroska-Format (MKV) basiert.[27] Für Audio nutzt WebM entweder Vorbis oder Opus als Codec und YouTube verwendet WebM/Opus für seine Audio-Streams. Reine WebM-Audiodateien sind im Alltag eher selten anzutreffen, der Container begegnet einem vor allem im Web-Kontext.
Audio-Sonderformate
MIDI
MIDI (.MID) fällt aus der Reihe: Eine MIDI-Datei enthält keine eigentlichen Audiodaten, sondern Steueranweisungen. Im Prinzip „Noten für den Computer“. Welche Töne gespielt werden, wie laut und wie lang, wird gespeichert, und wie das dann am Ende klingt, hängt vom Wiedergabegerät und dessen Klangerzeugung ab. Während eine MP3-Datei immer gleich klingt, ist MIDI „Interpretationssache“, genau wie einem Notenblatt, das von verschiedenen Musikern unterschiedlich gespielt wird.
MIDI findet heute vor allem in der Musikproduktion Verwendung, wo es als universelle Schnittstelle zwischen Software-Instrumenten, Synthesizern und DAWs (Digital Audio Workstations) dient. Die aktuelle Spezifikation MIDI 2.0 wurde 2020 verabschiedet und erweitert den Standard um höhere Auflösung und bidirektionale Kommunikation.[28] Auch im Karaoke-Bereich sind .mid-Dateien verbreitet: Sie enthalten neben den Noten häufig auch den Songtext.
DSD (DSF / DFF)
DSD (Direct Stream Digital) ist ein vollkommen anderer Ansatz zur digitalen Audioaufzeichnung. Während alle bisher genannten Formate auf PCM-Abtastung basieren (also Amplitudenwerte in regelmäßigen Zeitabständen), arbeitet DSD mit 1-Bit-Sigma-Delta-Modulation bei extrem hohen Abtastraten (2,8 MHz und höher, zum Vergleich: CD-Audio arbeitet mit 44,1 kHz).
DSD wurde von Sony und Philips für die Super Audio CD (SACD) entwickelt.[29] Ob DSD tatsächlich hörbar besser klingt als hochauflösendes PCM, ist unter Audiophilen umstritten. Sicher ist: Die Dateien sind sehr groß und die Softwareunterstützung begrenzt. DSD-Dateien tragen die Endung .dsf oder .dff und sind ausschließlich in der audiophilen Nische anzutreffen.
RealAudio
RealAudio (.ra, .ram) war in den späten 1990er- und frühen 2000er-Jahren das dominierende Format für Audio-Streaming im Internet und der RealPlayer war auf zahllosen Rechnern installiert. Heute ist der RealPlayer lange eingestellt (danke!), RealAudio vollständig bedeutungslos und abgelöst durch effizientere Codecs und universellere Streaming-Protokolle. Man begegnet .ra-Dateien nur noch bei alten Dateien.
CAF (Core Audio Format)
CAF ist Apples universeller Audio-Container, eingeführt mit macOS 10.4 (2005). CAF kann praktisch jeden Audiocodec aufnehmen und hat keine Dateigrößenbeschränkung, anders als WAV, das bei 4 GB an die Grenze des RIFF-Headers stößt.[30] In der Praxis begegnet man .caf-Dateien fast nur in der Apple-Entwicklung und bei der iOS-Programmierung.
Zusammenfassung
Gesamtübersicht aller Audioformate
| Format | Typ | Codec / Container | Lizenz | Typische Bitrate / Größe | Hauptverbreitung |
|---|---|---|---|---|---|
| MP3 | lossy | Codec | frei seit 2017 | 128-320 kbps | Universal |
| AAC | lossy | Codec (oft in M4A) | patentiert (~2028) | 128-256 kbps | Apple, YouTube, Streaming |
| OGG Vorbis | lossy | Codec in OGG-Container | frei | 96-320 kbps | Spotify, Videospiele |
| Opus | lossy | Codec (OGG oder WebM) | frei | 6-510 kbps | WebRTC, Messenger, YouTube |
| WMA | lossy | Codec + Container | proprietär | 64-320 kbps | veraltet (Windows) |
| MP2 | lossy | Codec | frei seit 2017 | 128-384 kbps | DAB-Radio, DVB |
| AC3 | lossy | Codec | proprietär (Dolby) | 192-640 kbps | DVD, Blu-ray, Surround |
| AMR | lossy (Sprache) | Codec | patentiert | 4,75-12,2 kbps | Mobilfunk, Sprachaufnahmen |
| 3GPP | lossy (Sprache/Video) | Container (AMR/AAC) | frei | variabel | Mobiltelefone, MMS, ältere Android-Geräte |
| QTA | lossy + Spatial | Container (AAC + APAC) | proprietär (Apple) | ~560 kbps (gesamt) | iPhone 16 Pro Sprachmemos |
| FLAC | lossless | Codec + Container | frei | ~700-1000 kbps | Archivierung, Tidal, Qobuz, Spotify |
| ALAC | lossless | Codec (in M4A) | Open Source | ~700-1000 kbps | Apple Music |
| WAV | unkomprimiert | Container (PCM) | frei | ~1411 kbps (CD) | Tonstudio, Produktion |
| AIFF | unkomprimiert | Container (PCM) | frei | ~1411 kbps (CD) | Mac-Studios |
| MIDI | Steuerdaten | Kein Audio | frei | wenige KB | Musikproduktion, Karaoke |
| DSD | 1-Bit lossless | Codec (DSF/DFF) | patentiert | ~5600 kbps (DSD64) | Audiophile Nische, SACD |
Warum nutzen wir, was wir nutzen?
Wer die Formatvielfalt verstehen will, muss die Ökosysteme dahinter verstehen. Die Verbreitung eines Audioformats hängt nur bedingt von seiner technischen Qualität ab, viel entscheidender sind Timing, Patente und die Marktmacht der Unternehmen, die ein Format unterstützen.
Warum ist MP3 noch immer dominant?
MP3 hatte einen Zeitvorsprung von fast einem Jahrzehnt gegenüber seinen Alternativen. Als AAC und OGG Vorbis erschienen, war MP3 bereits der universelle Standard und jedes Gerät, jede Software, jedes Betriebssystem konnte MP3 abspielen. Dazu kommt, dass MP3 seit 2017 vollständig patentfrei ist.[2] Es gibt schlicht keinen zwingenden Grund auf ein anderes Format zu wechseln.
Apple: das geschlossene Ökosystem
Apple setzt konsequent auf eigene oder von Apple bevorzugte Formate: AAC für verlustbehaftete Musik (iTunes Store, Apple Music), ALAC für verlustfreies Streaming (Apple Music Lossless)[23], und seit Ende 2024 QTA mit dem proprietären APAC-Codec für räumliche Sprachaufnahmen.[17] Diese Strategie hat Methode: Apple kontrolliert den gesamten Stack vom Codec über den Container bis zum Endgerät. Das garantiert eine nahtlose Integration und bindet Nutzer an das Ökosystem. Bezeichnend ist, dass Apple FLAC bis heute nicht nativ unterstützt, obwohl es technisch keinen Grund gibt, es nicht zu tun.
Google: der offene Ansatz
Google verfolgt eine andere Strategie und setzt auf offene Formate wie OGG Vorbis und Opus im WebM-Container.[27] YouTube nutzt Opus für seine Audio-Streams, Android unterstützt FLAC, Opus und Vorbis nativ. Google finanziert die Entwicklung von Opus sogar aktiv mit und treibt die Verbreitung über WebRTC voran.[10] Der Nachteil des offenen Ansatzes: es fehlt die enge vertikale Integration, die Apple bietet. Nicht jedes Android-Gerät behandelt alle offenen Formate gleich gut, und die Fragmentierung des Android-Ökosystems sorgt regelmäßig für Kompatibilitätsprobleme, wie das OGX-Beispiel unter Android 15 gezeigt hat.[26]
Streaming-Dienste: Wer nutzt was?
| Streaming-Dienst | Format (Standard) | Format (HiFi/Lossless) |
|---|---|---|
| Spotify | OGG Vorbis (bis 320 kbps)[8] | FLAC (24 Bit/44,1 kHz, seit 09/2025)[21] |
| Apple Music | AAC 256 kbps | ALAC (bis 24 Bit/192 kHz)[23] |
| YouTube Music | Opus (in WebM) | – |
| Tidal | AAC 320 kbps | FLAC (bis 24 Bit/192 kHz) |
| Amazon Music | AAC | FLAC (HD/Ultra HD) |
| Qobuz | – | FLAC (bis 24 Bit/192 kHz) |
| Deezer | MP3 128 kbps | FLAC (CD-Qualität) |
Die vorstehende Streaming-Tabelle zeigt das Muster deutlich: Apple setzt auf AAC und ALAC, Google auf Opus, und der Rest der Branche schwankt zwischen AAC und FLAC. Spotify war lange ein Sonderfall mit OGG Vorbis als einzigem verlustbehafteten Format, hat 2025 aber mit FLAC für die verlustfreie Wiedergabe nachgezogen.
Fazit: Welches Format für welchen Zweck?
Das „beste“ Audioformat gibt es nicht, aber für jeden Einsatzzweck gibt es eine sinnvolle Wahl:
| Einsatzzweck | Empfehlung | Grund |
|---|---|---|
| Musik hören (allgemein) | MP3 oder AAC | Universelle Kompatibilität, gute Qualität ab 192 kbps |
| Musik archivieren | FLAC | Verlustfrei, offen, breite Unterstützung |
| Musik im Apple-Ökosystem | AAC / ALAC | Nahtlose Integration in iTunes und Apple Music |
| Sprachaufnahmen | MP3 oder AAC | Gute Kompatibilität beim Weitergeben |
| Web und Streaming | Opus | Beste Effizienz, offen, WebRTC-Standard |
| Professionelle Produktion | WAV oder AIFF | Unkomprimiert, maximale Flexibilität |
| Maximale Kompatibilität | MP3 | Wird von jedem Gerät und jeder Software unterstützt |
Die Welt der Audioformate ist über die Jahrzehnte gewachsen und wird es weiter tun. Neue Entwicklungen wie Apples QTA zeigen, dass die Reise noch längst nicht vorbei ist, denn räumliches Audio und adaptive Codecs werden in den kommenden Jahren sicher weiter an Bedeutung gewinnen. Für den Alltag gilt jedoch: Mit MP3 und FLAC ist man auf der sicheren und kompatiblen Seite.
Quellen
[1] Fraunhofer IIS: mp3 – Übersicht und Geschichte
[2] Fraunhofer IIS Audio Blog: Alive and Kicking – mp3 Software, Patents and Licenses (2017)
[3] LAME MP3 Encoder
[4] Fraunhofer IIS: MP3 and AAC Explained (PDF, AES-17-Conference)
[5] Wikipedia: Advanced Audio Coding – Technical Details
[6] Via Licensing (ehem. Access Advance): AAC Patent Portfolio
[7] Xiph.Org Foundation: Vorbis – Open Audio Codec
[8] Spotify Support: Audio Quality
[9] RFC 6716: Definition of the Opus Audio Codec (IETF, 2012)
[10] W3C: WebRTC 1.0 – Real-Time Communication Between Browsers
[11] ETSI: Digital Audio Broadcasting (DAB) Standards
[12] Dolby: Dolby Digital – Technologie-Übersicht
[13] 3GPP: Media Codecs – AMR Speech Codec
[14] 3GPP: Specifications – 26 Series (Codecs und Medienformate)
[15] Android Developers: MediaRecorder.OutputFormat – THREE_GPP
[16] Samsung Community: Voice Recorder und 3gp4 Codec (M4A/3GA)
[17] Apple Developer: Apple Positional Audio Codec (PDF)
[18] Online-Umwandeln.de: QTA Dateiformat – ffprobe-Analyse
[19] Apple Support: Apply Spatial Playback Processing to QTA Files in Logic Pro
[20] Xiph.Org Foundation: FLAC – Free Lossless Audio Codec
[21] Spotify for Artists: Audio File Formats (FLAC-Unterstützung)
[22] Apple Lossless Audio Codec – Open Source (GitHub/macOS Forge)
[23] Apple Support: About Lossless Audio in Apple Music
[24] WavPack: Technical Documentation – Hybrid Mode
[25] RFC 5334: Ogg Media Types (IETF, 2008)
[26] Online-Umwandeln.de: Das plötzliche Auftreten von OGX-Dateien – eine Analyse (2026)
[27] The WebM Project – An Open Web Media Project
[28] MIDI Association: Details About MIDI 2.0
[29] Sony: Super Audio CD – Overview
[30] Apple Developer Documentation: Core Audio Format
Zuletzt aktualisiert am 23. April 2026 von
Keine Kommentare