Eines der größten Probleme der digitalen Bilddatenverarbeitung sind die enormen Datenmengen, die dabei prinzipbedingt anfallen und die, wenn man sie nicht mittels Kompression in den Griff bekommt, selbst moderne Hochleistungs-IT in die Knie zwingen. Das Problem dabei: Die auf den Kamerasensor abgebildeten Lichtsignale werden in Bildpunkte umgewandelt, für die jeweils Farb- und Helligkeitsinformationen gespeichert werden müssen. Bei der gängigen VGA-Auflösung bedeutet das 640 Punkte horizontal mal 480 Punkte vertikal, was 307200 Bildpunkte (Pixel) ergibt. Bei vollfarbigen Bildern werden die Farb- und Helligkeitsinformationen mit 24 Bit (= 3 Byte) pro Bildpunkt gespeichert. Das ergibt 921600 zu speichende Byte pro Bild, also 0,9 MB. Ein Wert, den unkomprimierte .bmp-Dateien auch erreichen. Wollte man nun einen flüssigen Film mit 25 Bildern pro Sekunde aufnehmen, so erhielte man 22,5 MB/s. Eine Stunde Aufzeichnung brächte es so auf 81 GB – über 14 DVDs voll. Bei einer Megapixel-Auflösung von 1280 x 960 Bildpunkten vervierfacht sich die Datenmenge. Das Bild hat über eine Million Pixel, jedes Bild 3,6 MB und eine Standard-DVD mit 5,7 GB Kapazität wäre bereits nach 63 Sekunden gefüllt – geschweige denn, dass es überhaupt ein Netzwerk gäbe, über das sich 90 MB/s übertragen ließen. Datenkompression ist also essentiell.
Motion-JPEG
Bei Bildern hat sich als Standard das JPEG-Bildformat durchgesetzt. Man findet es heute in jeder digitalen Fotokamera. Dabei werden die Farbinformationen nicht für jeden einzelnen Bildpunkt gespeichert, sondern Gruppen gleicher oder ähnlicher, nebeneinander liegender Farben gebildet. Je mehr gleichmäßige Farbflächen ein Bild hat, umso stärker lässt es sich komprimieren. Zudem lässt sich die Kompressionsstärke einstellen. Simpel gesagt werden hierbei Farbverläufe und Kanten zu gleichfarbigen Blocks „vereinfacht“, wodurch die Schärfe und Erkennbarkeit des Bildes sinkt, die Kompressionsrate aber deutlich steigt. Ein Megapixelbild lässt sich mit hoher JPEG-Qualität (80 % JPEG) auf durchschnittlich 213 kB (statt 3,6 MB) verkleinern und hat hierbei noch eine sehr gute Bildqualität. Bei mittlerer Qualität (50 % JPEG) kommt man auf etwa 120 kB und bei geringer Qualität (20 % JPEG) auf gut 70 kB. Bei letzterer Qualitätsstufe ist die Erkennbarkeit von Gesichtern oder Nummernschildern allerdings oft nicht mehr gegeben.
Wenn man nun diese JPEG-Bilder aneinanderreiht, erhält man ein bewegtes Bild im so genannten Motion-JPEG-Format (MJPEG). Mit 3 MB/s (25 Bilder pro Sekunde in mittlerer Qualität) ist die Datenrate um den Faktor 30 geringer als bei unkomprimierten Bildern und damit erstmals handhabbar. Senkt man die Bildrate auf 10 Bilder pro Sekunde, hat man Datenmengen, die heutige IT einigermaßen bewältigen kann.
MPEG-Variationen
Um die Datenmengen weiter zu reduzieren und dennoch flüssige 25 Bilder pro Sekunde zu generieren, muss man weitere Kompressionstricks anwenden. Eine Methode ist – wiederum sehr vereinfacht dargestellt – die, nur jene Bildteile zu speichern, die sich im Vergleich zum vorherigen Bild geändert haben. Bei sehr ruhigen Hintergründen kann das tatsächlich nur das bewegte Objekt sein, meist müssen Hintergrundbewegungen wie Passanten oder bewegte Bäume mit codiert werden.
Nach einem ersten Standard von 1991 (MPEG-1), der den damals schnell steigenden Qualitätsansprüchen nicht genügen konnte, fand der 1994 etablierte Standard MPEG-2 weite Verbreitung. Er basiert auf MPEG-1, vollzieht die Bildanalyse aber in feineren Strukturen. Außerdem eignet er sich für das beim Fernsehen übliche Zeilensprungverfahren. Der folgene MPEG-Standard sollte gute Ergebnisse bei Datenraten unter 64 kBit/s ermöglichen, wie sie im damals üblichen ISDN möglich waren, und in der Bildtelefonie oder für Videoanwendungen im Internet interessant sind. Bei dem MPEG-4 genannten Standard (MPEG-3 wurde aufgegeben) wird das Bild in statische und bewegte Elemente sowie räumliche Ebenen aufgelöst. Die Objekte werden auf getrennten Kanälen digital verarbeitet und zeitgleich komprimiert. Seine Algorithmik überzeugt durch eine gute Bildqualität bei wesentlich geringerem Speicherbedarf als MPEG-2. Allerdings gibt es bei MPEG-4 unterschiedliche Profile und die generierten Daten sind vom verwendeten Codec abhängig. Codec steht für Encoder/Decoder und ist ein Software-Element, das die Kompression und Dekompression des Datenstroms übernimmt. Verschiedene Codecs können unterschiedliche Werte für Bitraten und Qualitätseinstellungen aufweisen. MPEG-4 Part 2 „Simple Profile“ (SP) ist global gesehen das heute wohl am meisten eingesetzte Kodierungsverfahren. In MPEG-4 SP erstellet Datenströme sind in den meisten Software-Playern abspielbar (VLC, Quicktime, Real Player usw). MPEG-4 Part 2 Advanced Simple Profile (ASP) basiert darauf. Auch in MPEG-4 ASP erstellte Datenströme können in vielen Playern abgespielt werden. MPEG-4 ASP ist in der Lage, Datenströme im Interlaced-Format zu verarbeiten, wie es von analogen Kameras geliefert wird. Es bietet nach starken Bildbewegungen schärfere Bilder, auf Kosten eines um 10 bis 15 % höheren Bedarfs an Rechenleistung. Der recht neue MPEG-4 Advanced Video Codec (AVC) ist unter dem Projektnamen H.264 bekannt. Ziel des Projektes war es, ein Kompressionsverfahren zu entwerfen, das im Vergleich zu bisherigen Standards sowohl für mobile Anwendungen als auch im TV- und HD-Bereich die benötigte Datenrate bei gleicher Qualität mindestens um die Hälfte reduziert. Das klappt, allerdings steigt die nötige Rechenleistung deutlich. Auch H.264 existiert auf dem Markt in Variationen. Der Einsatz eines Encoders von Hersteller A und eines Decoders von Hersteller B ist heute im Regelfall allerdings noch nicht möglich.
Spezialfall Videoüberwachung
Eines ist den MPEG-Kompressionsverfahren gemein: Sie wurden nicht für die Videoüberwachung entwickelt, sondern für Film- und Fernsehbilder. Das zeigt sich an verschiedenen Stellen: Sie sind rechenintensiv. Es ist für die Erstellung einer DVD egal, wie lange das Codieren der Daten dauert. Das wird an einem Großrechner durchgeführt. In der Videoüberwachung muss diese Codierung heute durch die Kamera erbracht werden, deren Rechenleistung begrenzt ist. Das zweite Problem liegt darin, dass bei MPEG bewegte Objekte mit geringer Qualität kodiert werden, da das menschliche Auge im Film die Details eines fahrenden Fahrzeugs ohnehin nicht erkennen kann. In einer Sicherheitsanwendung haben aber gerade bewegte Objekte eine hohe Relevanz und müssen in guter Qualität zum Monitor übertragen werden – auch um fahndungsfähige Standbilder zu erhalten.
Daher wurden Spezialformate für die Videoüberwachung entwickelt, etwa MxPEG von Mobotix oder MPEG4CCTV von Geutebrück. MxPEG basiert auf dem MJPEG-Verfahren. Anders als dieses überträgt MxPEG von einem Bild aber nur die Teile, die sich zum vorangegangenen Bild verändert haben, diese aber in JPEG-Qualität. Gegenüber einer MJPEG-Darstellung reduziert sich der Speicherbedarf so um den Faktor 3 bis 5. MPEG4CCTV basiert auf MPEG, ist aber ebenfalls auf die hohe Qualität bewegter Bilder optimiert.
Ausblick
Welcher Standard für Videoüberwachung der beste ist, lässt sich schwer sagen. Die ONVIF-Initiative (Open Network Video Interface Forum), ein Zusammenschluss von Herstellern digitaler Überwachungstechnik, hat sich auf H.264 fokussiert. Hohe Qualität bei geringer Datenrate ist hier möglich, zudem werden die Multimediastandards konsequent weiterentwickelt. Allerdings schreckt manche Hersteller die nötige Rechenleistung ab. Spezielle Hardware-Komponenten wie digitale Signalprozessoren (DSPs) mit angepassten Codecs lösen aber auch dieses Problem.
• more@click-Code: SI029709
