Eine Sichtweise geht vom Informationsträger aus. Die Frage welche Struktur sich innerhalb dieses Trägers feststellen lässt wird untersucht.
Der andere Ansatz bemüht sich zu verstehen, welche Bedeutung dem zukommt, was man dann (irgendwie) diesem Informationsträger entnommmen hat.
Die erste Sichtweise hat ihre Wurzeln in der Nachrichtentechnik, die zweite in den Kognitionswissenschaft, der Sprachwissenschaft oder allgemein in der Geisteswissenschaft. Eine nachrichtentechnisch erkennbare Struktur (beispielsweise Lichtimpulse, die in einer zeitlichen Reihenfolge auf einzelne Zellen in der Netzhaut treffen) muss in einem komplexen Dekodierungsprozess in eine Bedeutung übersetzt werden.
Wo hier die reine Strukturinformation aufhört, und beginnt, eine Bedeutungsinformation zu werden, wo also in diesem Dekodierungsprozess die Grenze zum Bewusstsein zu ziehen ist, ist eine der spannenden Fragen der Informations- und Kognitionswissenschaften. Je tiefer man die Grenze ansetzt, um so metaphysischer wird die strukturelle Information. Als Beispiel sei die DNA erwähnt: Ist die in der DNA gespeicherte Erbinformation nur Struktur oder schon Bedeutung? Oder wird sie vielleicht erst zur Bedeutung, indem sie benutzt wird, also zur Herstellung von Proteinen dient?
Aus diesen Betrachtungen ergeben sich vier Ebenen, unter denen der Begriff der
Information heute allgemein betrachtet wird. Diese sind
- Codierung
- Syntax
- Semantik
- Pragmatik
Diese Ebenen steigern sich im Hinblick auf den Bedeutungsgehalt der Information. Sie spiegeln dabei auch die oben erwähnten theoretischen Angriffspunkte wider, wobei die Codierungs-Ebene der Sichtweise der Nachrichtentechnik nahekommt, die Syntaxebene die Sichtweise der Linguistik oder der Theorie der formalen Sprachen wiedergibt, die semantische Ebene Ansätze aus der Semiotik oder Semantik integriert, und die Pragmatik eher auf Konzepte der Kognitionswissenschaften zurückgreift.
Die vier Ebenen sollen an der Zeichenfolge "ES IST WARM" erläutert werden:
Code-Ebene Die Zeichenfolge "ES IST WARM" ist zu kurz für eine statistische Betrachtung. Bei längeren Texten wird aber klar, dass nicht alle Elemente der Zeichenfolge (Buchstaben) gleich häufig vorkommen. Gewisse Buchstaben wie zum Beispiel die Buchstaben e und t - in unserem Beispiel aber s - sind häufiger als andere. Diese Tatsache kann bei der Informationsübertragung genutzt werden um Übertragungszeit zu sparen. Als Beispiel seien die Huffman-Codes erwähnt. Sie stellen ein Verfahren dar mit dem Information effizient übermittelt und gespeichert werden kann. Viele weitere Verfahren existieren. Auf dieser Ebene sind auch Fragen nach der Wahl von optimalen Codes für einen bestimmten Zweck interessant (Chiffrierung, ASCII-Code, Unicode, Braille-Schrift, Flaggenalphabet, Genetischer Code, ...)
Syntaktische Ebene der Information Auf der syntaktischen Ebene wird Information nur als Struktur gesehen, die es zu übermitteln gilt. Der Inhalt der Information ist hierbei im Wesentlichen uninteressant. Beispielsweise könnte das Problem darin bestehen, das Bild einer Kamera auf einen Monitor zu übertragen. Das Übertragungssystem interessiert sich dabei beispielsweise nicht dafür, ob es das Bild überhaupt wert ist, übertragen zu werden (Einbrecher macht sich am Fenster zu schaffen) oder nicht (Katze läuft am Fenstersims entlang), oder ob überhaupt etwas zu erkennen ist (auch das Bild einer komplett unscharf eingestellten Kamera wird vollständig übertragen, obwohl es da eigentlich nichts erkennbares zu sehen gibt). Der Informationsgehalt ist dabei ein Maß für die maximale Effizienz, mit der die Information verlustfrei übertragen werden kann.
Unterscheidbarkeit und Informationsgehalt Grundprinzip der syntaktischen Information ist die Unterscheidbarkeit: Information enthält, was unterschieden werden kann. Eine Unterscheidung setzt jedoch mindestens zwei unterschiedliche Möglichkeiten voraus.
Sind es genau zwei Möglichkeiten, so lässt sich die Unterscheidung mit einer einzigen Ja/Nein-Frage klären. Beispiel: Angenommen, auf einer Speisekarte gibt es nur zwei Gerichte, Schnitzel und Spaghetti. Um herauszufinden, was jemand bestellt hat, braucht man ihm nur eine einzige Frage zu stellen: "Haben Sie Schnitzel bestellt?" Lautet die Antwort "Ja", so hat er ein Schnitzel bestellt, lautet die Antwort "Nein", so hat er Spaghetti bestellt (denn etwas anderes gibt es ja nicht zu bestellen).
Sind hingegen mehr als zwei Möglichkeiten vorhanden, so kann man dennoch mittels Ja-Nein-Fragen herausfinden, welche Alternative zutrifft. Eine einfache Möglichkeit wäre, einfach der Reihenfolge nach alle Gerichte abzufragen. Jedoch ist das eine recht ineffiziente Methode: Wenn ein Gericht gegen Ende der Speisekarte bestellt wurde, braucht man sehr viele Fragen, um es herauszufinden. Günstiger ist es, wenn man beispielsweise erst fragt: "Haben Sie ein Fleischgericht bestellt?", um dann konkreter zu werden, "War es Schweinefleisch?", so dass schließlich nur noch wenige Alternativen übrig bleiben ("War es Schweineschnitzel?", "Schweinebraten?", "Schweinshaxe?").
Auch die Wahrscheinlichkeiten spielen bei einer optimalen Fragestrategie eine Rolle: Wenn man beispielsweise weiß, dass die Hälfte aller Gäste Schweineschnitzel bestellt, so ist es sicher sinnvoll, erst einmal nach Schweineschnitzel zu fragen, bevor man den Rest der Karte durchgeht.
Der Informationsgehalt einer Struktur bestimmt sich nun dadurch, wieviele Ja-Nein-Fragen man im Mittel bei einer idealen Fragestrategie braucht.
Interessant ist hierbei, dass zwar vordergründig keinerlei semantische oder pragmatische Informationen verwendet werden, diese jedoch implizit in Form der Wahrscheinlichkeit dennoch eingehen. Beispielsweise ist die Tatsache, dass 50% der Gäste Schweineschnitzel bestellen, nicht aus der Speisekarte zu erkennen; es ist eine pragmatische Information. Und dass man normalerweise nicht nach der Bestellung von "Wir wünschen Ihnen einen guten Appetit" fragt, folgt aus der semantischen Information, dass dies keine Speise ist, und es daher höchst unwahrscheinlich ist, dass jemand dies bestellt.
Binarisierung und die Wahrscheinlichkeit von Zeichen Die Zeichenfolge "ES IST WARM" enthält nur Großbuchstaben. Wenn wir einmal nur davon ausgehen, dass wir nur Großbuchstaben zur Verfügung hätten (also 27 Buchstaben einschließlich Leerzeichen), so können wir an jeder der elf Stellen der obigen Nachricht eines der 27 Zeichen setzen. Jede Stelle der Nachricht hat also 27 mögliche "Zustände". Man kann dies nun dahingehend verallgemeinern, dass man die Zustände binarisiert, also in mehrere Unterscheidungen zwischen exakt zwei möglichen Zuständen unterteilt, die man durch eins und null darstellt. Diese kleinstmögliche Unterscheidung zwischen zwei Zuständen wird als Bit bezeichnet. Man kann zum Beispiel den Buchstaben A durch "00001", B durch "00010", C durch "00011", D durch "00100", E durch "00101" darstellen, und so weiter bis zum Leerzeichen "11100".
Unsere Nachricht hieße dann "00101 10011 11100 01001 10011 10100 11100 ... 01101".
Jede Stelle hat jetzt also den Informationsgehalt von 1 Bit. Um einen unserer 27 Buchstaben zu codieren, braucht man, wie zu sehen ist, genau fünf Bit: Es muss fünf mal die Unterscheidung zwischen ja und nein getroffen werden, bis klar ist, um welchen Buchstaben es sich handelt.
Nun ist die obige Codierung der Buchstaben in fünf Ja/Nein-Entscheidungen nicht die allein gültige. Im Rahmen der klassischen Informationstheorie wird nämlich der Informationsträger in einem semantischen Kontext betrachtet. So kann berücksichtigt werden, wie häufig ein bestimmtes Zeichen des Zeichenvorrats verwendet wird, mit anderen Worten, wie wahrscheinlich sein Auftreten ist. So ist beispielsweise der Buchstabe "E" im Deutschen häufiger als der Buchstabe "Y". (Wichtig ist an dieser Stelle festzuhalten, dass der Zeichenvorrat für jede syntaktische Betrachtung bekannt sein muss, dass Information also bereits zur rein syntaktischen Aufbereitung im Rahmen eines semantischen Kontextes betrachtet werden muss.)
Berücksichtigt man diese Auftretenswahrscheinlichkeit der Zeichen im Zeichenvorrat, so kann man die Anzahl der benötigten Ja/Nein-Entscheidungen, die zum Erkennen eines Zeichens notwendig sind, je nach Zeichen unterschiedlich groß machen. Technisch lässt sich ein solcher Code zum Beispiel nach dem Huffman-Verfahren entwickeln.Damit benötigt man, um ein häufig auftretendes Zeichen zu codieren, weniger Bits, als für ein selten auftretendes Zeichen. Ein Zeichen hat also einen um so höheren Informationsgehalt (benötigt zur Erkennung eine höhere Anzahl an atomaren Entscheidungseinheiten, an Bits), wenn es in einem semantischen Kontext seltener auftritt.
Kommunikationsmodell der Information Das Verständnis der syntaktischen Ebene war lange Zeit gekennzeichnet durch das Sender-Empfänger-Modell: Ein Sender will eine Information dem Empfänger mitteilen. Dazu codiert er seine Information nach bestimmten Prinzipien (beispielsweise als Abfolge von Nullen und Einsen nach dem oben erwähnten Prinzip) in einen Informationsträger, der Empfänger wertet diesen Informationsträger aus, denn auch er kennt den Code, und erhält dadurch die Information.
Nicht immer ist jedoch ein Sender vorhanden, der uns etwas mitteilen will. Ein typisches Beispiel ist die Messung: Dem physikalischen System ist es, bildlich gesprochen, völlig egal, was wir von ihm denken. Dennoch ist das Ziel der Messung eine Informationsübertragung vom gemessenen System zu dem, der die Messung durchführt (man misst, um etwas über das gemessene System zu erfahren). Ein Beispiel ist die Geschwindigkeitsmessung per Radarfalle: Das Auto hat sicher keine Intention, seine Geschwindigkeit zu verraten (und der Autofahrer meist auch nicht). Dennoch gewinnt der Polizist durch die Messung Information über die Geschwindigkeit. Hier ist die Codierung nicht Folge einer Planung, sondern eines physikalischen Gesetzes (Dopplereffekt).
Zusammengefasst:
- Damit Information vorliegt muss Materie oder Energie eine Struktur aufweisen.
- Syntaktisch entspricht Information der Auftretenswahrscheinlichkeit eines bestimmten Symbols innerhalb eines definierten Dekodierungsschemas
- Information ist eine räumliche oder zeitliche Folge physikalischer Signale, die mit bestimmten Wahrscheinlichkeiten oder Häufigkeiten auftreten.
- Der Informationsgehalt einer Nachricht ergibt sich aus der Anzahl der ja/nein-Möglichkeiten, für die in der Nachricht einer der Werte festgelegt ist.
Semantische Ebene der Information Strukturierte, syntaktische Informationen werden erst verwertbar, indem sie gelesen und interpretiert werden. Das heißt, zur Strukturebene muss die Bedeutungsebene hinzukommen. Dazu muss ein bestimmtes Bezugssystem angelegt werden, um die Strukturen in eine Bedeutung überführen zu können. Dieses Bezugssystem bezeichnet man als Code. Im obigen Beispiel muss man also "wissen", dass die Nachricht aus den Buchstaben "A" bis "Z" und dem Leerzeichen bestehen kann. Man hätte wenig Erfolg, den gleichen Code an eine Nachricht anzulegen, die chinesische Schriftzeichen darstellen soll.
Jedoch ist die Überführung von Syntax in Semantik selten so direkt; in der Regel wird die Information über sehr viele unterschiedliche Codes immer höherer semantischer Ebene verarbeitet: Dabei wird auf den unterschiedlichen semantischen Ebenen wiederum Informationsverarbeitung auf strukturell-syntaktischer Ebene geleistet: Die Lichtimpulse, die gerade auf Ihre Netzhaut treffen, werden dort von Nervenzellen registriert (Bedeutung für die Nervenzelle), an das Gehirn weitergeleitet, in einen räumlichen Zusammenhang gebracht, als Buchstaben erkannt, zu Worten zusammengefügt. Während dieser ganzen Zeit werden Nervenimpulse (also Strukturinformationen) von einer Gehirnzelle zur nächsten geschossen, bis sich auf diese Weise in ihrem Bewusstsein die durch Worte nur unzureichend wiedergebbaren Begriffe für "warm", "jetzt", und "hier" zu formen beginnen, die dann im Zusammenhang eine Bedeutung haben: Sie wissen jetzt, dass es bei diesen Worten um die Feststellung geht, dass es warm (und nicht etwa kalt) ist.
Zusammengefasst:
- Strukturinformation wird in einem Dekodierungsprozess in Semantik (Bedeutung) überführt.
- Dabei wird Strukturinformation stufenweise über Codes in andere Strukturinformation überführt, wobei sich auf den unterschiedlichen sematischen Stufen jeweils Bedeutung für das verarbeitende System entwickelt.
- Information ist übertragbar, beispielsweise als Nachricht; Auskunft; Belehrung, Aufklärung
- Information kann weitergegeben werden, ohne dadurch weniger zu werden. Information wird durch Weitergabe also quasi verdoppelt. Mit Materie oder Energie geht das nicht.
Pragmatische Ebene der Information Diese kommt dem umgangssprachlichen Informationsbegriff am nächsten. Die Aussage, dass es warm ist (die wir nun semantisch richtig interpretiert haben, wir wissen, was diese Botschaft uns sagen will), hat echten Informationscharakter, wenn wir uns mittags um zwölf nach einer durchzechten Nacht noch halb schlaftrunken überlegen was wir anziehen sollen, und uns die Freundin mit den Worten "es ist warm" davon abhält, in den Rollkragenpullover zu schlüpfen. Der pragmatische Informationsgehalt der - semantisch exakt gleichen - Aussage ist aber gleich null, wenn wir bereits im T-Shirt auf dem Balkon sitzen und schwitzen. Diese Information bietet uns nichts neues. Smalltalk ist eine Art des Informationsaustausches, bei dem die offensichtlich über die Sprache ausgetauschten semantischen Informationen so gut wie keine pragmatische Information darstellen - wichtig sind hier die Körpersignale, deren Semantik (Freundlichkeit, Abneigung) wir erkennen und pragmatisch (mag er/sie mich?) verwerten können.
n diesem pragmatischen Sinne ist wesentliches Kriterium von Information, dass sie das Subjekt, das die Information aufnimmt, verändert, was konkret bedeutet, dass sich die Information, die potentiell dem Subjekt entnommen werden kann, verändert.
Zusammengefasst:
- Information ist ein Gewinn an Wissen
- Information ist die Verringerung von Ungewissheit
- Information ist eine Mitteilung, die den Zustand des Empfängers ändert.
Zyklische Verschränkung der Ebenen Die drei genannten Ebenen sind jedoch nicht getrennt zu betrachten. Vielmehr stellen sie sozusagen - man verzeihe das schräge Bild - die drei Seiten der selben Medaille dar: Bereits die strukturelle Ebene setzt eine Semantik voraus, innerhalb derer die Symbole dekodiert werden: Die Struktur der DNA codiert im Rahmen des Genetischen Codes bestimmte Proteine: Um diese Struktur innerhalb der DNA überhaupt zu erkennen, muss bereits die Semantik des genetischen Codes berücksichtigt werden. Denn das DNA-Molekül kann durchaus noch andere Informationen tragen: So ist zum Beispiel die "Doppelhelixstruktur" der Ausdruck einer anderen Semantik, nämlich der des räumlichen Erscheinungsbildes des Moleküls. Auch stellt die semantische Verarbeitung (beispielsweise das Zusammenfassen von Buchstaben zu Wörtern) wiederum syntaktische Information (nämlich eine Abfolge von Wort-Symbolen) her. Letztlich definiert sich auch die pragmatische Ebene nicht zuletzt dadurch, dass sie selbst neue Information syntaktischer Natur schaffen muss (sonst hätte die Information keine Wirkung entfaltet). Aufgrund des engen Zusammenspiels zwischen semantischen Dekodierungsprozess und Wirkentfaltung in der Pragmatik, die beide wiederum syntaktische Informationen als End- und Zwischenprodukte generieren, werden manchmal diese beiden Ebenen auch zur Semantopragmatik verschmolzen.
Im folgenden Beispiel eines Telefongespräches werden die unterschiedlichen Verschränkungen der Ebenen nochmals deutlich: (ich finde das Beispiel etwas wirr, Kommentar Benutzer:rho)
Syntax
|
Semantik
|
Pragmatik
|
Schallwellen mit wechselnder Frequenz und Lautstärke (Pegel)
|
Unterschiedlicher elektrischer Widerstand bei unterschiedl. Druck
|
Variierender elektrischer Strom
|
Unterschiedlich fließender elektrischer Strom
|
Unterschiedliches Magnetfeld bei unterschiedlichem Strom
|
Bewegung einer am Magneten befestigten Membran
|
Bewegung einer am Magneten befestigten Membran
|
Schwingungsübertragung durch Luftmoleküle
|
Entstehen einer Schallwelle
|
Auftreffen einer Schallwelle auf das System Trommelfell / Gehörknöchelchen / Schnecke / Schallrezeptoren
|
Feuern der Rezeptor-Nervenzelle bei Erregung
|
Nervenimpuls
|
Impuls vieler Rezeptornevenzellen an einer verarbeitenden Nervenzelle im Gehirn
|
Feuern der verarbeitenden Zelle bei Schwellwertüberschreitung
|
Feuern oder Nichtfeuern einer verarbeitenden Nervenzelle
|
Feuern oder Nichtfeuern vieler verarbeitender Nervenzellen
|
Vernetzung der Nervenzellen
|
Emergierende Muster in Raum und Zeit aus verarbeitenden Nervenzellen
|
Emergierende Muster in Raum und Zeit aus verarbeitenden Nervenzellen
|
(dieser semantische Schritt ist eines der größten Rätsel der Gehirnforschung)
|
Wort "Ich" gehört
|
Worte "Ich komme morgen an" gehört
|
(dieser semantische Schritt ist ein noch viel größeres Rätsel der Bewusstseinsforschung) - erneut spielt die Emergenz der Muster von feuernden Gehirnzellen eine Rolle.
|
Diese Worte mit dem Begriff über Gesprächspartner verbunden, und den Begriffen über den morgigen Tag, und dem Begriff, dass jemand kommt, und dem Begriff, dass es sich bei dem, der da kommt, um den Gesprächspartner handelt. Mit anderen Worten: Jetzt wissen, dass der Gesprächspartner morgen eintrifft.
|
Wissen, dass der Gesprächspartner morgen eintrifft. Sich erinnern, dass er mit dem Zug kommen wollte und dass der Bahnhof zwanzig Kilometer weit weg ist
|
(dieser semantische Schritt ist ein noch viel viel größeres Rätsel der Bewusstseinsforschung)
|
Ihm sagen werden, dass man ihn mit dem Auto abholen kommt
|