The web is more a social creation than a technical one. I designed it for a social effect — to help people work together — and not as a technical toy. The ultimate goal of the Web is to support and improve our weblike existence in the world. We clump into families, associations, and companies. We develop trust across the miles and distrust around the corner. – Tim Berners-Lee

16 Webseitenerstellung mit (X)HTML und CSS

In den letzten Jahren wurden viele Anwendungsprogramme für einzelne Systemplattformen durch Netzwerkanwendungen ersetzt, deren Benutzeroberfläche in praktisch jedem beliebigen Webbrowser funktioniert. Die Vorteile liegen auf der Hand:

Webanwendungen sind nicht auf ein bestimmtes Betriebssystem angewiesen.

Sie können ohne spezifische Client-Software auf jedem Rechner im Internet beziehungsweise Intranet ausgeführt werden.

Die bedeutendsten Nachteile sind, dass Webanwendungen meistens langsamer sind als Desktop-Programme oder -Clients und dass ihre Benutzung schwerfälliger ist. In der Regel werden die Daten aus Benutzeraktionen nämlich jedes Mal an den Server gesendet, wo ein völlig neues Dokument generiert wird. Der erste Nachteil wird durch die allmählich steigenden Netzwerkbandbreiten ausgeglichen. Für den zweiten gibt es neue Lösungen wie Ajax, die das Nachladen und Austauschen von Teilinhalten erlauben.

In diesem Kapitel und den beiden folgenden lernen Sie fünf zentrale Aspekte der Entwicklung von Webanwendungen kennen:

Darstellung der Struktur von Webseiten mit HTML beziehungsweise XHTML. Zusammen mit CSS bildet diese Komponente die Benutzeroberfläche einer Webanwendung

Festlegung von Layout und Design mithilfe von Cascading Style Sheets (CSS)

Im nächsten Kapitel geht es um serverseitige Webanwendungen mit PHP und MySQL sowie mit Ruby on Rails. Dynamische Inhalte und Interaktion werden möglich, wenn eine serverseitige Sprache Dokumente aus Vorlagen, Datenbankinhalten und Benutzereingaben verknüpft.

Kapitel 18, JavaScript und Ajax, beschreibt clientseitige Dynamik mit der Skriptsprache JavaScript und der Ajax-Technik. Während serverseitige Anwendungen zwar dynamische Inhalte einbinden, aber zum Schluss statische Seiten daraus generieren, ermöglichen die hier vorgestellten Techniken auch nachträgliche interaktive Änderungen der Webseiten im Browser.

16.1 HTML und XHTML

Die Struktur von Webseiten wird durch die Auszeichnungssprache HTML dargestellt. Der Name steht für Hypertext Markup Language (Auszeichnungssprache für Hypertext, also Text mit integrierten Strukturinformationen und Querverweisen). HTML-Code sieht im Wesentlichen genauso aus wie das in Kapitel 14, XML, vorgestellte XML – die gemeinsame Wurzel von XML und HTML ist die Auszeichnungssprache SGML. Das klassische HTML ist eine bestimmte SGML-DTD; es sind also nur ganz bestimmte Tags in einer vorgegebenen Anordnung erlaubt. Die aktuelle (und vorläufig letzte) Version dieser Sprache ist HTML 4.01.

XHTML

Da in herkömmlichem HTML eine Reihe von Freiheiten gestattet sind, die in XML nicht mehr gelten, wurde vom W3C (World Wide Web Consortium) inzwischen eine neue HTML-Variante namens XHTML eingeführt, die von XML abgeleitet ist und für die dieselben Regeln gelten wie für alle anderen XML-Dokumente. Allerdings sind alle bisher verfügbaren Browser tolerant genug, die gelockerte Syntax der alten HTML-Versionen weiterhin zuzulassen.

Die neue Version XHTML 2.0 wird gerade entwickelt; beim W3C steht unter http://www.w3.org/TR/xhtml2/ ein »Working Draft« bereit. Der Schwerpunkt ist eine stärkere Orientierung an XML-Standards – zum Beispiel XForms statt der klassischen HTML-Formulare. Bis Browser diese Neuerungen zuverlässig unterstützen, dürften aber noch einige Jahre vergehen. Bis dahin ist die (in diesem Abschnitt beschriebene) Version 1.0 zu empfehlen.

Webseiten erstellen und testen

Alle Webbrowser sind in der Lage, neben HTTP-URLs auch lokale HTML-Dokumente zu öffnen. Sie können die Dateien also in einem beliebigen Text- oder HTML-Editor schreiben und dann etwa in ein Browserfenster ziehen oder über den Befehl Datei • Öffnen des Browsers testen. Der Internet Explorer zeigt bei diesem Vorgehen allerdings eine Warnung vor »aktiven Inhalten« an, und auch sonst ist diese Vorgehensweise nicht empfehlenswert.

Spätestens, wenn Sie serverseitige Technologien einsetzen, müssen Sie ohnehin einen Entwicklungs-Webserver aufsetzen und die Seiten über http://localhost testen. Deshalb sollten Sie spätestens jetzt der Anleitung in Kapitel 12, Server für Webanwendungen, folgen und den Webserver Apache installieren.

Unabhängig davon, ob Sie Ihre Webseiten als lokale Dateien oder über einen eigenen Webserver ausprobieren, ist es in jedem Fall ratsam, sie in mehreren Browsern zu testen. Insbesondere fortgeschrittene CSS-Konzepte werden nämlich noch immer unterschiedlich interpretiert. Der Mindestsatz zu testender Browser besteht aus Microsoft Internet Explorer und Mozilla Firefox; wenn Sie zusätzlich Opera, KDE Konqueror oder Apple Safari zur Verfügung haben, sollten Sie auch diese in Betracht ziehen.

16.1.1 Die Grundstruktur von HTML-Dokumenten

Im Wesentlichen besteht ein HTML-Dokument neben dem eigentlichen Text aus Elementen in Form von Tags. Ein Tag wird von spitzen Klammern (< und >) umschlossen. Jedes Element besteht aus einem öffnenden und einem schließenden Tag und kann weitere Inhalte umschließen – entweder weitere Tags oder einfachen Text. Das schließende Tag wird dabei durch einen / vor dem Tag-Namen gekennzeichnet. <html> und </html> umschließen beispielsweise das gesamte Dokument, während <p> und </p> einen Textabsatz enthalten.

Einige HTML-Tags besitzen darüber hinaus einen oder mehrere durch Leerzeichen getrennte Parameter oder Attribute, die (nur beim öffnenden Tag) in der Form Attribut="Wert" angegeben werden und die Einzelheiten des Tags näher bestimmen. Hier ein Beispiel:

<p align="center"> ... </p>

Zwischen dem öffnenden und dem schließenden Tag befindet sich in diesem Beispiel ein Textabsatz, der zentriert gesetzt wird.

Genau wie bei XML gibt es für Elemente, die keinen weiteren Inhalt umschließen, eine Kurzschreibweise mit dem End-Slash. Ein Zeilenumbruch kann beispielsweise entweder als <br></br> oder einfach als <br /> geschrieben werden. [Das Leerzeichen zwischen dem Tag-Namen und dem Slash ist keine XHTML-Vorschrift, sorgt aber dafür, dass auch ältere Browser diese Form akzeptieren. ] Das klassische HTML kennt auch die »Einfach-Tag«-Schreibweise <br>, die jedoch nicht XML-konform ist und daher in neuen Dokumenten vermieden werden sollte.

Grundsätzlich besteht eine HTML-Seite aus einem Head (Kopf), der den Titel der Seite und andere Metainformationen enthält, und dem Body (Körper), in dem der eigentliche Inhalt des Dokuments steht.

Daraus ergibt sich der folgende grundlegende Aufbau einer HTML-Seite:

<html> 
  <head> 
    <title> Titel des Dokuments </title> 
  </head> 
  <body> 
    Der sichtbare Inhalt 
  </body> 
</html>

Einrückungen und Zeilenumbrüche sind nicht nötig, machen Ihren HTML-Code aber lesbarer.

Im Einzelnen bedeuten die diversen Bestandteile des Dokuments Folgendes:

<html> und </html> bilden das Wurzelelement des Dokuments und teilen dem Browser mit, dass es sich um HTML-Code handelt.

<head> und </head> umschließen den Dokumentkopf.

<title> und </title> enthalten den Dokumenttitel.

<body> und </body> umschließen den eigentlichen, sichtbaren Inhalt des Dokuments. Der Inhalt selbst besteht aus Text und weiteren ineinander verschachtelten HTML-Tags.

Im Head muss das Element <title> vorkommen, alle anderen Head-Angaben sind freiwillig. Der Titel des Dokuments ist ein wichtiges Strukturelement, das an folgenden Stellen angezeigt wird:

In der Titelleiste eines Browserfensters erscheint er zusammen mit dem Namen des Browsers selbst.

Er steht in der Liste der Favoriten, Bookmarks oder Lesezeichen Ihres Browsers, wenn Sie die Seite dort ablegen.

In den Ergebnislisten von Suchmaschinen wird der Titel als anklickbarer Link für eine Fundstelle verwendet.

Gute Dokumenttitel

Ein geeigneter Titel sollte den Namen der Website beziehungsweise des Anbieters sowie den Namen der einzelnen Seite enthalten. Hier einige gute Beispiele:

HTML-Kurs – Die erste Webseite

Galileo Computing, Buch – Apache 2

Müller GmbH: Produkte

Ein vollwertiges XHTML-Dokument ist auch ein XML-Dokument und benötigt deshalb eine XML-Kopfzeile und eine <!DOCTYPE>-Steueranweisung (beides wird in Kapitel 14, XML, näher beschrieben). Ein XHTML-Validator, der die formale Korrektheit Ihrer Dokumente prüfen kann, benötigt diese Angaben. Das gesamte Grundgerüst sieht daher so aus:

<?xml version="1.0" encoding="UTF-8"?> 
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" 
    "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> 
<html xmlns="http://www.w3.org/1999/xhtml"> 
  <head> 
    <title> Hier steht der Titel </title> 
  </head> 
  <body> 
    Hier folgt der Inhalt 
  </body> 
</html>

Zum Schluss sollten Sie noch beachten, dass die Tags und ihre Attribute in XHTML kleingeschrieben werden müssen, wähend die Groß- und Kleinschreibung im klassischen HTML keine Rolle spielte.

16.1.2 Textstrukturierung und Textformatierung

Bei der Textformatierung in HTML ist zu beachten, dass der Browser sich grundsätzlich nicht für Textformatierungen im Quelltext interessiert. Ob Sie ein Leerzeichen oder zehn setzen, ob Sie einen Zeilenumbruch erzeugen oder nicht: Der Browser setzt den gesamten Fließtext einfach hintereinander. Er erzeugt nur dann automatische Zeilenumbrüche, wenn der rechte Fensterrand erreicht wird.

Zeilenumbrüche

Wollen Sie dagegen explizit einen Zeilenumbruch erzeugen, so müssen Sie das folgende HTML-Tag verwenden:

<br />

Beachten Sie jedoch, dass Sie auf keinen Fall die Zeilenlänge von Fließtext bestimmen dürfen, indem Sie hinter jede Zeile ein <br /> setzen. Sie riskieren sonst, dass sich bei einer anderen Browserfenster-Größe erzwungene und automatische Zeilenumbrüche abwechseln und auf diese Weise den Zeilenfall völlig zerstören. Sie dürfen feste Zeilenumbrüche also nur an Stellen verwenden, an denen tatsächlich eine neue Zeile beginnen soll, beispielsweise für einfache Aufzählungen, Sinnabschnitte oder Gedichtzeilen.

Sonderzeichen

Ein weiteres Problem ist die Darstellung der Umlaute und anderer Sonderzeichen: Um weltweit kompatibel zu sein, verwendete HTML zunächst nur reinen ASCII-Code, also die 128 international identischen Zeichen. Es gibt zwei Möglichkeiten, dies zu ändern.

Sie können zum einen im Head den Zeichensatz angeben, der im Dokument verwendet wird. Dazu dient ein sogenanntes <meta>-Tag, das Konfigurationsinformationen in Form von Name/Wert-Paaren enthält (Näheres siehe unten). Um beispielsweise iso-latin-1 – den Standardzeichensatz für die USA und Westeuropa – einzustellen, lautet das entsprechende Tag folgendermaßen:

<meta http-equiv="content-type" 
content="text/html;charset=iso-8859–1" />

Entity-Referenzen

Alternativ (oder zusätzlich) können Sie die deutschen Umlaute und viele andere Sonderzeichen durch Entity-Referenzen erzeugen. Dies sind spezielle Zeichenfolgen im HTML-Code, die durch den Browser automatisch ersetzt werden. Jede Sonderzeichendefinition beginnt mit einem &-Zeichen und endet mit einem Semikolon. Dazwischen befindet sich ein Kürzel, das jeweils das Sonderzeichen beschreibt. Diese Sonderzeichen müssen ohne Abstand in den Fließtext eingebunden werden, damit sie normal im Wort erscheinen.

Es gibt auch einige Zeichen, die Sie als Entity-Referenzen schreiben müssen, weil sie in XHTML eine spezielle Bedeutung haben. Es handelt sich um dieselben fünf Zeichen, die bereits für XML genannt wurden.

Tabelle 16.1 zeigt einen Überblick über die gängigsten Sonderzeichencodierungen.

**Tabelle 16.1** Die wichtigsten HTML-Umlaute und -Sonderzeichen
Zeichen	Codierung	Erläuterungen
Klassische SGML/XML-Entity-Referenzen (Pflicht):
<	<	less than (kleiner als)
>	>	greater than (größer als)
"	"	quotation mark (Anführungszeichen)
'	'	Apostroph
&	&	Ampersand (»and per se and«)
Umlaute und andere diakritische Zeichen:
ä	ä	a-Umlaut
ö	ö	o-Umlaut
ü	ü	u-Umlaut
Ä	Ä	A-Umlaut
Ö	Ö	O-Umlaut
Ü	Ü	U-Umlaut
ß	ß	S-Z-Ligatur
é	é	e mit Akut
è	è	e mit Gravis
ê	ê	e mit Zirkumflex
à	á	a mit Akut
ç	ç	c mit Cedille
Ø	ø	o mit / (Slash)
œ	&oelig;	o-e-Ligatur
æ	æ	a-e-Ligatur
ñ	ñ	n mit Tilde
Weitere Sonderzeichen:
€	€	Euro
£	£	Pfund Sterling
¥	¥	Yen
¡	¡	inverse exclamation mark
¿	¿	inverse question mark
©	©	Copyright
®	®	Registered Trademark
§	§	section
„	&bdquo;	Anführungszeichen 99 unten (Deutsch Anfang)
“	“	Anführungszeichen 66 oben (Deutsch Ende, Englisch Anfang)
”	”	Anführungszeichen 99 oben (Englisch Ende)
«	«	left angular quote (Deutsch Ende; Französisch Anfang)
»	»	right angular quote (Deutsch Anfang; Französisch Ende)

Geschützte Leerzeichen

Ein weiteres wichtiges Sonderzeichen konnte leider nicht in der Tabelle untergebracht werden, da es für sich allein vollkommen unsichtbar ist: Das Zeichen   steht für Non-Breaking Space (nicht umbrechendes Leerzeichen) und erfüllt zwei wichtige Aufgaben:

Da der Browser Wörter und andere Elemente, die im HTML-Code durch beliebig viel Whitespace (Leerzeichen, Zeilenumbrüche, Tabulatoren) voneinander getrennt sind, stets durch genau ein Leerzeichen trennt, kann das   zur Erzeugung mehrerer aufeinander folgender Leerzeichen verwendet werden. Beispiel: Viel     Platz.

Wenn Sie Wörter oder andere Inhalte in derselben Zeile zusammen halten möchten, können Sie sie durch dieses Zeichen voneinander trennen, da es – seinem Namen entsprechend – den Zeilenumbruch verhindert. Um etwa »Windows Vista« zusammenzuhalten, müssten Sie im HTML-Code Windows Vista schreiben.

Absätze und Überschriften

Zur Kennzeichnung von Absätzen wird das folgende HTML-Tag eingesetzt:

<p> ... </p>

Das p steht für »paragraph« (Absatz). Falls Sie sich entschließen, Ihren Text durch Absätze zu gliedern, sollten Sie dies im gesamten Dokument tun – oder es ganz lassen; wie immer kann Inkonsequenz zu unvorhergesehenen Problemen führen.

Absatzausrichtung

Neben der Einteilung von Texten in Sinnabschnitte besitzen Absätze eine weitere Fähigkeit: Über das Attribut align können Sie die Textausrichtung bestimmen.

<p align="left"> ... </p>

erzeugt einen linksbündigen Absatz; das ist allerdings Standard und wird deshalb in der Regel nicht angegeben. Anders sieht es aus, wenn Sie einen Zeichensatz mit der Laufrichtung von rechts nach links verwenden, beispielsweise für Arabisch. In diesem Fall wäre der Standard die rechtsbündige Ausrichtung.

<p align="center"> ... </p>

erzeugt einen zentrierten Absatz. Mit

<p align="right"> ... </p>

wird ein rechtsbündiger Absatz erzeugt. Zu guter Letzt existiert noch die folgende Einstellung:

<p align="justify"> ... </p>

Dies erzeugt einen Absatz mit Blocksatz. Für Bildschirmlayouts ist dies in der Regel nicht ratsam, zumal Blocksatz ohne eine leistungsfähige automatische Silbentrennung nicht besonders ästhetisch wirkt.

Überschriften

Einen Sonderfall der Absätze bilden die Überschriften. Sie können in HTML in sechs verschiedenen Hierarchiestufen verwendet werden:

<h1>...</h1> 
<h2>...</h2> 
   ... 
<h6>...</h6>

Das h steht für »headline« (Überschrift). Browser stellen die verschiedenen Stufen in der Regel durch unterschiedliche Schriftgrößen dar. In einem Dokument wird normalerweise genau eine <h1>-Überschrift als Hauptüberschrift verwendet, die weitere Gliederung des Inhalts erfolgt meist durch <h2> bis <h4>. Noch weitergehende Unterteilungen sind eher selten und können ein Zeichen dafür sein, dass Sie die Inhalte besser auf mehrere Einzeldokumente verteilen sollten.

Beachten Sie, dass die <h...>-Tags auf keinen Fall für die allgemeine Einstellung der Schriftgröße verwendet werden dürfen: Zum einen sind Überschriften eigenständige Absätze, zum anderen werden sie standardmäßig fett dargestellt.

Auch Überschriften kennen das Attribut align mit denselben Werten wie Absätze.

Vorformatierter Text

Als Letztes gibt es noch die spezielle Formatierung <pre>. Sie erzeugt im engeren Sinne keine Absätze, sondern vorformatierten Text (pre steht für »preformatted«). Text zwischen diesen beiden Tags wird mitsamt allen Leerzeichen und Zeilenumbrüchen aus dem HTML-Code dargestellt – interessant ist dies zum Beispiel, um Programmquelltexte auf Webseiten zu veröffentlichen, da diese auf eine sauber eingerückte Darstellung angewiesen sind. Hier ein kleines Beispiel:

<pre> 
public class HelloWorld { 
   public static void main(String args[]) 
   { 
      system.out.println ("Hello, World!"); 
   } 
} 
</pre>

ASCII-Art

Auch zur Darstellung von ASCII-Art – kleinen Zeichnungen, die nur aus ASCII-Zeichen bestehen – ist vorformatierter Text geeignet. Wunderschöne künstlerische Beispiele finden Sie etwa unter www.ascii-art.de; hier folgt dagegen mein eigenes bescheidenes Werk:

<pre> 
 
     o O 
    o  ___ 
   ||__|o| _________ _________ _________ 
   |     |-\__THE__/-\__WEB__/-\_TRAIN_/ 
   /OO-OO\   O   O     O   O     O   O 
 
</pre>

Zeichenformatierung

Innerhalb der Absätze können Sie auch einzelne Wörter, Zeichen oder beliebige Passagen besonders formatieren. Die Tags, die dafür zur Verfügung stehen, sind ausdrücklich nicht absatzbildend, sollten aber gerade deshalb auch nur innerhalb eines Absatzes und nicht über mehrere hinweg verwendet werden.

Struktur versus Layout

Aufgrund der Entwicklungsgeschichte von HTML gibt es zwei Arten von Tags zur Auszeichnung von Zeichen: die älteren Struktur-Tags, die die Bedeutung bestimmter Zeichen beschreiben, und die neueren Layout-Tags, die das Aussehen von Zeichen bestimmen. Beide werden allmählich seltener verwendet, weil sie mehr und mehr durch die konsequenter durchdachten Cascading Stylesheets ersetzt werden.

Zeichenformatierungs-Tags können beliebig ineinander verschachtelt werden, wichtig ist natürlich die korrekte Reihenfolge: Wie überall in HTML und XML muss das zuletzt geöffnete Tag als Erstes wieder geschlossen werden. Beispielsweise können Sie Text folgendermaßen fett und kursiv setzen:

<b><i>fett und kursiv</i></b>

Tabelle 16.2 zeigt eine Übersicht über alle Zeichenformatierungs-Tags.

**Tabelle 16.2** Die wichtigsten Tags zur Zeichenformatierung
Tag	Wirkung	Beispiel
Layout-Tags:
<i>...</i>	kursiv (italic)	kursiv
<b>...</b>	fett (bold)	fett
<u>...</u>	unterstrichen (underlined)	unterstrichen
<strike>...</strike>	durchgestrichen	durchgestrichen
<sup>...</sup>	hochgestellt (superscript)	normal hochgestellt
<sub>...</sub>	tiefgestellt (subscript)	normal _tiefgestellt
<tt>...</tt>	Festbreitenschrift (teletype)	Festbreitenschrift
Struktur-Tags:
<em>...</em>	betont (emphasis); wird meist kursiv dargestellt	betont
<strong>...</strong>	stark hervorgehoben; wird meist fett dargestellt	stark betont
<code>...</code>	Quellcode – zur Darstellung von Programmierbeispielen usw.; meist durch Festbreitenschrift dargestellt	Code
<address>... </address>	Adressangaben; meist kursiv dargestellt	Rheinwerkallee 4, D-53227 Bonn

Die Auszeichnung <u>...</u> für unterstrichenen Text sollten Sie vermeiden – die meisten Benutzer würden vermuten, dass es sich um einen Hyperlink handelt, und sich ärgern, wenn er sich nicht anklicken lässt.

Hoch- und tiefgestellter Text eignet sich besonders für mathematische und technische Belange. Beispielsweise können Sie mithilfe des folgenden HTML-Codes den »Satz des Pythagoras« darstellen:

a<sup>2</sup>+b<sup>2</sup>=c<sup>2</sup>

Dies ergibt die folgende Ausgabe im Browser:

- a^² + b^² = c^²

16.1.3 Listen und Aufzählungen

Listen und Aufzählungen sind ein gutes Mittel zum Ordnen von Informationen. Da HTML ursprünglich für die wissenschaftliche Dokumentation erfunden wurde, ist es nicht weiter verwunderlich, dass einige Möglichkeiten zur Erstellung solcher Listen angeboten werden.

Nicht nummerierte Aufzählungen

Eine nicht nummerierte Aufzählung oder »bullet list« wird von den folgenden Tags umschlossen:

<ul>...</ul>

ul steht dabei für »unordered list« (englisch für unsortierte Liste).

Innerhalb dieses Bereiches werden die einzelnen Listenpunkte durch <li>-Tags (»list item«, Listenpunkt) umschlossen:

<li>Einzelinformation</li>

Aufzählungszeichen

Das Attribut type kann sowohl beim <ul>- als auch beim einzelnen <li>-Tag stehen und gibt den gewünschten Stil der Aufzählungspunkte an. Die folgenden Werte sind möglich:

disc – ein gefüllter runder Punkt

circle – ein Kreis, also ein innen hohler runder Punkt

square – ein quadratischer Punkt

Wenn Sie das Attribut weglassen, werden verschachtelte Listen je nach Ebene nacheinander mit den drei Punktarten versehen.

Der folgende Codeabschnitt erzeugt eine Aufzählung mit vier Unterpunkten:

<h3>Bei XHTML zu beachten:</h3> 
<ul> 
  <li>XML-Header verwenden</li> 
  <li>Jedes Tag schlie&szlig;en</li> 
  <li>Alle Tags klein schreiben</li> 
  <li>Attributwerte immer in Anf&uuml;hrungszeichen</li> 
</ul>

Ein Beispiel, wie so etwas im Browser aussieht, finden Sie weiter unten bei den verschachtelten Listen in Abbildung 16.1.

Nummerierte Listen

<ol>...</ol>

bezeichnet eine nummerierte Liste (»ordered list«). Auch in dieser Liste wird ein Listenpunkt durch <li> angegeben.

Nummerierungsart

Das <ol>-Tag kennt den Parameter type, der die Art der verwendeten Aufzählung angibt. Dabei sind folgende Werte möglich:

"1" – arabische Ziffern (Standard)

"A" – Großbuchstaben

"a" – Kleinbuchstaben

"I" – römische Zahlen

"i" – kleingeschriebene römische Zahlen, also i, ii, iii, iv und so weiter

Das Attribut start bezeichnet den Wert, mit dem die Nummerierung beginnt. Unabhängig vom jeweiligen type muss der Wert numerisch angegeben werden.

Soll etwa eine alphabetische Liste mit D. beginnen, so schreiben Sie den folgenden HTML-Code:

<ol type="A" start=4> ... </ol>

Verschachtelte Listen

Nummerierte und nicht nummerierte Listen können beliebig ineinander verschachtelt werden. Dabei gehört das jeweilige <li> immer zu derjenigen Liste, die zuletzt geöffnet wurde.

Der folgende Codeabschnitt erzeugt eine nummerierte Hauptliste, in die unter zwei der drei Hauptpunkte nicht nummerierte Aufzählungen verschachtelt sind:

<h3>Was Sie f&uuml;r das Surfen im Web ben&ouml;tigen</h3> 
<ol> 
  <li>Eine DF&Uuml;-Verbindung</li> 
  <ul> 
    <li>DSL</li> 
    <li>ISDN</li> 
    <li>Modem</li> 
  </ul> 
  <li>Einen Account bei einem Provider</li> 
  <li>Einen Browser</li> 
  <ul> 
    <li>Firefox</li> 
    <li>Internet Explorer</li> 
    <li>sonstige ...</li> 
  </ul> 
</ol>

Abbildung 16.1 zeigt, wie diese Liste im Browser dargestellt wird.

Hier klicken, um das Bild zu vergrößern

Abbildung 16.1 Darstellung der verschachtelten Liste im Browser, hier Apple Safari

Definitionslisten

<dl> ... </dl>

bezeichnet eine sogenannte Definitionsliste (»definition list«), auch Glossarliste genannt. In einer solchen Liste wechseln sich ausgerückte Begriffe und ihre eingerückten Definitionen ab.

Ein zu definierender Begriff steht zwischen den folgenden Tags:

<dt> ... </dt>

dt bedeutet »definition title«. Die anschließende Definition steht zwischen diesen Tags (Abkürzung für »definition data«):

<dd> ... </dd>

Der folgende Code zeigt ein Beispiel:

<h3>Web-Sprachen</h3> 
<dl> 
  <dt>HTML</dt> 
  <dd>Klassische Auszeichnungssprache f&uuml;r 
  Webseiten</dd> 
  <dt>XHTML</dt> 
  <dd>Moderne, XML-basierte Variante von HTML</dd> 
  <dt>JavaScript</dt> 
  <dd>Skriptsprache zur dynamischen Manipulation von 
  Webseiten-Inhalten</dd> 
</dl>

In Abbildung 16.2 ist die Umsetzung des Beispiels im Browser zu sehen.

Hier klicken, um das Bild zu vergrößern

Abbildung 16.2 Darstellung der Definitionsliste im Broswer (diesmal Firefox)

16.1.4 Hyperlinks

Hyperlinks sind die wichtigsten Elemente von HTML-Dokumenten. Erst durch diese Verknüpfungen entsteht echter Hypertext, also eine Struktur verknüpfter Dokumente. Sie können sowohl auf andere Dokumente innerhalb Ihrer eigenen Website als auch auf fremde Websites und andere Arten von Internet-Ressourcen wie FTP-Download-Verzeichnisse, Newsgroups oder E-Mail-Adressen verweisen.

Grundsätzlich wird ein Hyperlink durch das folgende Tag gesetzt:

<a href="URL_des_neuen_Dokuments">Anklickbarer Text</a>

Lokale Hyperlinks

Innerhalb derselben Website werden meist relative URLs eingesetzt. Sie geben den Pfad der verknüpften Ressource relativ zum aktuellen Dokument an. Zwei Punkte als Verzeichnisname (..) bedeuten dabei, dass das jeweils übergeordnete Verzeichnis angesprochen werden soll. Näheres über die Logik von UNIX-Verzeichnishierarchien erfahren Sie in Kapitel 7, Linux und UNIX; das grundlegende Konzept der URL wurde bereits in Kapitel 4, Netzwerkgrundlagen, erläutert.

Hier sehen Sie ein Beispiel für Dokumente, die in einer Verzeichnishierarchie auf einem Webserver verteilt sind:

/     (Dokumentenwurzel der Website) 
| 
+-- index.html 
| 
+-- about.html 
| 
+-- [kontakt] 
|    | 
|    +-- mail.html 
| 
+-- [neu] 
     | 
     +-- news.html

Im obersten Verzeichnis befindet sich die Startseite, in diesem Fall heißt sie index.html. Welche Namen für Startseiten akzeptiert werden, müssen Sie im Webserver einstellen (siehe Kapitel 12, Server für Webanwendungen) beziehungsweise mit Ihrem Hosting-Provider abklären. Eine definierte Startseite für eine Website wird benötigt, damit Besucher einfach den Domainnamen oder einen Verzeichnisnamen aufrufen können, ohne ein bestimmtes Dokument anzufordern.

Hyperlink-Beispiele

Um zum Beispiel einen Hyperlink von der Datei index.html im Wurzelverzeichnis auf die Datei about.html im gleichen Verzeichnis zu erzeugen, gilt folgende Syntax (der Link-Text sei hier »Über uns«):

<a href="about.html">&Uuml;ber uns</a>

Eine Datei in einem untergeordneten Verzeichnis wird wie folgt verlinkt (hier ein Link von index.html auf mail.html im Unterverzeichnis kontakt mit dem Link-Text »E-Mail«):

<a href="kontakt/mail.html">&Uuml;ber uns</a>

Ein Link von der Datei mail.html zurück zu index.html verwendet die Schreibweise .. für das übergeordnete Verzeichnis (hier mit dem Link-Text »Homepage«):

<a href="../index.htm">Homepage</a>

Ein Link von mail.html auf news.html im Verzeichnis neu (mit dem Link-Text »Neueste Nachrichten«) lautet schließlich:

<a href="../neu/news.html">Neueste Nachrichten</a>

Hyperlinks auf andere Websites und Internetdienste

Bei Hyperlinks auf andere Server im Internet müssen Sie eine vollständige URL angeben. Als Beispiel sehen Sie hier einen Hyperlink auf die Website von Galileo Computing:

<a href="http://www.galileocomputing.de">Galileo Computing</a>

Natürlich kann ein Hyperlink nicht nur allgemein auf eine Website, sondern auch auf ein bestimmtes Dokument auf einem anderen Webserver verweisen, wenn Sie dessen URL kennen. Beispielsweise zeigt folgender Link auf die erste Seite der Präsentation von Christian Ullenbooms Klassiker »Java ist auch eine Insel« bei Galileo Computing:

<a href="http://www.galileocomputing.de/katalog/buecher 
/titel/gp/titelID-1318">Java ist auch eine Insel</a>

Bedenken Sie, dass nicht alle Webmaster sorgfältig mit den Adressen einzelner Dokumente umgehen – sie können sich häufig ändern, sodass ein solcher Link plötzlich ins Leere zeigt und einen unangenehmen »Fehler 404« (Dokument nicht gefunden) produziert. Falls Sie auf Ihren Websites also Linklisten betreiben, sollten Sie diese regelmäßig überprüfen; hilfreich ist auch eine Feedback-Möglichkeit für User (»defekten Link melden«). Umgekehrt sollten Sie die Adressen der einzelnen Dokumente Ihrer eigenen Sites auch dann nach Möglichkeit nicht ändern (oder unter den alten URLs zumindest Hinweise und Weiterleitungen speichern), wenn Sie wesentliche Änderungen an Design oder Inhalten vornehmen – es ist für andere genauso ärgerlich, wenn ein Link auf eines Ihrer Dokumente plötzlich nicht mehr funktioniert.

Bei einer Datei, die Sie über einen Hyperlink ansprechen, muss es sich nicht unbedingt um ein HTML-Dokument handeln. Sie können etwa andere Arten von Dokumenten verlinken, mit denen Browser üblicherweise zurechtkommen, beispielsweise GIF- oder JPEG-Bilder, MP3-Audiodateien oder PDF-Dokumente. Falls der Browser mit einem Dateityp nichts anfangen kann, fragt er nach, ob er die Datei dem Betriebssystem zum Öffnen mit einem geeigneten Programm übergeben oder ob er sie auf die Festplatte speichern soll.

Download-Hyperlinks

Genau so funktioniert übrigens ein einfacher Download-Link: Es handelt sich einfach um einen Hyperlink auf eine Datei, die ein Browser nicht selbst anzeigen kann, etwa ein ausführbares Programm oder eine ZIP-komprimierte Datei.

Abgesehen davon können Sie nicht nur Links auf andere Websites einrichten, sondern auch auf Ressourcen, die über andere Protokolle angesprochen werden. Voraussetzung ist natürlich, dass es sich um Protokolle handelt, mit denen die Browser der meisten Benutzer umgehen können oder für die ein Protokollhilfsprogramm definiert ist, das Ressourcen dieses Typs verarbeitet. Sehr verbreitet sind beispielsweise Download-Links auf Anonymous-FTP-Server, die fast jeder Browser beherrscht, und mit deren Hilfe Downloads schneller und effizienter funktionieren als über HTTP. Sehen Sie sich zum Beispiel den folgenden Link an:

<a href=" ftp://ftp.uni-koeln.de/packages/linux/fedora/6/i386/iso/"> 
Fedora Core Linux 6.0, ISO Images</a>

Es handelt sich um das Verzeichnis mit den ISO-Images von Fedora Core Linux 6.0, und zwar im Fedora-Mirror-Verzeichnis des Rechenzentrums der Uni Köln.

Downloads erzwingen

Wenn Sie Dokumente zum Download anbieten möchten, obwohl der Browser sie eigentlich selbst anzeigen kann – einschließlich Textdateien oder JPEG-Bildern –, können Sie sie in Archive (ZIP, GNUZip oder ähnliche) verpacken. Eine Alternative besteht in einer Änderung der Webserver-Konfiguration für das entsprechende Verzeichnis: Es geht darum, für die fraglichen Dokumente den MIME-Type application/octet-stream (allgemeine Binärdatei) zu erzwingen.

Kopieren Sie die gewünschten Dateien in ein separates Verzeichnis innerhalb der Website (im Beispiel downloads unterhalb der Apache-DocumentRoot). Anschließend müssen Sie in der Konfigurationsdatei httpd.conf einen <Directory>-Container wie diesen einrichten (Einzelheiten siehe Kapitel 12, Server für Webanwendungen):

  <Directory /usr/local/apache2/htdocs/downloads> 
      ForceType application/octet-stream 
  </Directory>

In gemietetem Webspace müssen Sie dagegen eine .htaccess-Datei in das Download-Verzeichnis selbst kopieren, die nur die ForceType-Direktive enthält. Für den entsprechenden Konfigurationskontext muss die AllowOverride-Option FileInfo gesetzt sein. Außerdem müssen Sie sicherstellen, dass sich in dem entsprechenden Verzeichnis und allen Unterverzeichnissen ausschließlich solche Download-Dateien befinden.

Ein Browser, der auf eine Datei aus diesem Verzeichnis stößt, zeigt diese nun nicht mehr an, sondern bietet sie wie beschrieben zum Download an. Schwierigkeiten macht nur noch der Microsoft Internet Explorer, der gern »schlauer als der MIME-Type« ist und versucht, den Dateityp selbst zu erkennen.

E-Mail-Links

Eine andere Variante ist ein Hyperlink auf eine E-Mail-Adresse. Wenn dieser Link angeklickt wird, öffnet der Browser automatisch ein Mail-Fenster im bevorzugten E-Mail-Programm des Anwenders, in dem die angegebene Adresse bereits als Empfänger eingetragen ist. Hierzu dient das »Pseudo-Protokoll« mailto:

<a href="mailto:ich@mein-provider.de">Senden Sie mir eine Mail</a>

Sie können sogar den Betreff der neu zu erzeugenden E-Mail angeben:

<a href="mailto:ich@mein-provider.de?subject=Feedback"> 
Geben Sie mir Feedback!</a>

Der Link erzeugt wiederum ein Mail-Fenster für eine neue E-Mail, in das sowohl der Empfänger als auch der Betreff bereits eingetragen sind.

Seiteninterne Hyperlinks

Bei sehr umfangreichen Seiten, deren Länge sich über mehrere Bildschirmhöhen erstreckt, bietet es sich an, einzelne Passagen der Seite per Hyperlink erreichbar zu machen. Zu diesem Zweck werden sogenannte Anker oder Textmarken gesetzt, die einen bestimmten Punkt im Dokument als Ziel für einen Hyperlink definieren. Beim Anklicken eines Links, der auf einen Anker verweist, wird der Inhalt des Browserfensters automatisch so gescrollt, dass sich die entsprechende Stelle am oberen Rand befindet.

Die Syntax für einen Ankerpunkt lautet folgendermaßen:

<a name="name_des_ankers"></a>

Gemäß HTML-Spezifikation ist dieses Tag leer. Dennoch werden in manchen HTML-Referenzen Inhalte wie Text oder Überschriften dazwischen gesetzt, wovon dringend abzuraten ist. In jedem Fall sollten Sie das Tag nicht mit dem XML-End-Slash schließen, sondern das </a> explizit hinschreiben. Auch ältere Browser erwarten, dass es geschlossen wird, verstehen aber die XML-Kompaktschreibweise nicht.

Ein Hyperlink auf einen solchen Ankerpunkt erfolgt innerhalb derselben Datei mithilfe der folgenden Syntax:

<a href="#name_des_ankers">Zum Ankerpunkt</a>

Sie können auch aus einer anderen Datei heraus direkt auf die entsprechende Dokumentstelle zugreifen:

warnung<a href="Dateiname#name_des_ankers">Zum Ankerpunkt</a>

Es versteht sich von selbst, dass Dateinamen in Websites aus diesem Grund kein #-Zeichen enthalten dürfen!

Auf sehr vielen Websites ist es gängige Praxis, ganz oben auf jede Seite unmittelbar nach dem <body>-Tag einen Anker zu setzen – beispielsweise folgendermaßen:

<a name="oben"></a>

Am unteren Rand des Dokuments befindet sich dann entsprechend ein Hyperlink, um wieder ganz nach oben zu gelangen:

<a href="#oben">nach oben</a>

Dies bietet sich insbesondere dann an, wenn sich die Hauptnavigation jeweils ganz oben in den Dokumenten befindet.

16.1.5 Bilder in Webseiten einbetten

Ein Bild ist stets eine externe Datei, die erst zum Zeitpunkt des Ladens dynamisch vom Browser eingebettet wird. Bilder können in den komprimierten Dateiformaten GIF, JPEG oder PNG vorliegen. Der genaue Unterschied zwischen ihnen wurde in Kapitel 15, Weitere Datei- und Datenformate, erläutert. Hier sei noch einmal erwähnt, dass JPEGs besser für Fotos und andere halbtonreiche Bilder geeignet sind, während sich die beiden anderen Formate eher für flächige Grafiken mit wenigen Farben eignen.

Bilder einbetten

Grundsätzlich wird ein Bild mithilfe des folgenden Tags in eine Webseite eingebettet:

<img src="URL_des_Bildes" />

Für die Angabe der URLs von lokalen oder auf anderen Servern liegenden Bildern gelten die Regeln, die weiter oben bereits für Hyperlinks erläutert wurden.

Für Suchmaschinen, sehbehinderte Benutzer oder reine Textbrowser ist es praktisch, dass sich für jedes Bild ein Alternativtext angeben lässt:

<img src="URL" alt="Text" />

In manchen Browsern wird dieser Text auch als Tooltipp angezeigt, wenn Sie mit der Maus über das Bild fahren – hierzu ist allerdings das Attribut title besser geeignet, das Sie auch für beliebige andere Tags verwenden können.

Geben Sie im Tag stets die Originalgröße des Bildes an. Die Syntax für die entsprechenden Attribute sieht so aus:

<img src="URL" height="Höhe_in_Pixeln" 
width="Breite_in_Pixeln" />

Der vorher geladene Text kann so bereits dargestellt werden, da klar ist, wie er positioniert werden soll. Eine Skalierung des Bildes über die Attribute height und width ist hingegen nicht zu empfehlen – wenn auch grundsätzlich möglich. Stattdessen sollte das Bild in einem Bildbearbeitungsprogramm von vornherein auf die gewünschte Größe gebracht werden.

Bildpositionierung

Über den align-Parameter können Bilder positioniert werden:

<img src="URL" align="left" />

setzt das Bild an den linken Rand des Fensters; der Text umfließt rechts den rechteckigen Umriss des Bildes.

<img src="URL" align="right" />

platziert das Bild am rechten Rand; der Text umfließt links den Umriss des Bildes.

Bei diesen beiden Formatierungen können Sie das Umfließen jederzeit beenden und weiteren Text unter dem Bild weiterführen, indem Sie ein <br /> mit dem speziellen Attribut clear einfügen:

<br clear="left" /> beendet nur linksseitiges Umfließen,

<br clear="right" /> hebt rechtsseitiges Umfließen auf und

<br clear="all" /> beendet beides.

Die Attributwerte "top", "middle" und "bottom" setzen das Bild in den normalen Fluss einer Textzeile, wobei der Text entsprechend an die Oberkante des Bildes, auf die Mittellinie oder an die Unterkante gesetzt wird.

Mithilfe der Attribute hspace="Anzahl_Pixel" und vspace="Anzahl_Pixel" können Sie den Abstand des Bildes nach links und rechts beziehungsweise nach oben und unten festlegen.

Bilder als Hyperlinks

Wenn Sie ein Bild als Hyperlink definieren möchten, können Sie dies folgendermaßen erreichen:

<a href="URL"><img src="Bild-URL" /></a>

Hierbei wird um das Bild standardmäßig ein Rahmen in der aktuellen Hyperlink-Farbe gezogen. Durch die Angabe von

<img src="Bild-URL" border="0" />

lässt sich dies vermeiden.

Image-Maps

Anstatt ein ganzes Bild zu einem durchgehenden Hyperlink zu machen, besteht auch die Möglichkeit, einzelne Bereiche des Bildes anklickbar zu machen und jeweils individuell auf einen Klick in die jeweiligen Regionen zu reagieren. Grundsätzlich werden zwei Arten dieser sogenannten Image Maps unterschieden: die nur noch selten verwendeten serverseitigen Image-Maps sowie die clientseitigen Image-Maps.

Serverseitige Image-Maps

Bei einer serverseitigen Image-Map wird einfach das Attribut ismap="ismap" [XHTML-Attribute wie ismap="ismap", in denen Name und Wert identisch sind, sind der XML-konforme Ersatz für klassische HTML-Attribute, die ganz ohne Wertangabe eine Bedeutung hatten. ] in das <img>-Tag gesetzt. Das Bild wird als normaler Hyperlink auf ein serverseitiges Skript verwendet, das in der Lage ist, die übertragenen Mauskoordinaten des Bildes zu verarbeiten. Beispielsweise übergibt der folgende Link die Koordinaten an das Perl-CGI-Skript coords.pl im Verzeichnis /cgi-bin:

<a href="/cgi-bin/coords.pl"><img src="test.jpg" ismap="ismap" 
width="200" height="200" /> </a>

Die Koordinaten werden einfach an die URL angehängt. Es wird also statt /cgi-bin/coords.pl die URL /cgi-bin/coords.pl?100,100 aufgerufen, wenn der Benutzer genau in die Bildmitte klickt.

Das folgende kleine Perl-Skript erzeugt ein HTML-Dokument, das einfach die Koordinaten ausgibt:

#!/usr/bin/perl -w 
use strict; 
my $coords = $ENV{'QUERY_STRING'}; 
my ($x, $y) = split (/,/, $coords); 
print "Content-type: text/html\n\n"; 
print "<html><head><title>Koordinaten</title></head>"; 
print "<body>Koordinaten: x=$x, y=$y</body></html>\n";

Bessere Dienste als ein selbst geschriebenes Skript leistet übrigens das Apache-Standardmodul mod_imagemap. Genau wie die clientseitigen Image-Maps ermöglicht es die Definition von Bereichen mit verschiedenen Formen. Genauere Informationen dazu finden Sie unter http://buecher.lingoworld.de/apache2/showdir.php?id=563 (Beschreibung der Direktive ImapBase und des Moduls auf der Website zu meinem Buch Apache 2).

Clientseitige Image-Maps

Bei einer clientseitigen Image-Map wird ein Bild mit beliebig vielen anklickbaren Bereichen, sogenannten Hot-Spots, versehen, die jeweils getrennt als Hyperlinks angezeigt werden sollen. Eine solche Image Map wird durch die Angabe des Attributs usemap="#Map-Name" erzeugt. Mit diesem Map-Namen muss eine <map>-Definition übereinstimmen, die die einzelnen Hot-Spots definiert. Das Bild selbst muss (und sollte) dabei kein Hyperlink sein. Eine solche Map-Definition sieht zum Beispiel folgendermaßen aus:

<img src="probe.gif" width="400" height="400" alt="Map-Bild" usemap="#mymap" /> 
<map name="mymap"> 
  <area shape="rect" coords="10, 10, 100, 100" 
  href="rechteck.htm" alt="Rechteckiger Bereich" /> 
  <area shape="circle" coords="300, 300, 50" 
  href="kreis.htm" alt="Kreisf&ouml;rmiger Bereich" /> 
  <area shape="poly" coords="150, 150, 200, 10, 250, 150" 
  href="polygon.htm" alt="Polygonförmiger Bereich" /> 
</map>

Die einzelnen <area>-Tags definieren die anklickbaren Bereiche. Das Attribut shape gibt die Form des jeweiligen Bereichs an:

shape="rect" gibt mithilfe des Attributs coords die linke obere und die rechte untere Ecke eines Rechtecks (in Pixeln) an.

shape="circle" (Kreis) verlangt als coords die Angabe des Mittelpunkts (X- und Y-Koordinate) und den Radius in Pixeln.

shape="poly" (Polygon) erwartet eine Reihe aufeinander folgender X- und Y-Koordinaten.

href definiert wie bei einem Hyperlink die Adresse, auf die ein Mausklick in diesen Bereich verzweigen soll. alt erzeugt wie gehabt Alternativtexte und manchmal Tooltipps.

16.1.6 Tabellen

Eines der wichtigsten Gestaltungsmittel für Webseiten sind HTML-Tabellen. Sie werden nicht nur für die tabellarische Anordnung von Informationen verwendet, sondern vor allem zur Verteilung beliebiger Inhalte im Dokument. Eine moderne Alternative, die sich langsam durchsetzt, bilden die im nächsten Abschnitt behandelten Layer.

Eine Tabelle steht im HTML-Dokument zwischen den beiden folgenden Tags:

<table> ... </table>

Tabellen bestehen aus mehreren Zeilen, die in einzelne Zellen aufgeteilt werden; der eigentliche Inhalt darf nur innerhalb der einzelnen Zellen stehen:

<table> 
  <tr> 
    <td> 
      <!-- Hier steht der Zellinhalt --> 
    </td> 
    <!-- eventuell weitere Zellen --> 
  </tr> 
  <!-- eventuell weitere Zeilen --> 
</table>

Die Zeilen mit den -Bereichen sind übrigens HTML-Kommentare. Sie können sich über beliebig viele Zeilen erstrecken. Bedenken Sie, dass sie zwar vom Browser ignoriert werden, dass aber jeder Benutzer den Quellcode einer Webseite einsehen und damit auch die Kommentare lesen kann.

Tabellenbestandteile

Zwischen <tr> und </tr> (Abkürzung für »table row«) steht eine einzelne Zeile, die aus einer beliebigen Anzahl von Zellen bestehen kann. Natürlich sollten alle Zeilen einer Tabelle in der Regel gleich viele Zellen besitzen, anderweitig sind keine Spalten definiert. Dennoch sorgt der Browser dafür, dass untereinander liegende Zellen mit der gleichen Breite gezeichnet werden.

Die einzelne Tabellenzelle steht innerhalb der Tags <td> ... </td> (td bedeutet »table data«). Nur zwischen diesen beiden Tags dürfen die eigentlichen Tabelleninhalte stehen. Für Überschriftzellen mit Spalten- oder Zeilenüberschriften existiert auch das spezielle Tag <th> ... </th> (»table heading«), das an den entsprechenden Stellen statt der <td>-Tags gesetzt werden kann und den Text der Zelle in der Regel fett und zentriert setzt.

Zu guter Letzt existiert noch das optionale Tag <caption> ... </caption>, das nicht in eine Zeile oder Zelle gesetzt wird, sondern unmittelbar hinter das öffnende <table>-Tag. Es handelt sich um ein Tag zur Beschriftung der Tabelle. Sein einziges Attribut align kann die Werte "top" (über der Tabelle, der Standardwert) oder "bottom" (unter der Tabelle) annehmen.

Der folgende Codeausschnitt zeigt ein vollständiges Beispiel:

<table border="2"> 
  <caption>Bestandteile von HTML-Tabellen</caption> 
  <tr> 
    <th>Element</th> 
    <th>Erl&auml;uterung</th> 
  </tr> 
  <tr> 
    <th>table</th> 
    <td>Die eigentliche Tabelle</td> 
  </tr> 
  <tr> 
    <th>tr</th> 
    <td>Tabellenzeile</td> 
  </tr> 
  <tr> 
    <th>td</th> 
    <td>Tabellenzelle</td> 
  </tr> 
</table>

Abbildung 16.3 zeigt, wie diese Tabelle im Browser dargestellt wird.

Hier klicken, um das Bild zu vergrößern

Abbildung 16.3 Augabe des Tabellenbeispiels, zur Abwechslung im Microsoft Internet Explorer

Das im <table>-Tag verwendete Attribut border sorgt dafür, dass ein sichtbarer Tabellenrahmen gezeichnet wird – hier mit einer Breite von zwei Pixeln.

Tabellen-Attribute

Es gibt verschiedene Attribute, die die einzelnen Tabellenbestandteile auf verschiedene Art und Weise einrichten. Zunächst werden hier die Attribute des <table>-Tags behandelt:

align="left"|"right"|"center" richtet die Tabelle im Fenster aus. Bei "left" und "right" wird sie wie ein entsprechend formatiertes Bild von Text umflossen; "center" setzt sie absatzbildend in die Fenstermitte. Wenn Sie gar kein align angeben, wird die Tabelle absatzbildend nach links gesetzt.

width="..."|"...%" gibt die Breite der Tabelle in Pixeln beziehungsweise in Prozent der Fenster- beziehungsweise Umgebungsbreite an. Der Wert wird ignoriert, falls die Inhalte der Tabelle nicht in die angegebene Breite hineinpassen.

height="..."|"...%" gibt die Höhe der Tabelle in Pixeln beziehungsweise in Prozent der Fensterhöhe an. Auch dieser Wert wird ignoriert, falls die Inhalte der Tabelle sonst nicht passen. [Wenn Sie auf Höhenangaben angewiesen sind, müssen Sie Ihren HTML-Dokumenten einen HTML 4.0-Doctype zuweisen. Mindestens der Internet Explorer ignoriert diese Werte bei XHTML-Dokumenten. ]

border="..." setzt die Breite des Tabellenrahmens in Pixeln. Beachten Sie, dass in modernen Browsern ohne Angabe des border-Parameters eine Tabelle ohne Rand erzeugt wird. Da dies bei älteren Browsern jedoch nicht so sein muss, sollte für eine unsichtbare Layout-Tabelle immer ausdrücklich border="0" gesetzt werden.

cellpadding="..." gibt die Entfernung des jeweiligen Zellinhaltes zum Zellrand in Pixeln an.

cellspacing="..." gibt die Breite der Zellränder in Pixeln an.

bgcolor="#......" setzt die Hintergrundfarbe der Tabelle.

background="..." platziert ein Hintergrundbild mit der angegebenen URL in der Tabelle.

Zellenparameter

Das <td>-Tag unterstützt eine ganze Reihe von Attributen, die hier zum großen Teil aufgelistet werden.

align="center"|"right"|"left"|"justify" richtet den Inhalt der Zelle horizontal aus (linksbündig, rechtsbündig, zentriert, Blocksatz). Standard ist die linksbündige Ausrichtung.

valign="middle"|"top"|"bottom" richtet den Zellinhalt vertikal aus (oben, mittig, unten). Standard ist die mittige Ausrichtung.

colspan="..." gibt an, dass sich diese Zelle über die angegebene Anzahl von Spalten der Tabelle erstrecken soll; natürlich gibt es dann in der entsprechenden Zeile der Tabelle weniger Zellen.

rowspan="..." gibt an, dass sich die Zelle über die angegebene Anzahl von Zeilen der Tabelle erstrecken soll. Die Definition erfolgt in der obersten Zeile, in der die Zelle beginnt; in allen betroffenen Zeilen braucht die betreffende Zelle nicht mehr definiert zu werden.

width="..."|"...%" setzt die Zellbreite in Pixeln beziehungsweise relativ zur gesamten Tabelle. Wird die Breite jeder Zelle in Pixeln angegeben, so sollte eine Angabe der Tabellenbreite unterbleiben. Es genügt übrigens, wenn Sie diese Angaben einmal in den Zellen der obersten Zeile vornehmen (alternativ verstehen neuere Browser auch die im nächsten Unterabschnitt vorgestellten <colgroup>-Tags).

- Generell muss zu width-Angaben noch gesagt werden, dass die Breitenangabe ignoriert wird, falls der Inhalt einer Zelle in der jeweiligen Spalte zu breit ist, um in der gewünschten Zellbreite angezeigt zu werden.

height="..."|"...%" stellt die Höhe der Zelle in Pixeln beziehungsweise in Prozent der Tabellenhöhe ein. Auch hier wird die vollständige Darstellung des Inhalts gegenüber der Höhenangabe bevorzugt.

nowrap="nowrap" – in HTML 4.0 auch ohne Wertangabe – verhindert Zeilenumbrüche innerhalb einer Zelle. Es funktioniert in fast jedem Browser, gilt aber als veraltet und wird durch eine entsprechende Stylesheet-Angabe ersetzt.

Inhalt einer Zelle können beliebige Elemente sein, die HTML unterstützt, also Texte, Bilder und Hyperlinks. Natürlich kann ein <td> ... </td> auch wieder eine weitere Tabelle enthalten.

Zusatzfeatures

Tabellenbereiche

Eine moderne Möglichkeit der Tabellenformatierung ist die Aufteilung in Tabellenkopf, Tabellenkörper und Tabellenfuß. Diese Bereiche erfüllen zwei wichtige Zwecke: Erstens werden Kopf und Fuß beim Ausdrucken längerer Tabellen auf jeder Druckseite wiederholt, zweitens können sie mit den weiter unten gezeigten Anzeigeoptionen für die Gitternetzlinien kombiniert werden.

Der Kopf steht zwischen <thead> und </thead>; <tbody> und </tbody> umrahmen den Körper; der Fuß wird zwischen <tfoot> und </tfoot> gesetzt. Jede dieser Gruppen kann im Prinzip beliebig viele Tabellenzeilen enthalten, in der Regel werden Kopf und Fuß jedoch recht kurz sein.

Gitternetzlinien einzeln steuern

Im <table>-Tag können Sie über das neue Attribut rules steuern, welche Gitternetzlinien zwischen Zellen gezeichnet werden sollen und welche nicht. Grundvoraussetzung dafür, dass überhaupt sichtbare Linien angezeigt werden, ist die Anwesenheit des Attributs border mit einem Wert, der größer als 0 ist. Die möglichen Werte für rules sind folgende:

rules="none" – keine Linien (border zeigt nur noch den Außenrahmen an)

rules="rows" – es werden nur Zeilen-, aber keine Spaltentrennlinien gezeichnet.

rules="cols" – es werden Spalten-, aber keine Zeilentrennlinien gezeichnet.

rules="groups" – um die drei oben erläuterten Bereiche thead, tbody und tfoot wird jeweils ein eigener Rahmen gezeichnet.

rules="all" – alle Gitternetzlinien werden gezeichnet; dies ist der Standardfall.

Rahmenlinien einzeln steuern

Mithilfe des <table>-Attributs frame können Sie angeben, welche Teile des Außenrahmens angezeigt werden sollen:

frame="none" – es wird kein Außenrahmen gezeichnet; border zeigt nur noch die inneren Gitternetzlinien gemäß rules-Definition an.

frame="above" – es wird nur oben ein Rand gezeichnet.

frame="below" – der Rand wird nur unten gesetzt.

frame="lhs" – es wird nur ein linker Rand gezeichnet (lhs steht für »left hand side«).

frame="rhs" – nur rechts wird eine Rahmenlinie gesetzt (»right hand side«).

frame="hsides" – beide horizontalen Randlinien werden gezeichnet, das heißt oben und unten.

frame="vsides" – es werden nur die vertikalen Linien angezeigt, also links und rechts.

frame="box" – alle Randlinien werden gezeichnet; dies ist der Standardfall.

Spaltenbreiten angeben

Wenn Sie die Breitenangaben für Tabellenzellen (und damit -spalten) übersichtlicher gestalten möchten, können Sie für neuere Browser zu Beginn der Tabellendefinition einen <colgroup>-Bereich (»column group«, steht für »Spaltengruppe«) einrichten.

Innerhalb des Containers <colgroup> ... </colgroup> wird für jede einzelne Spalte ein leeres <col>-Tag gesetzt, das die Breite der entsprechenden Spalte definiert. Diese Breitenangabe erfolgt wie gewohnt über das Attribut width und kann drei verschiedene Arten von Werten ausdrücken: Eine einfache Zahl (zum Beispiel width="200") bezeichnet den angegebenen Wert in Pixeln, eine Zahl mit Prozentzeichen (etwa "30 %") ist der angegebene Prozentsatz der Tabellenbreite, und eine Zahl mit angehängtem Sternchen ("3*") gibt anteilige Breiten wie etwa in einem Cocktail-Rezept an (»1 Teil Rum, 3 Teile Cola«).

Das <colgroup>-Tag kann auch das optionale Attribut span enthalten, das die Anzahl der Spalten angibt. In diesem Fall steht auch die width-Angabe (in Pixeln) direkt in diesem Tag und gilt als Einheitsbreite für alle Spalten.

Hier ein kleines Beispiel:

<table border="2"> 
  <colgroup> 
    <col width="100" /> 
    <col width="300" /> 
  </colgroup> 
  <tr> 
    <td>100 Pixel breit</td> 
    <td>300 Pixel breit</td> 
  </tr> 
</table>

Die Tabelle besteht nur aus einer Zeile mit zwei Zellen, die linke ist 100 Pixel breit, die rechte 300 Pixel. Aus Sicherheitsgründen sollten Sie die enstprechenden Werte für ältere Browser auch noch einmal in die <td>-Tags schreiben.

Hier sehen Sie den Code für eine Tabelle, in der die drei Tabellenbereiche mit unterschiedlichen Rahmenoptionen definiert werden:

<?xml version="1.0" encoding="UTF-8"?> 
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" 
    "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> 
<html xmlns="http://www.w3.org/1999/xhtml"> 
  <head> 
    <title>HTML-Tabelle 3</title> 
  </head> 
  <body> 
    <table border="2" rules="groups" cellpadding="5"> 
      <thead> 
        <tr> 
          <th rowspan="2" valign="bottom">Tabellen- 
          Feature</th> 
          <th colspan="3">Unterst&uuml;tzt von:</th> 
        </tr> 
        <tr> 
          <th>Internet Explorer ab 4.0</th> 
          <th>Netscape 4.0</th> 
          <th>Netscape ab 6.0</th> 
        </tr> 
      </thead> 
      <tbody> 
        <tr> 
          <td>bordercolor</td> 
          <td>ja</td> 
          <td>ja</td> 
          <td>ja</td> 
        </tr> 
        <tr> 
          <td>bordercolorlight, bordercolordark</td> 
          ;<td>ja</td> 
          <td>nein</td> 
          <td>nein</td> 
        </tr> 
        <tr> 
          <td>thead, tbody, tfoot</td> 
          <td>ja</td> 
          <td>nein</td> 
          <td>ja</td> 
        </tr> 
      </tbody> 
      <tfoot> 
        <tr> 
          <td colspan="4" align="center">Alle Angaben 
            ohne Gew&auml;hr.</td> 
        </tr> 
      </tfoot> 
    </table> 
  <body> 
</html>

Tabellenbasiertes Seitenlayout

Da Tabellen in HTML nicht nur dem klassischen Zweck dienen, Textinformationen tabellarisch anzuordnen, sondern in der Regel auch für das gesamte Seitenlayout zuständig sind, finden Sie an dieser Stelle ein alltägliches Beispiel für Letzteres.

Das Beispiel ist für ein klassisches News- oder Portal-Site-Layout geeignet. Es ist dreispaltig angelegt, wobei die beiden äußeren Spalten feste Breiten haben und eingefärbt werden, während die mittlere Spalte den Rest der Fensterbreite einnimmt und in der Seitenhintergrundfarbe eingefärbt wird. Über diesem Drei-Spalten-Layout befinden sich in einer eigenen Tabelle links ein Logo und daneben ein Werbebanner. Hier sehen Sie den HTML-Code für eine solche Seite:

<!-- Logo und Banner: Eigene Tabelle --> 
<table border=0 cellspacing=8> 
  <tr> 
    <td> 
      <img src="logo.gif" width="100" height="80" 
      alt="Logo" /> 
    </td> 
    <td valign="bottom"> 
      <span style="font-size: 50%">- Anzeige -</span> 
      <br /> 
      <a href="http://site-des-inserenten.com"> 
      <img src="banner.gif" width="480" height="68" 
      alt="Werbebanner" /></a> 
    </td> 
  </tr> 
</table> 
<!-- Das eigentliche Layout --> 
<table border=0 width="100  %" cellspacing=8 
cellpadding=4> 
  <tr> 
    <td bgcolor="#9999FF" valign="top"> 
      Navigation 
      <br /> 
      <img src="pixel.gif" width="120" height="1" /> 
    </td> 
    <td valign="top" width="100  %"> 
      <h1>Top News</h1> 
      <!-- hier weiterer Text nach Belieben --> 
    </td> 
    <td bgcolor="#9999FF" valign="top"> 
      Unternavigation 
      <br /> 
      <img src="pixel.gif" width="120" height="1" /> 
    </td> 
  </tr> 
</table>

Dieses Layout verwendet zwei Tricks, um die Tabelle nach Möglichkeit in Form zu halten:

Die beiden äußeren Zellen enthalten keine Breitenangabe, sondern ein auf die entsprechende Breite skaliertes »Pixel-GIF«. Es handelt sich dabei um ein 1 × 1 Pixel großes transparentes Bild vom Typ GIF, das häufig als Abstandhalter eingesetzt wird.

Die mittlere Zelle enthält die eigentlich inkorrekte Breitenangabe 100 % – auf diese Weise werden die beiden äußeren Zellen jeweils an den Rand gedrückt und können nicht breiter werden als das jeweilige Pixel-GIF.

Abbildung 16.4 zeigt ein Beispiel für dieses Layout in Aktion.

Hier klicken, um das Bild zu vergrößern

Abbildung 16.4 Ein tabellenbasiertes Webseitenlayout in Aktion

Der große Vorteil dieses Layouts besteht darin, dass es sich einer beliebigen Bildschirmauflösung und Browserfenstergröße anpasst. Allerdings wird der Fließtext in der mittleren Spalte bei besonders großen Monitoren zu breit und damit schlecht lesbar. Eine Variante dieses Layoutmusters, die viele Sites inzwischen nutzen, gibt deshalb keine 100 % Breite für die große Tabelle an, sondern einen festen Pixelwert von beispielsweise 700. In diesem Fall sollte allerdings auch die Hauptinhaltszelle eine eigene Hintergrundfarbe erhalten, die sich von der des Browserfensters abhebt.

16.1.7 Formulare

Suchmaschinen, Bestellseiten oder Webforen bestehen aus diversen Eingabeelementen wie Textfeldern oder Auswahlknöpfen. Der übergeordnete Container für eine Gruppe solcher interaktiven Elemente ist das HTML-Formular. Seine Definition enthält eine URL, an die sämtliche eingegebenen Daten versandt werden. Formulare bilden also das Frontend webbasierter Anwendungen.

Jedes Formular steht zwischen den folgenden Tags:

<form action="URL" method="Versandmethode"> 
  <!-- beliebiges HTML mit Formularelementen --> 
</form>

Als Action-URL wird meist die Adresse eines Server-Skripts angegeben. Eine verbreitete Technik für solche Skripte, die Skriptsprache PHP 5, wird in Kapitel 17, Webserveranwendungen, beschrieben.

Theoretisch ist auch die Angabe einer E-Mail-Adresse möglich. Genau wie bei einem E-Mail-Hyperlink wird dazu eine Pseudo-URL nach dem Muster "mailto:E-Mail-Adresse" eingesetzt. Das Problem dieser Variante besteht jedoch darin, dass neuere Versionen des Internet Explorers und einige andere Browser diese Aufforderung falsch verstehen und ein leeres Mail-Fenster öffnen, wenn das Formular abgeschickt wird. Das führt zu der Konsequenz, dass auch der Versand per E-Mail nur dann wirklich zuverlässig klappt, wenn er durch ein Server-Skript vorgenommen wird.

Versandmethoden

Das Attribut method gibt an, über welche HTTP-Methode die Daten versendet werden sollen (siehe auch Kapitel 12, Server für Webanwendungen): "post" versendet sie separat im Body der HTTP-Anfrage. "get" hingegen hängt die Formulardaten direkt an die URL an, in der Form url?daten. Beispielsweise verwenden Suchanfragen an Suchmaschinen oft diese Form, sodass zum Beispiel die URL einer Suche nach dem Begriff »html« bei Google (in minimaler Form) folgendermaßen aussieht:

http://www.google.de/search?q=xhtml

Der Parameter q=xhtml wird also an das Programm search übermittelt. Hinter den Kulissen befragt dieses Programm daraufhin Googles Datenbank, nimmt die Ergebnisse entgegen und generiert wiederum eine HTML-Seite daraus, die es an den Browser des Anfragenden zurücksendet.

Ein Vorteil der Methode "get" besteht darin, dass Sie die URL in der Bookmark-Verwaltung Ihres Browsers ablegen können. Allerdings ist sie nicht für größere Datenmengen geeignet, da die Maximallänge für URLs 2000 Zeichen beträgt.

Das schwerwiegendste Problem von GET-Anfragen besteht darin, dass Browser oder Proxyserver sie im Cache speichern können. Daher kann es vorkommen, dass die vermeintliche Bestätigung einer Server-Aktion in Wirklichkeit aus einem Cache stammt. Formulare, die serverseitige Änderungen bewirken sollen (zum Beispiel Bestellungen oder Schreibzugriffe auf eine Datenbank), müssen daher immer POST verwenden. [Falls es aus irgendeinem Grund unbedingt GET sein muss, besteht eine Notlösung darin, einen Parameter mit wechselndem Zufallswert an die URL anzuhängen. Da ein Cache die gesamte URL betrachtet, kommt er in diesem Fall nicht auf die Idee, dass das gewünschte Dokument bereits vorliegen könnte. Ein Beispiel finden Sie weiter unten im Abschnitt zu Ajax. ]

Ein weiteres (optionales) Attribut ist enctype; es gibt den MIME-Type der übertragenen Formulardaten an. Der Standardwert ist "application/x-www-form-urlencoded"; dieses Format ersetzt in den Formulardaten alle Zeichen, die in URLs nicht gestattet sind oder in Formulardaten eine Sonderbedeutung haben, durch passende Escape-Sequenzen: Leerzeichen werden zu +-Zeichen; die meisten Satzzeichen und alle Nicht-ASCII-Zeichen werden durch ein %-Zeichen und ihren zweistelligen hexadezimalen Code im Zeichensatz ersetzt. Falls Sie den Datei-Upload über ein Formular ermöglichen möchten, müssen Sie den Typ "multipart/form-data" wählen.

Formularelemente

Innerhalb des Containers <form> ... </form> können Sie eine Reihe unterschiedlicher Eingabeelemente definieren. Die meisten von ihnen verwenden das <input>-Tag:

<input type="Elementtyp" name="Elementname" 
value="Wert" />

type gibt an, um welche Art von Eingabeelement es sich überhaupt handelt – beispielsweise ein Textfeld (type="text") oder ein Absendeknopf (type="submit"). name und value bilden ein Name/Wert-Paar, das als Name=Wert mit den Formulardaten versandt wird. Je nach konkretem Eingabeelement kommt das eine oder andere Spezialattribut hinzu.

<input type="radio" name="..." value="..." /> definiert einen sogenannten Radio-Button. Der Name stammt daher, dass dieser Button sich so verhält wie die Knöpfe an alten Radios: Wird einer von ihnen gedrückt, springt der zuvor ausgewählte automatisch heraus. Mit Radio-Buttons können Sie dem Benutzer die Auswahl einer einzigen Option aus mehreren Alternativen ermöglichen. name bezeichnet dabei den Namen der Gruppe, zu der der Radio-Button gehört. value ist der Inhalt, der als Auswahl für diese Gruppe in den Formulardaten erscheinen soll. Der Text, mit dem der Button beschriftet werden soll, wird einfach hinter das Tag gesetzt.

<input type="checkbox" name="..." value="..." /> definiert eine Checkbox, mit der Benutzer mehrere Optionen an- und wieder abwählen können. Der optionale Parameter checked="checked" kann bei Checkboxen und Radiobuttons stehen und hat zur Folge, dass die entsprechende Option innerhalb ihrer Gruppe bereits ausgewählt ist.

<input type="text" name="..." size="..." maxlength="..." /> bietet ein Feld zur Texteingabe an; optional gibt size die Breite in Zeichen und maxlength die maximale Eingabelänge an. Der ebenfalls optionale Parameter value="..." sorgt dafür, dass der betreffende Text bereits voreingetragen im Textfeld steht.

<input type="password" name="..." size="..." maxlength="..." /> funktioniert im Prinzip genau wie ein Textfeld – mit dem Unterschied, dass die Eingabe als »****« angezeigt wird.

<input type="submit" value="..." /> stellt einen Button zur Verfügung, der durch Mausklick den Inhalt des Formulars an die URL versendet, die im <form>-Tag angegeben wurde. value hat hier eine etwas andere Bedeutung: Es enthält den Text, mit dem der Button beschriftet wird.

<input type="reset" value="..." /> setzt alle Einträge, die der Benutzer im Formular vorgenommen hat, auf den Ursprungszustand zurück. value enthält wiederum die Beschriftung des Buttons.

<input type="button" value="..." /> stellt eine allgemeine Schaltfläche zur Verfügung, deren Aussehen einem Absende- oder Lösch-Button entspricht. In Zusammenarbeit mit JavaScript (siehe Kapitel 18, JavaScript und Ajax) kann sie ein benutzerdefiniertes Ereignis auslösen.

<input type="hidden" name="..." value="..." /> ist im engeren Sinne kein Eingabefeld, denn es wird vom Browser nicht angezeigt und Benutzer können keine Eingabe vornehmen. Es handelt sich um eine festgelegte Angabe, die zusammen mit den vom Benutzer eingegebenen Formulardaten übertragen wird. Nützlich sind Hidden-Felder etwa für Ordnungszwecke (Welches Formular wurde eigentlich versandt?) oder für Zwischenwerte, die von serverseitigen Programmen generiert wurden und wieder mit den Daten verschickt werden müssen, um vom nächsten Skript aus darauf zurückzugreifen.

<input type="file" name="..." /> bietet die Möglichkeit, den Pfad einer lokalen Datei einzutippen oder über einen mitgelieferten Button interaktiv auszuwählen. Wenn das Empfängerskript über eine entsprechende Einrichtung verfügt, wird die angegebene Datei zusammen mit den anderen Formulardaten hochgeladen. In Kapitel 17, Webserveranwendungen, finden Sie ein entsprechendes PHP-Skript mit weiteren Hinweisen. Beachten Sie, dass der Formulardatentyp über das <form>-Attribut enctype auf "multipart/form-data" gesetzt werden muss, damit es funktioniert.

Neben den diversen <input>-Varianten gibt es noch weitere Formularelemente, die über eigenständige Tags gebildet werden.

Auswahlmenüs

Außer Checkboxen und Radiobuttons kann ein Formular auch noch Menüs enthalten, aus denen der Benutzer auswählen kann. Diese Menüs haben in HTML folgende Syntax:

<select name="..." size="..."> 
  <option value="..."> 1. Auswahlmöglichkeit </option> 
  <option value="..."> 2. Auswahlmöglichkeit </option> 
  <!-- bei Bedarf weitere Optionen --> 
</select>

Diese Struktur stellt ein Menü zur Verfügung, das die verschiedenen Auswahlmöglichkeiten enthält. Die zusätzliche Option multiple="multiple" bei <select> ermöglicht die Auswahl mehrerer Felder – allerdings muss dabei die Taste Keyboard Strg beziehungsweise Keyboard Apfel (Mac) festgehalten werden, worauf Sie die Benutzer hinweisen sollten.

name enthält wiederum den Namen, mit dem der übertragene Wert in den Formulardaten versehen wird. size gibt die Anzahl der sichtbaren Zeilen an; wird diese von der Anzahl der Optionen überschritten, erscheint automatisch ein Rollbalken. Der von den meisten Autoren verwendete Sonderfall size="1" erzeugt ein relativ elegantes Pulldown-Menü.

Das <option>-Tag bestimmt durch das Attribut value wiederum den zu übertragenden Wert für die Formulardaten. Darüber hinaus kennt es den zusätzlichen Parameter selected="selected", der innerhalb eines Select-Menüs nur auf ein einziges <option>-Tag angewandt werden sollte und dafür sorgt, dass die entsprechende Option vorausgewählt ist.

Mehrzeilige Textbereiche

Die Texteingabe in ein Formular ist auch mehrzeilig möglich, und zwar über das folgende Tag:

<textarea name="..." rows="..." cols="..."></textarea>

Dieses Tag stellt ein Eingabefeld mit der durch cols angegebenen Breite und der mittels rows eingestellten Höhe zur Verfügung. Sollte zwischen dem öffnenden und dem schließenden Tag Text stehen, so erscheint er als vorgefertigter Eintrag im Feld. Auch wenn Sie keinen Text hineinschreiben, sollten Sie das Tag explizit schließen und nicht per XML-End-Slash, weil ältere Browser ihn nicht verstehen und in diesem Fall einfach den Rest des Dokuments in das Textfeld schreiben.

Der optionale Parameter wrap gibt die Art des Zeilenumbruchs an, der verwendet werden soll:

wrap="none" setzt keine automatischen Zeilenumbrüche; Benutzer können beliebig in derselben Zeile weiterschreiben (Standard bei älteren Browsern; funktioniert bei moderneren oft gar nicht mehr).

wrap="virtual" bricht am rechten Feldrand um, jedoch nur in der Darstellung; der gespeicherte Text enthält keine Zeilenumbrüche (Standard bei den meisten aktuellen Browsern).

wrap="physical" setzt dagegen Zeilenumbrüche in den eigentlichen Text, wenn er am rechten Feldrand umgebrochen wird.

Das folgende Beispiel verwendet fast alle oben gezeigten Formularelemente für den Klassiker – ein Pizza-Bestellformular:

<html> 
  <head> 
    <title>Pizza bestellen</title> 
  </head> 
  <body> 
    <h1>Pizza-Service Online</h1> 
    <p>Konfigurieren Sie Ihre Pizza!</p> 
    <form action="#" method="GET"> 
      <table border="0" cellpadding="4"> 
        <tr> 
          <td colspan="3">W&auml;hlen Sie die 
          Gr&ouml;&szlig;e Ihrer Pizza:</td> 
        </tr> 
        <tr> 
          <td><input type="radio" name="psize" 
          value="s" />Mini (18 cm)<br /> 
          Grundpreis: 3 &euro;</td> 
          <td><input type="radio" name="psize" 
          value="m" />Standard (24 cm)<br /> 
          Grundpreis: 5 &euro;</td> 
          <td><input type="radio" name="psize" 
          value="l" />Family (32 cm)<br /> 
          Grundpreis: 7 &euro;</td> 
        </tr> 
        <tr> 
          <td colspan="3">Jede Pizza ist mit K&auml;se 
            und Tomaten belegt.<br /> 
          W&auml;hlen Sie hier weitere Bel&auml;ge (je 
          1,- &euro;)</td> 
        </tr> 
        <tr> 
          <td><input type="checkbox" name="belag" 
          value="spi" />Spinat</td> 
          <td><input type="checkbox" name="belag" 
          value="pil" />Pilze</td> 
          <td><input type="checkbox" name="belag" 
          value="pap" />Paprika</td> 
        </tr> 
        <tr> 
          <td><input type="checkbox" name="belag" 
          value="sal" />Salami</td> 
          <td><input type="checkbox" name="belag" 
          value="sch" />Schinken</td> 
          <td><input type="checkbox" name="belag" 
          value="thu" />Thunfisch</td> 
        </tr> 
        <tr> 
          <td><input type="checkbox" name="belag" 
          value="zwi" />Zwiebeln</td> 
          <td><input type="checkbox" name="belag" 
          value="xka" />Extra K&auml;se</td> 
          <td><input type="checkbox" name="belag" 
          value="xto" />Extra Tomaten</td> 
        </tr> 
        <tr> 
          <td colspan="3">Sind Sie bereits Kunde?</td> 
        </tr> 
        <tr> 
          <td>Ihr Username:</td> 
          <td colspan="2"><input type="text" name="kunde" 
          size="20" maxlength="10" /></td> 
        </tr> 
        <tr> 
          <td>Ihr Passwort:</td> 
          <td colspan="2"><input type="password" 
          name="pass" size="20" maxlength="8" /></td> 
        </tr> 
        <tr> 
          <td colspan="3">Oder sind Sie neu? 
          <a href="neukunde.htm">Hier klicken</a></td> 
        </tr> 
        <tr> 
          <td colspan="3">Weitere Sonderw&uuml;nsche, 
          Bemerkungen, Anregungen?<br /> 
          <textarea name="bemerk" cols="50" rows="7" 
          wrap="virtual"></textarea></td> 
        </tr> 
        <tr> 
          <td>Die Bestellung:</td> 
          <td> 
            <input type="submit" value="Abschicken" /> 
          </td> 
          <td> 
            <input type="reset" value="Verwerfen" /> 
          </td> 
        </tr> 
      </table> 
    </form> 
  </body> 
</html>

16.1.8 Einbetten von Multimedia-Dateien

Moderne Browser können verschiedene Zusatzkomponenten beinhalten, sogenannte Plug-ins (Firefox und andere Mozilla-Derivate) beziehungsweise ActiveX-Controls (Internet Explorer für Windows). Dadurch unterstützt der Browser zusätzlich zu den Standard-Elementen verschiedene andere Dateiformate.

Sie können zum Beispiel Sounds oder Digitalvideos abspielen lassen. Zu den bekanntesten Plug-in-Dateien gehören die Formate Flash und Shockwave von Adobe (vormals Macromedia).

Plug-in-Syntax

Mozilla-Browser verwenden zum Einbetten von Plug-in-Dateien traditionell das Tag <embed>; sofern ein entsprechender Player bereits installiert ist, versteht auch der Internet Explorer diese Schreibweise. Der folgende Code bettet die MP3-Sound-Datei musik.mp3 in das Dokument ein und spielt sie nach dem Laden automatisch ab:

<embed src="musik.mp3" width="200" height="100" autostart="true"  
type="audio/mp3"></embed>

width und height bestimmen bei einem Sound die Anzeigegröße der verwendeten Player-Komponente; an dieser Stelle werden einige Buttons wie Play, Stop oder Lautstärkeregelung angezeigt. Das genaue Aussehen ist nicht vorhersagbar, es hängt vom verwendeten Player ab, beispielsweise sehen QuickTime und der Windows Media Player recht unterschiedlich aus. Alternativ können Sie mit hidden="true" dafür sorgen, dass gar keine Regler angezeigt werden. Das optionale Attribut loop="true" spielt den Sound in einer Schleife ab.

Für Digitalvideo (QuickTime, Video for Windows, MPEG und so weiter) stehen im Prinzip dieselben Optionen zur Verfügung; naturgemäß sind die Attribute width und height hier wichtiger als bei Sound. Die MIME-Types für die wichtigsten Plug-in-Formate finden Sie in Tabelle 16.3.

**Tabelle 16.3** Die wichtigsten MIME-Types für Multimedia-Plug-in-Formate
Format	Dateiendung	MIME-Type
MP3-Sound	.mp3	audio/mp3 oder audio/mpeg
WAVE-Sound	.wav	audio/wav
AIFF-Sound	.aif, .aiff	audio/aiff
Sun AU-Sound	.au	audio/au
MPEG-Video	.mpg, .mpeg	video/mpeg
QuickTime-Video	.mov, .qt	video/quicktime
Video for Windows	.avi	video/avi
Macromedia Flash	.swf	application/x-shockwave-flash
Macromedia Director	.dcr	application/x-director

Je nach eingebettetem Dateiformat werden noch weitere Attribute unterstützt. Beim Einbetten von Adobe Flash-Filmen werden besonders viele Optionen angeboten.

Objekte einbetten

Der Microsoft Internet Explorer bietet ein anderes Modell für Multimedia-Komponenten an, die sogenannte ActiveX-Technologie: Wenn zum ersten Mal eine Datei eines unbekannten Typs eingebettet wird, lädt der Browser automatisch die passende Komponente herunter, genannt ActiveX-Control, und installiert sie, während der Browser läuft.

ActiveX-Sicherheitsprobleme

Leider ist damit ein enormes Sicherheitsrisiko verbunden: Ein ActiveX-Control hat dieselben Befugnisse wie ein lokales Programm – theoretisch könnte Ihnen jemand eine Komponente unterjubeln, die Ihr System massiv beschädigt. Sie sollten darauf achten, nur signierte Controls zu akzeptieren, und auch diese nur per Anfrage (in neueren Versionen des Internet Explorers ist dies glücklicherweise die Voreinstellung). Vor dem Download einer Komponente erscheint dann ein Bestätigungsfenster, in dem der Anbieter genannt wird. Seine Identität wird durch ein elektronisches Zertifikat garantiert. Sie sollten dem Download nur zustimmen, wenn Sie wissen, was Sie tun.

Das folgende Beispiel zeigt, wie die Director-Shockwave-Datei test.dcr eingebettet wird:

<object classid="clsid:166B1BCA-3F9C-11CF-8075–444553540000" 
codebase="http://download.macromedia.com/pub/shockwave/ 
cabs/director/sw.cab#version=8,5,1,0" width="320" 
height="240"> 
<param name="src" value="test.dcr" /> 
</object>

Die 128 Bit lange Class-ID ist die eindeutige Registriernummer der jeweiligen ActiveX-Komponente. Diese Nummer kann sich wahrscheinlich kein Mensch merken. Sie können sie allerdings bei Microsoft oder beim Anbieter der jeweiligen Komponente nachschlagen. Im Zweifelsfall hilft auch die Angabe classid="CLSID:05589FA1-C356-11CE-BF01-00AA0055595A", die für alle Audio- und Videoformate zuständig ist.

codebase gibt die Download-Adresse für das ActiveX-Control an. Die meisten anderen Optionen werden als separate <param>-Tags eingebettet; hier beispielsweise die Angabe src, die die URL der eingebetteten Datei angibt.

Browserübergreifende Lösung

Da Mozilla-Browser kein ActiveX unterstützen, wird in der Regel einfach ein entsprechendes <embed>-Tag hineinverschachtelt:

<object classid="clsid:166B1BCA-3F9C-11CF-8075–444553540000" 
codebase="http://download.macromedia.com/pub/shockwave/ 
cabs/director/sw.cab#version=8,5,1,0" width="320" 
height="240"> 
<param name="src" value="test.dcr" /> 
<embed src="test.dcr" width="320" height="240" 
type="application/x-director" 
pluginspage=" http://www.adobe.com/shockwave/download/"></embed> 
</object>

Java-Applets einbetten

Die früher gern für Web-Multimedia eingesetzten Java-Applets werden heute nur noch selten verwendet. Die meisten ihrer früheren Aufgaben können mit erheblich weniger Aufwand und geringerer Ladezeit erledigt werden, beispielsweise mithilfe von Flash.

Wollen Sie dennoch ein Java-Applet einbetten, dann erfolgt dies mithilfe des <applet>-Tags. Das folgende Beispiel bettet ein Applet namens Malen.class mit der Anzeigegröße 400 × 400 Pixel in das Dokument ein:

<applet code="Malen.class" width="400" height="400"></applet>

Auch innerhalb des <applet>-Blocks können <param>-Tags wie bei <object> stehen, spezielle Java-Anweisungen nehmen die entsprechenden Parameter entgegen. Hinweise zum Schreiben von Java-Applets finden Sie in Kapitel 9, Konzepte der Programmierung.

16.1.9 Meta-Tags und Suchmaschinen

Im Head eines HTML-Dokuments können Sie neben dem Titel – übrigens der wichtigsten Information für Suchmaschinen – eine Reihe zusätzlicher Informationen unterbringen, von denen einige für den Browser und andere für Suchmaschinen gedacht sind. Die meisten dieser Informationen stehen in sogenannten <meta>-Tags. Der Aufbau dieser Tags ist folgender:

<meta name="..." content="..." />

oder

<meta http-equiv="..." content="..." />

Die Attribute name beziehungsweise http-equiv geben den Namen oder die Kategorie einer zu definierenden Information an, content enthält ihren Wert. Der Unterschied zwischen der name- und der http-equiv-Variante besteht darin, dass eine http-equiv-Information (»http equivalent«) einem HTTP-Header-Feld entspricht. In der Regel handelt es sich um wichtige Verarbeitungsoptionen für den Browser. Eine der wichtigsten Informationen dieses Typs gibt den MIME-Type und den Zeichensatz der Webseite an und überschreibt den Standardwert, den der Webserver liefert – hier mit dem Standard-Westeuropa-Zeichensatz latin-1:

<meta http-equiv="content-type" content="text/html; charset=iso-8859–1" />

Andere Zeichensätze sind beispielsweise iso-8859-9 für türkischen Text oder iso-8859-7 für Griechisch. Näheres über Zeichensätze und verwandte Themen finden Sie in Kapitel 15, Weitere Datei- und Datenformate.

Automatischer Refresh

Eine weitere häufig verwendete Variante ist das automatische erneute Laden der aktuellen Seite beziehungsweise die Weiterleitung auf eine andere. Dazu wird folgendes Tag gesetzt:

<meta http-equiv="refresh" content="10" />

Unter content wird die Anzahl der Sekunden angegeben, nach der die Seite erneut geladen werden soll. Nützlich ist dies bei Dokumenten, deren Inhalte häufig durch serverseitige Informationen aktualisiert werden, beispielsweise Sportergebnisse oder Börsenkurse.

Die folgende Variante lädt statt der bisherigen Seite nach fünf Sekunden das Dokument test.htm:

<meta http-equiv="refresh" content="5;url=test.htm" />

Dies ist beispielsweise nützlich, wenn die eigene Website auf eine neue Adresse umgezogen ist, die bekannt gemacht werden soll.

Suchmaschinen-Informationen

Zunächst einmal müssen Sie wissen, welche Informationen Suchmaschinen überhaupt auswerten. Die wichtigste Angabe ist, wie bereits erwähnt, der weiter oben beschriebene Dokumenttitel:

<title>...</title>

Weiterhin sind einige Meta-Tags sehr wichtig:

<meta name="description" content="Kurze Beschreibung der Website/einzelnen Seite" />

Der Text sollte jeweils einen kurzen Hinweis auf die gesamte Website und anschließend eine Beschreibung des jeweiligen Dokuments enthalten. Die meisten Suchmaschinen werten etwa 150 bis 200 Zeichen aus.

Mit dem folgenden Meta-Tag können Sie eine Reihe relevanter Schlüsselwörter angeben, die vor allem als Suchbegriffe für die Website dienen sollen:

<meta name="keywords" content="..." />

Ein ungefährer Richtwert sind etwa 20 bis 50 Schlüsselwörter. Wichtig ist, dass die meisten Suchmaschinen keine Wiederholungen dulden. Ab der dritten Wiederholung werden Sie womöglich sogar aus der Datenbank einer Suchmaschine entfernt.

Die Begriffe »Künstler, Künstlerin, Künstlerbedarf« stellen beispielsweise keine Wiederholung dar. Verboten wäre dagegen die Liste »Künstler, künstler, KÜNSTLER«. Sie sollten die Schreibweise »Künstler« wählen, denn bei vielen Suchmaschinen funktioniert die Suchbegriffseingabe nach dem folgenden Schema: Kleinschreibung findet alle Varianten, gemischte Groß-/Kleinschreibung findet genau die eingegebene Variante; bei anderen spielen Groß- und Kleinschreibung dagegen gar keine Rolle.

Sie sollten die folgenden Arten von Schlüsselwörtern verwenden:

Angaben über das Tätigkeitsfeld, den Zweck oder das Interessengebiet der Website

Geografische Angaben wie Gemeinde oder Bundesland

Namen wichtiger Personen

Vermeiden sollten Sie dagegen die folgenden Arten von Wörtern:

Allgemeine Wörter, Füll- und Flickwörter

Wörter, die zwar viele Hits bringen, aber nichts mit der eigenen Website zu tun haben

Markennamen, insbesondere der Konkurrenz – sie können zu rechtlichen Problemen führen

Der in älteren Dokumentationen oft empfohlene Text in Hintergrundfarbe ist für viele Suchmaschinen ebenfalls ein guter Grund zum Ignorieren. Auch die schnelle automatische Weiterleitung über mehrere Pseudo-Tunnelseiten hinweg, die vermeintlich das Unterbringen von mehr relevantem Text ermöglicht, wird oft nicht toleriert.

Das Meta-Tag robots steuert den Zugriff von Suchmaschinen auf die aktuelle Seite sowie die Beachtung von Hyperlinks:

<meta name="robots" content="[no]index, [no]follow" />

index bedeutet, dass die aktuelle Seite indiziert werden soll, während noindex die Seite ignoriert. follow folgt automatisch den Hyperlinks auf der aktuellen Seite, nofollow folgt den Links nicht.

Bei normalen Websites sollte auf jeder öffentlichen Einzelseite index, follow verwendet werden. Auf der Startseite von Frame-Websites sollte dagegen index, nofollow stehen, damit die Einzelseiten nicht indiziert werden.

Das robots-Meta-Tag wird nicht von allen Suchmaschinen unterstützt. Zusätzlich sollte im obersten Verzeichnis der Site die Textdatei robots.txt liegen, die folgende Angaben enthalten kann:

User-agent ist der Name, mit dem sich die Suchmaschinensoftware beim Server meldet. In der Regel wird User-agent: * verwendet, was für alle Suchmaschinen steht.

Disallow: /verzeichnis bedeutet, dass alle Dateien und Unterverzeichnisse unterhalb von /verzeichnis für Suchmaschinen gesperrt sind.

Zu guter Letzt sollten Sie daran denken, dass selbst die besten Meta-Tags nicht gegen inhaltsreichen und gut strukturierten Text ankommen. Bild- oder Flash-lastige Seiten haben es im Ranking der Suchmaschinen relativ schwer.

Anmeldung bei Suchmaschinen

Nachdem Sie die genannten Informationen eingetragen haben, müssen Sie sich bei den einzelnen Suchmaschinen anmelden. Dabei ist zwischen echten Suchmaschinen wie Google, AltaVista oder Lycos und redaktionell betreuten Katalogen wie Yahoo! oder web.de zu unterscheiden.

Bei den echten Suchmaschinen gibt es irgendwo einen Link wie »Seite anmelden« oder Ähnliches. Sie müssen hier lediglich die URL der Website und eventuell eine E-Mail-Adresse für Rückfragen eingeben. In den nächsten Tagen nach der Anmeldung besucht die Suchmaschine die Website und indiziert sie gemäß des robots-Meta-Tags und der Datei robots.txt.

Bei den Katalogen müssen Sie in der Regel ein umfangreiches Formular ausfüllen. Der Katalogbetreiber entscheidet daraufhin selbst, ob die Site aufgenommen wird oder nicht.

Auch die »automatische« Anmeldung bei mehreren Suchmaschinen ist möglich. Dazu können Sie Programme verwenden, die auf dem eigenen Rechner installiert werden, beispielsweise HelloEngines (http://www.helloengines.de/). Daneben existieren auch Websites, die diese Dienstleistung durchführen, zum Beispiel den Hit Counter Killer (http://www.submit4free.de/).

Ihr Kommentar

Wie hat Ihnen das <openbook> gefallen? Wir freuen uns immer über Ihre freundlichen und kritischen Rückmeldungen.