Navigation links
Text only version
print/save

2006-05-11 - Lezione 2: XML

XHTML, come abbiamo detto, è basato sullo standard XML, un formato di file di testo adatto a rappresentare qualsiasi tipo di dato, anche se per alcuni tipi di informazione (ad esempio le immagini bitmap) non viene usato in quanto non conveniente in termini di spazio su disco o prestazioni. Alcune cose comunemente rappresentate in XML sono:

  • Pagine web
  • File di configurazione
  • File da ufficio (Openoffice, Opendocument, Microsoft Office)
  • Grafica vettoriale (SWF)
  • Informazioni esportate dalle basi dati
  • Altro ancora...

La sintassi XML

Un file XML è strutturato da entità o elementi:

<tag attributo1="valore1" attributo2="valore2">contenuto</tag>

Gli attributi possono essere presenti o meno, così come il contenuto.
Il contenuto, a sua volta, può contenere altre entità, nidificabili all'infinito.
Quando si nidificano le entità è buona norma apporre degli spazi di tabulazione.

Ad esempio:
<?xml version="1.0" encoding="UTF-8"?>
<azienda>
	<dipendente>
		<nome>Mario Rossi</nome>
		<ruolo>Impiegato</ruolo>
		<sezione>Marketing</sezione>
	</dipendente>
	<dipendente pensionato="true">
		<nome>Luigi Bianchi</nome>
	</dipendente>
</azienda>

Quello soprastante è un file XML completo e valido. La prima riga indica il tipo di file, la versione del formato utilizzata e la codifica caratteri. Noi utilizzeremo sempre UTF-8 in quanto è l'unica codifica che permetta, contemporaneamente, di supportare tutte le lingue del mondo.

Ogni tag aperta dev'essere chiusa nell'ordine in cui era stata aperta.
Quindi se aprite due tag "pippo" e "pluto", siete obbligati a chiuderle nell'ordine contrario a cui le avevate aperte.

Giusto:
<pippo><pluto>...</pluto></pippo>

Sbagliato:
<pippo><pluto>...</pippo></pluto>

Una tag senza contenuto, <tag opzione="valore"></tag>,
viene solitamente espressa nella sua forma abbreviata: <tag opzione="valore" />

Nei tag e nei nomi degli attributi vanno usate esclusivamente le lettere minuscole.
L'XML non specifica come debbano chiamarsi i tag, cosa debbano contenere, se siano obbligatori o opzionali, o che opzioni ci debbano essere: questo è il compito di linguaggi di livello superiore che ne fanno uso come, ad esempio, XHTML.

In XML si possono usare tutti i caratteri che si vogliono, tranne i tre seguenti, che vengono usati dal linguaggio: < > &. Inoltre, non è possibile inserire il carattere " all'interno del valore di un attributo.

Questi quattro caratteri devono essere sostituiti da un codice di escape:
<     &lt;
>     &gt;
&     &amp;
"     &quot;
esempio:

Sbagliato:
<azienda proprietario="Giuseppe "Beppe" Rossi">
	Premiata Ditta "<Rossi Giuseppe> & Figli"
</azienda>
Giusto:
<azienda proprietario="Giuseppe &quot;Beppe&quot; Rossi">
	Premiata Ditta "&lt;Rossi Giuseppe&gt; &amp; Figli"
</azienda>
Creative Commons License
This site and all its contents, save where explicitly noted, have been created by CRV§ADER//KY
and are published under the Creative Commons Attribution - Share Alike License.