Caratteri speciali

Le lettere accentate

Un altro aspetto preliminare che occorre conoscere per la creazione di documenti in HTML riguarda le lettere accentate e i caratteri speciali. Tutti i browser Web con interfacce grafiche sono in grado di visualizzarli. Ma per essere trasmessa e ricevuta correttamente da qualunque server e client, su qualsiasi piattaforma, una pagina HTML dovrebbe limitarsi a usare la sola codifica ASCII standard, che non contiene nessuna delle lettere accentate.

I linguaggi come HTML, forniscono uno strumento sintattico che permette di superare questa limitazione: le entità carattere. Una entità è sostanzialmente una sequenza di caratteri ASCII standard che rappresenta un carattere non presente in quell'insieme. Per identificare queste entità si usano due caratteri delimitatori all'inizio ed alla fine: la e commerciale (&), e il punto e virgola (;). Tra questi due delimitatori possono occorrere un numero qualsiasi di caratteri. In allegato alle specifiche dello HTML sono state distribuite due liste ufficiali di entità per i caratteri degli alfabeti latini e per i caratteri speciali. I nomi delle entità per i caratteri sono stati creati con un artificio molto semplice e comodo da ricordare: il carattere stesso, cui si aggiungono le stringhe "grave" per indicare la versione con accento grave, "acute" per indicare la versione con accento acuto, e così via. La distinzione tra maiuscolo e minuscolo è rilevante.
Ecco la lista delle entità per i caratteri accentati dell'ortografia italiana:
  • à à
  • è è
  • é é
  • ì ì
  • ò ò
  • ù ù
  • À À
  • È È
  • É É
  • Ì Ì
  • Ò Ò
  • Ù Ù

Ed ecco alcuni caratteri speciali che possono tornare utili (notare che le virgolette, i simboli di maggiore e minore e la '&' richiedono un carattere speciale, per non essere confusi con parte di istruzioni HTML):

  • Ó ©
  • Ò ®
  • > >
  • < &lt;
  • & &amp;
  • " &quot;

Per fare in modo che una pagina Web venga visualizzata correttamente da qualsiasi client è dunque necessario sostituire le lettere accentate con le corrispondenti entità carattere. Quando le scrivete non dimenticate il punto e virgola: indica al browser dove finisce la sequenza di controllo!

Le entitá per i caratteri speciali utilizzati nel linguaggio HTML possono avere comunque due forme: nome - numero.
Entrambe iniziamo con il carattere & e terminano con il ;
  • il primo caso lo abbiamo visto sopra
  • nel secondo il segno di cancelletto e il numero corrispondente alla posizione del carattere nel set ISO-Latin-1.
Per essi vengono impiegate le sequenze di escape, tra cui:

&#162;          ¢
&#163;          £
&#36;           $
&#166;          ¦
&#167;          §
&#168;          ¨
&#169;          ©        &copy; (Netscape)
&#170;          ª
&#171;          «
&#172;          ¬
&#173;          ­
&#174;          ®        &reg; (Netscape)
&#175;          ¯
&#176;          °
&#177;          ±
&#178;          ²
&#179;          ³
&#180;          ´
&#181;          µ
&#182;          ¶
&#183;          ·
&#184;          ¸
&#185;          ¹
&#186;          º
&#187;          »
&#188;          ¼
&#189;          ½
&#190;          ¾
&#191;          ¿
&#215;          ×
&#222;          Þ
&#247;          ÷

É utile comunque tener sempre presente che le entitá per caratteri funzionano meglio in teoria che in pratica. Di tutti i browser attualmente disponibili, solo alcuni sono in grado di gestire correttamente queste entitá definite dal linguaggio Html, mentre la maggior parte é in grado di accettare solo i caratteri accentati.