Caratteri speciali

Le lettere accentate

Un altro aspetto preliminare che occorre conoscere per la creazione di documenti in HTML riguarda le lettere accentate e i caratteri speciali. Tutti i browser Web con interfacce grafiche sono in grado di visualizzarli. Ma per essere trasmessa e ricevuta correttamente da qualunque server e client, su qualsiasi piattaforma, una pagina HTML dovrebbe limitarsi a usare la sola codifica ASCII standard, che non contiene nessuna delle lettere accentate.

I linguaggi come HTML, forniscono uno strumento sintattico che permette di superare questa limitazione: le entitÓ carattere. Una entitÓ Ŕ sostanzialmente una sequenza di caratteri ASCII standard che rappresenta un carattere non presente in quell'insieme. Per identificare queste entitÓ si usano due caratteri delimitatori all'inizio ed alla fine: la e commerciale (&), e il punto e virgola (;). Tra questi due delimitatori possono occorrere un numero qualsiasi di caratteri. In allegato alle specifiche dello HTML sono state distribuite due liste ufficiali di entitÓ per i caratteri degli alfabeti latini e per i caratteri speciali. I nomi delle entitÓ per i caratteri sono stati creati con un artificio molto semplice e comodo da ricordare: il carattere stesso, cui si aggiungono le stringhe "grave" per indicare la versione con accento grave, "acute" per indicare la versione con accento acuto, e cosý via. La distinzione tra maiuscolo e minuscolo Ŕ rilevante.
Ecco la lista delle entitÓ per i caratteri accentati dell'ortografia italiana:
  • Ó à
  • Ŕ è
  • Ú é
  • ý ì
  • ˛ ò
  • ¨ ù
  • └ À
  • ╚ È
  • ╔ É
  • ╠ Ì
  • Ď Ò
  • ┘ Ù

Ed ecco alcuni caratteri speciali che possono tornare utili (notare che le virgolette, i simboli di maggiore e minore e la '&' richiedono un carattere speciale, per non essere confusi con parte di istruzioni HTML):

  • Ë ©
  • Ď ®
  • > >
  • < &lt;
  • & &amp;
  • " &quot;

Per fare in modo che una pagina Web venga visualizzata correttamente da qualsiasi client Ŕ dunque necessario sostituire le lettere accentate con le corrispondenti entitÓ carattere. Quando le scrivete non dimenticate il punto e virgola: indica al browser dove finisce la sequenza di controllo!

Le entitá per i caratteri speciali utilizzati nel linguaggio HTML possono avere comunque due forme: nome - numero.
Entrambe iniziamo con il carattere & e terminano con il ;
  • il primo caso lo abbiamo visto sopra
  • nel secondo il segno di cancelletto e il numero corrispondente alla posizione del carattere nel set ISO-Latin-1.
Per essi vengono impiegate le sequenze di escape, tra cui:

&#162;          ¢
&#163;          £
&#36;           $
&#166;          ¦
&#167;          §
&#168;          ¨
&#169;          ©        &copy; (Netscape)
&#170;          ª
&#171;          «
&#172;          ¬
&#173;          ­
&#174;          ®        &reg; (Netscape)
&#175;          ¯
&#176;          °
&#177;          ±
&#178;          ²
&#179;          ³
&#180;          ´
&#181;          µ
&#182;          ¶
&#183;          ·
&#184;          ¸
&#185;          ¹
&#186;          º
&#187;          »
&#188;          ¼
&#189;          ½
&#190;          ¾
&#191;          ¿
&#215;          ×
&#222;          Þ
&#247;          ÷

É utile comunque tener sempre presente che le entitá per caratteri funzionano meglio in teoria che in pratica. Di tutti i browser attualmente disponibili, solo alcuni sono in grado di gestire correttamente queste entitá definite dal linguaggio Html, mentre la maggior parte é in grado di accettare solo i caratteri accentati.