6 Tipos de datos básicos de HTML

Nota: Este documento es parte de una traducción al castellano de la Recomendación del W3C "HTML 4.01 Specification" (más información). Puede consultar la versión original del mismo. Para cualquier comentario o corrección acerca de la traducción póngase en contacto con el traductor en jrpozo@conclase.net. Gracias por su colaboración.

Véase el Aviso de copyright de la traducción.

Contenidos

  1. Mayúsculas y minúsculas
  2. Tipos básicos de SGML
  3. Cadenas de texto
  4. URIs
  5. Colores
    1. Notas sobre el uso de colores
  6. Longitudes
  7. Tipos de contenido (tipos MIME)
  8. Códigos de idioma
  9. Codificaciones de caracteres
  10. Caracteres individuales
  11. Fechas y horas
  12. Tipos de vínculos
  13. Descriptores de medios
  14. Datos de scripts
  15. Datos de hojas de estilo
  16. Nombres de marcos destino

Esta sección de la especificación describe los tipos básicos de datos que pueden aparecer como contenido de un elemento o valor de un atributo.

Para información preliminar sobre cómo leer el DTD HTML, consulte el tutorial de SGML.

6.1 Mayúsculas y minúsculas

En la definición de cada atributo se incluye información sobre la importancia que tiene para sus valores la distinción entre mayúsculas y minúsculas. Esta información se presenta de acuerdo con la siguiente leyenda:

CS
El valor distingue entre mayúsculas y minúsculas (es decir, los agentes de usuario interpretan "a" y "A" de manera diferente).
CI
El valor no distingue entre mayúsculas y minúsculas (es decir, los agentes de usuario interpretan "a" igual que "A").
CN
No puede haber diferencias entre mayúsculas y minúsculas, p.ej., porque es un número o un carácter del conjunto de caracteres del documento.
CA
La definición del elemento o atributo ya da la información sobre la distinción entre mayúsculas y minúsculas.
CT
Consultar la definición del tipo para detalles sobre la distinción entre mayúsculas y minúsculas.

Si el valor de un atributo es una lista, estas claves se aplican a todos los valores de la lista, a menos que se indique lo contrario.

6.2 Tipos básicos de SGML

La definición del tipo de documento especifica la sintaxis de los contenidos de los elementos y los valores de los atributos de HTML por medio de palabras (tokens) SGML (p.ej., PCDATA, CDATA, NAME, ID, etc.). Véase [ISO8879] para sus definiciones completas. Lo que sigue es un resumen de la información fundamental:

6.3 Cadenas de texto

Ciertos atributos (%Text; en el DTD) toman por valor un texto que se supone debe ser "legible por humanos". Para información preliminar sobre atributos, consulte la parte del tutorial sobre atributos.

6.4 URIs

Esta especificación utiliza el término URI tal y como se define en [URI] (ver también [RFC1630]).

Obsérvese que los URIs incluyen a los URLs (según se definen en [RFC1738] y [RFC1808]).

Los URIs relativos se convierten en URIs completos a partir de un URI base. La [RFC1808], sección 3, define el algoritmo normativo para este proceso. Para más información sobre URIs base, consulte la sección sobre URIs base en el capítulo sobre vínculos.

Los URIs se representan en el DTD con la entidad paramétrica %URI;.

En general los URIs hacen distinción entre mayúsculas y minúsculas. Puede haber URIs, o partes de URIs, donde la diferencia no importe (p.ej., nombres de máquinas), pero la identificación de éstas puede no ser fácil. Los usuarios deberían considerar que en los URIs se distingue siempre entre mayúsculas y minúsculas (para quedarse del lado de la seguridad).

Consulte el apéndice para información sobre caracteres no ASCII en valores de atributos URI.

6.5 Colores

El tipo de valor de atributo "color" (%Color;) se refiere a las definiciones de colores según se especifican en [SRGB]. Un valor de color puede ser o bien un número hexadecimal (anteponiendo un signo "#") o uno de los siguientes dieciséis nombres de colores. En los nombres de colores no se distingue entre mayúsculas y minúsculas.

Nombres de colores y valores sRGB
Black = "#000000" (Negro) Green = "#008000" (Verde)
Silver = "#C0C0C0" (Plateado) Lime = "#00FF00" (Verde lima)
Gray = "#808080" (Gris) Olive = "#808000" (Verde oliva)
White = "#FFFFFF" (Blanco) Yellow = "#FFFF00" (Amarillo)
Maroon = "#800000" (Marrón) Navy = "#000080" (Azul marino)
Red = "#FF0000" (Rojo) Blue = "#0000FF" (Azul)
Purple = "#800080" (Púrpura) Teal = "#008080" (Azul verdoso)
Fuchsia = "#FF00FF" (Fucsia) Aqua = "#00FFFF" (Celeste)

Así, los valores de color "#800080" y "Purple" se refieren ambos al color púrpura.

6.5.1 Notas sobre el uso de colores

Aunque los colores pueden añadir cantidades significativas de información a los documentos y hacerlos más legibles, considere las siguientes pautas cuando incluya color en sus documentos:

6.6 Longitudes

HTML especifica tres tipos de valores de longitud para los atributos:

  1. Píxeles (Pixels): El valor (%Pixels; en el DTD) es un entero que representa un número de píxeles del lienzo (papel, pantalla). Así, el valor "50" significa cincuenta píxeles. Para información normativa sobre la definición de un píxel, consulte [CSS1].
  2. Longitud (Length): El valor (%Length; en el DTD) puede ser o bien un %Pixel; o bien un porcentaje del espacio horizontal o vertical disponible. Así, el valor "50%" significa la mitad del espacio disponible.
  3. Multilongitud (MultiLength): El valor (%MultiLength; en el DTD) puede ser un %Length; o una longitud relativa . Una longitud relativa tiene la forma "i*", donde "i" es un entero. Los agentes de usuario, cuando reparten espacio entre los elementos que compiten por ese espacio, adjudican primero las longitudes en píxeles y en porcentajes, y después dividen el espacio sobrante entre las longitudes relativas. Cada longitud relativa recibe una porción del espacio disponible que es proporcional al entero que precede al "*". El valor "*" es equivalente a "1*". Así, si hay disponibles 60 píxeles de espacio después de haber adjudicado el agente de usuario el espacio en píxeles y en porcentajes, y las longitudes relativas que deben asignarse son "1*", "2*" y "3*", se asignarán 10 píxeles al 1*, 20 píxeles al 2* y 30 píxeles al 3*.

Los valores de longitud son neutros frente a la distinción entre mayúsculas y minúsculas.

6.7 Tipos de contenido (tipos MIME)

Nota. Un "media type" o "tipo de medios" (definido en [RFC2045] y [RFC2046]) especifica la naturaleza de un recurso vinculado. Esta especificación emplea el término "content type" ("tipo de contenido") en lugar de "media type" (tipo de medios) de acuerdo con el uso actual. Además de esto, en esta especificación, "media type" se puede referir a los medios en que un agente de usuario representa un documento.

Este tipo está representado en el DTD por %ContentType;.

Los tipos de contenido no hacen distinción entre masyúculas y minúsculas.

Ejemplos de tipos de contenido son "text/html", "image/png", "image/gif", "video/mpeg", "text/css", y "audio/basic". Para la lista de tipos MIME registrados, consulte [MIMETYPES].

6.8 Códigos de idioma

El valor de los atributos cuyo tipo es un código de idioma (%LanguageCode; en el DTD) se refiere a un código de idioma de los especificados en [RFC1766], sección 2. Para información sobre especificación de códigos de idioma en HTML, consulte la sección sobre códigos de idioma. No se permite espacio en blanco dentro del código de idioma.

Los códigos de idioma no distinguen entre mayúsculas y minúsculas.

6.9 Codificaciones de caracteres

Los atributos "charset" (%Charset; en el DTD) se refieren a una codificación de caracteres según se describe en la sección sobre codificaciones de caracteres. Los valores deben ser cadenas (p.ej., "euc-jp") del registro IANA (ver [CHARSETS] para una lista completa).

Los nombres de codificaciones de caracteres no distinguen entre mayúsculas y minúsculas.

Los agentes de usuario deben seguir los pasos descritos en la sección sobre especificación de codificaciones de caracteres para determinar la codificación de caracteres de un recurso externo.

6.10 Caracteres individuales

Ciertos atributos necesitan un carácter individual del conjunto de caracteres del documento. Estos atributos son del tipo %Character; en el DTD.

Los caracteres individuales pueden especificarse mediante referencias de caracteres (p.ej., "&").

6.11 Fechas y horas

La [ISO8601] permite muchas opciones y variaciones en la representación de fechas y horas. La especificación actual usa uno de los formatos descritos en el perfil [DATETIME] para la definición de cadenas fecha/hora legales (%Datetime; en el DTD).

El formato es:

  AAAA-MM-DDThh:mm:ssDZH
donde:
     AAAA = año con cuatro dígitos
     MM   = mes con dos dígitos (01=enero, etc.)
     DD   = día del mes con dos dígitos (de 01 a 31)
     hh   = hora con dos dígitos (de 00 a 23) (NO se permite am/pm)
     mm   = minuto con dos dígitos (00 a 59)
     ss   = segundo con dos dígitos (00 a 59)
     DZH  = desginador de zona horaria

El designador de zona horaria es uno de los siguientes:

Z
indica UTC (Coordinated Universal Time, Tiempo Universal Coordinado). La "Z" debe ser mayúscula.
+hh:mm
indica que la hora es una hora local que está hh horas y mm minutos por delante del UTC.
-hh:mm
indica que la hora es una hora local que está hh horas y mm minutos por detrás del UTC.

Deben estar presentes exactamente los componentes mostrados aquí, y exactamente con esta puntuación. Obsérvese que la letra "T" aparece literalmente en la cadenas (debe ser mayúscula), para indicar el comienzo de la hora, según se especifica en [ISO8601]

Si una aplicación generadora no conoce la hora con precisión de segundos, puede usar el valor "00" para los segundos (y para los minutos y para las horas si es necesario).

Nota. [DATETIME] no trata la cuestión de segundos bisiestos.

6.12 Tipos de vínculos

Los autores pueden usar los siguientes tipos de vínculos reconocidos, enumerados aquí junto con sus interpretaciones convencionales. En el DTD, %LinkTypes; se refiere a una lista de tipos de vínculos separados por espacios. No se permiten caracteres de espacio en blanco dentro de los tipos de vínculo.

Estos tipos de vínculo no hacen distinción entre mayúsculas y minúsculas, es decir, "Alternate" tiene el mismo significado que "alternate".

Los agentes de usuario, los motores de búsqueda, etc. pueden interpretar estos tipos de vínculos de diferentes maneras. Por ejemplo, los agentes de usuario podrían proporcionar acceso a los documentos vinculados por medio de una barra de navegación.

Alternate
Designa una versión alternativa del documento en que aparece el vínculo. Cuando se usa con el atributo hreflang, implica que hay una versión traducida del documento. Cuando se usa conjuntamente con el atributo media, implica que hay una versión diseñada para un medio (o medios) diferentes.
Stylesheet
Se refiere a una hoja de estilo externa. Véase la sección sobre hojas de estilo externas para más detalles. Se usa junto al tipo de vínculo "Alternate" para ofrecer hojas de estilo alternativas seleccionables por el usuario.
Start
Se refiere al primer documento de un conjunto de documentos. Este tipo de vínculo dice a los motores de búsqueda qué documento es considerado por el autor como el punto de inicio de un conjunto.
Next
Se refiere al siguiente documento en una secuencia lineal de documentos. Los agentes de usuario pueden optar por precargar el documento marcado como "next", para reducir el tiempo de carga aparente.
Prev
Se refiere al documento anterior en una serie ordenada de documentos. Algunos agentes de usuario también soportan el sinónimo "Previous".
Contents
Se refiere a un documento que sirve como tabla de contenidos. Algunos agentes de usuario también soportan el sinónimo ToC (de "Table of Contents").
Index
Se refiere a un documento que proporciona un índice para el documento actual.
Glossary
Se refiere a un documento que proporciona un glosario de términos que pertenecen al documento actual.
Copyright
Se refiere al aviso de copyright del documento actual.
Chapter
Se refiere a un documento que actúa como capítulo en una colección de documentos.
Section
Se refiere a un documento que actúa como sección en una colección de documentos.
Subsection
Se refiere a un documento que actúa como subsección en una colección de documentos.
Appendix
Se refiere a un documento que actúa como apéndice en una colección de documentos.
Help
Se refiere a un documento que ofrece ayuda (más información, vínculos a otros recursos informativos, etc.)
Bookmark
Se refiere a una señal de lectura. Una señal de lectura (bookmark) es un vínculo a un punto de entrada importante dentro de un documento extenso. Se puede utilizar el atributo title, por ejemplo, para dar un rótulo a la señal de lectura. Obsérvese que pueden definirse varias señales de lectura en cada documento.

Los autores pueden querer definir tipos de vínculos adicionales no descritos en esta especificación. Si hacen esto, deberían usar un perfil (profile) citando las convenciones usadas para definir los tipos de vínculos. Véase el atributo profile del elemento HEAD para más detalles.

Para más información sobre tipos de vínculos, consulte la sección sobre vínculos en documentos HTML.

6.13 Descriptores de medios

La siguiente es una lista de los descriptores de medios reconocidos (%MediaDesc; en el DTD).

screen
Para pantallas no paginadas de computadora.
tty
Para medios que utilicen una cuadrícula de caracteres de ancho fijo, como teletipos, terminales y dispositivos portátiles con posibilidades limitadas de representación.
tv
Para dispositivos tipo televisión (baja resolución, en color, desplazamiento limitado).
projection
Para proyectores.
handheld
Para dispositivos de mano (pantalla pequeña, monocromos, gráficos por mapas de bits, ancho de banda limitado).
print
Para material paginado, opaco, y para documentos que se ven en una pantalla en modo de presentación preliminar a la impresión.
braille
Para dispositivos táctiles braille.
aural
Para sintetizadores de voz.
all
Apropiado para todos los dispositivos.

En versiones futuras de HTML pueden introducirse nuevos valores, y podrían permitirse valores parametrizados. Para facilitar la introducción de estas extensiones, los agentes de usuario deben ser capaces de analizar el atributo media como sigue:

  1. El valor es una lista de entradas separadas por comas. Por ejemplo,
    media="screen, 3d-glasses, print and resolution > 90dpi"
    

    se transforma en:

    "screen"
    "3d-glasses"
    "print and resolution > 90dpi"
    
  2. Cada entrada se trunca justo hasta antes del primer caracter que no sea una letra US ASCII [azA-Z] (ISO 10646 hex 41-5a, 61-7a), un dígito [0-9] (hex 30-39), o un guión (hex 2d). En el ejemplo, esto da:
    "screen"
    "3d-glasses"
    "print"
    
  3. Se hace entonces un emparejamiento con el conjunto de tipos de medios definidos arriba, teniendo en cuenta la diferencia entre mayúsculas y minúsculas. Los agentes de usuario pueden ignorar las entradas que no resulten emparejadas. En el ejemplo nos quedamos con screen y con print.

Nota. Las hojas de estilo pueden incluir variaciones dependientes del medio en su interior (p.ej., la estructura CSS @media). En estos casos puede ser apropiado usar "media=all".

6.14 Datos de scripts

Los datos de scripts (%Script; en el DTD) pueden aparecer como contenido del elemento SCRIPT y como valor de los atributos de eventos intrínsecos. Los agentes de usuario no deben evaluar los datos de script como código HTML, sino que deben pasarlos tal y como están como datos para un motor de scripts.

La importancia de la distinción entre mayúsculas y minúsculas en los datos de scripts depende del lenguaje de programación del script.

Obsérvese que los datos de scripts que estén contenidos en un elemento no pueden contener referencias de caracteres, pero los datos de scripts que sean el valor de un atributo sí pueden contenerlas. El apéndice proporciona más información sobre la especificación de datos no HTML.

6.15 Datos de hojas de estilo

Los datos de hojas de estilo (%StyleSheet; en el DTD) pueden aparecer como contenido de un elemento STYLE y como valor de un atributo style . Los agentes de usuario no deben evaluar los datos de estilo como código HTML.

La importancia de la distinción entre mayúsculas y minúsculas en los datos de estilo depende del lenguaje de la hoja de estilo.

Obsérvese que los datos de hojas de estilo que estén contenidos en un elemento no pueden contener referencias de caracteres, pero los datos de hojas de estilo que sean el valor de un atributo sí pueden contenerlas. El apéndice proporciona más informacion sobre la especificación de datos no HTML.

6.16 Nombres de marcos destino

Excepto los nombres reservados enumerados a continuación, los nombres de marcos destino (%FrameTarget; en el DTD) deben empezar con un carácter alfabético (a-zA-Z). Los agentes de usuario deberían ignorar otros nombres de destino.

Los siguientes nombres de destino están reservados y tienen significados especiales.

_blank
El agente de usuario debería cargar el documento designado en una ventana nueva y sin nombre.
_self
El agente de usuario debería cargar el documento en el mismo marco que el elemento que hace referencia a este destino.
_parent
El agente de usuario debería cargar el documento en el FRAMESET padre inmediato del marco actual. Este valor es equivalente a _self si el marco actual no tiene padre.
_top
El agente de usuario debería cargar el documento en la ventana original completa (cancelando así todos los demás marcos). Este valor es equivalente a _self si el marco actual no tiene padre.