etiquetas de idioma en html y xml

Upload: tximis-kurdi

Post on 07-Mar-2016

28 views

Category:

Documents


0 download

DESCRIPTION

Tratamiento de idiomal en HTML

TRANSCRIPT

  • i TerminologaEn este artculo, se hace referenciaal valor de un atributo de idioma,

    por ejemplo, frCA como etiqueta deidioma. Los componentes fr y CA sedenominan subetiquetas cuando selos describe como partes de unaetiqueta. Cuando se los describe comointegrantes de una lista ISO de idiomaso pases, fr y CA se denominancdigos.

    i RFC es el nombre que da el IETF asus especificaciones. Cada RFCtiene un nmero exclusivo.Lamentablemente, al leer las RFC 1766 RFC 3066 no es posible advertir queestas especificaciones han quedadoobsoletas y han sido reemplazadas porotras.

    Acercadeesteartculo

    ElGrupodeTrabajodeInternacionalizacindeW3harevisadoesteartculoyselohasometidoarevisinpblicaparahacerlotanprecisocomoseaposible.Sihaycuestionesparatratar,envenossuscomentariosmedianteelenlaceubicadocercadelfinal

    Este documento es unatraduccin. En caso dediscrepancias o errores, lanica versin normativa es elltimo original en ingls. Losderechos de autor originalescorresponden al W3C, comopuede verse al final de lapgina.

    Traductor: SpanishTranslation Team, TrustedTranslations, Inc.

    Internacionalizacin

    Etiquetas de idioma enHTML y XML

    audiencia de destino: codificadores de XHTML/HTML (que usen editores o lenguajede script), desarrolladores de sistemas de escritura (PHP, JSP, etc.), desarrolladoresde esquemas (DTD, XML Schema, RelaxNG, etc.), desarrolladores de XSLT, gerentesde proyectos web, implementadores de estndares, y todo aquel que busque conocerlos aspectos generales de la construccin de etiquetas de idioma de acuerdo conBCP47.

    Nota: Desde la traduccin de este documento se han producido modificaciones enel original en ingls (/International/articles/language-tags/Overview.en.php) . Consulte elregistro de cambios. (http://www.w3.org/blog/International?s=article-language-tags&sentence=sentence&blog=1&submit=Search)

    Generalidades

    Las etiquetas de idioma se utilizan paraindicar el idioma en el que est escrito eltexto u otros elementos en documentosHTML y XML. Se utilizan el atributo langpara indicar etiquetas de idioma en HTML

    (http://www.w3.org/TR/html4/struct/dirlang.html#h-8.1) y el atributo xml:lang para XML(http://www.w3.org/TR/REC-xml#sec-lang-tag) .

    En ambos casos, la informacin relativa al idioma se hereda de los elementosincluidos donde se hizo la declaracin, salvo que uno de dichos elementos indiqueun idioma diferente (de la misma manera).

    La sintaxis de las etiquetas de idioma seencuentra definida en la especificacindesarrollada por el IETF:BCP 47(http://www.rfc-editor.org/rfc/bcp/bcp47.txt) .BCP significa "Best Current Practice"(Mejor prctica actual), y es un nombrepersistente para una serie de RFC cuyos nmeros cambian cuando se actualizan. Laltima especificacin RFC (Request for Comment, solicitud de comentarios) quedescribe la sintaxis de las etiquetas de idioma es la RFC 5646, Etiquetas para la

  • delapgina.

    identificacin de idiomas (http://www.rfc-editor.org/rfc/rfc5646.txt) , que reemplaza a lasanteriores RFC 4646 (http://www.rfc-editor.org/rfc/rfc4646.txt) , 3066(http://www.ietf.org/rfc/rfc3066.txt) y 1766 (http://www.nordu.net/ftp/rfc/rfc1766.txt) .

    Para buscar subetiquetas, antes era necesario consultar listados de cdigos en distintas normas ISO. Ahoraes posible encontrar todas las subetiquetas en el registro de la IANA Registro de subetiquetas de idioma(http://www.iana.org/assignments/language-subtag-registry) . A continuacin, describiremos el nuevo registro.

    Nota:Si necesita una gua paso a paso para seleccionar unaetiqueta de idioma, consulte Cmo seleccionar una etiqueta deidioma (/International/questions/qa-choosing-language-tags) . Acontinuacin encontrar informacin algo ms avanzada acerca delas caractersticas generales de la sintaxis y de los conceptosvinculados con las etiquetas de idioma que se describen en la BCP47.

    La mayora de las etiquetas de idioma estn formadas por una subetiqueta de idioma de dos o tres letras.Habitualmente, esta subetiqueta est acompaada por otra de dos letras o tres dgitos que indica la regin.La RFC 5646 tambin permite el uso de cierta cantidad de subetiquetas adicionales cuando sea necesario.Estas subetiquetas, que se describirn brevemente en la prxima seccin, incluyen tambin subetiquetas deidioma extendidas, de sistemas de escritura, de variante, de extensin y de uso privado.

    La regla de oro para la creacin de etiquetas de idioma es procurar que la etiqueta sea lo ms breveposible. Se deben evitar las subetiquetas de regin o de sistema de escritura, entre otras, a menos queaporten informacin distintiva que resulte de utilidad. Por ejemplo, utilice ja para japons y no jaJP, salvoque exista un motivo especfico por el que sea necesario explicar que se trata del idioma japons tal comose habla en Japn.

    Ejemplos:

    Cdigo Idioma Subetiquetas

    en Ingls language

    mas Masai language

    frCA Francs hablado en Canad idioma+regin

    es419 Espaol hablado en Amrica Latina idioma+regin

    zh

    Hans

    Chino en el sistema de escriturasimplificado

    idioma+sistema deescritura

    HTML y XML ofrecen tambin un mecanismo para evitar la herencia de idioma mediante el empleo de la

    secuencia vaca, es decir, xml:lang="". Fundamentalmente significa: no deseo vincular estainformacin con ningn idioma.

    En lo que resta de este artculo, se brindan detalles adicionales sobre cmo construir etiquetas de idioma.

    Construccin de etiquetas de idioma

  • Algunas diferencias esenciales entre la RFC 5646 y especificaciones anteriores, como la RFC 3066, son lassiguientes:

    1. Existe un nico lugar para buscar subetiquetas vlidas, el nuevo registro de la IANA(http://www.iana.org/assignments/language-subtag-registry) .

    2. La ubicacin y longitud de las subetiquetas son fijas, lo que facilita la correspondencia entreetiquetas de idioma.

    3. Existe mayor flexibilidad entre los posibles componentes de una etiqueta de idioma.

    Bsicamente, la RFC 3066 (http://www.ietf.org/rfc/rfc3066.txt) permita componer etiquetas de idioma quepodan ser un cdigo de idioma independiente, un cdigo de idioma ms un cdigo de pas, o bien un valortomado de una pequea lista de valores especialmente registrados en el Registro de etiquetas de idioma dela IANA (http://www.iana.org/assignments/language-tags) .

    En la siguiente lista se muestran los distintos tipos de subetiquetas disponibles. En las prximas seccionesse describen las caractersticas de estos elementos y se explica cmo utilizarlos.

    language-extlang-script-region-variant-extension-privateuse

    Las entradas en el registro siguen ciertas convenciones vinculadas con el uso de maysculas y minsculas.Por ejemplo, para etiquetas de idioma, se usa minscula; para subetiquetas alfabticas de regin, se usamayscula y para etiquetas de sistemas de escritura, se utiliza mayscula inicial. Pero es slo unaconvencin! Al utilizar estas subetiquetas puede elegir libremente el formato que desee, a menos que elsistema con el que trabaja tenga requerimientos especficos en este sentido. Para el lenguaje de etiquetasen HTML y XML, el uso de maysculas o minsculas es indistinto.

    Cmo utilizar el registro de subetiquetas

    Como se mencion ms arriba, para buscar subetiquetas antes se consultaban las listas de cdigos en lasdistintas normas ISO, pero ahora es posible encontrar todas las subetiquetas en un nico lugar. El registrode la IANA (http://www.iana.org/assignments/language-subtag-registry) parece algo complejo a simple vista encomparacin con las listas de cdigos ISO, pero una vez que el usuario se familiariza con su estructura,resulta muy fcil de usar.

    Este registro consiste en un extenso archivo de texto. Para localizar una subetiqueta de idioma, se debebuscar en la pgina el nombre del idioma en ingls. Si busca "French" (francs), encontrar el siguienteregistro:

    La RFC 5646 (http://www.rfc-editor.org/rfc/rfc5646.txt) incluye ms tipos de subetiquetas y permite combinarlasde distintas formas. Si bien esta modificacin pareciera complicar las cosas, en trminos generales, laseleccin de etiquetas de idioma seguir siendo una tarea sencilla. No obstante, el usuario podr tenercapacidades adicionales cuando sea necesario. De hecho, la mayora considera que la RFC 5646 realmentedebera simplificar este proceso en varios aspectos. Por lo pronto, hoy existe un nico lugar dondeencontrar subetiquetas vlidas.

    i Si bien incorpora algunasopciones adicionales para laidentificacin de variacionescomunes de ciertos idiomas, la RFC5646 incluye todas las etiquetas que yaeran vlidas. Si ha estado utilizando lasespecificaciones RFC 1766, RFC 3066o RFC 4646, no debe realizarmodificacin alguna a las etiquetas.

  • Subetiquetas de idioma

    enast

    Ms informacin en la especificacin BCP 47:2.2.1 Subetiqueta de idioma primaria (http://tools.ietf.org/html/bcp47#section-2.2.1)4.1 Seleccin de una etiqueta de idioma (http://tools.ietf.org/html/bcp47#section-4.1)4.1.1 Etiquetado de los idiomas abarcados (http://tools.ietf.org/html/bcp47#section-4.1.1)

    %%Type:languageSubtag:frDescription:FrenchAdded:20051016SuppressScript:Latn%%

    Observe que el tipo de este registro es language. Lo que usted busca es el cdigo denominado Subtagque indica un valor para fr.

    De esta misma manera es posible encontrar cualquier otra etiqueta. Por ejemplo, para crear una etiquetafrCA (francs hablado en Canad), debe buscar Canada y verificar que haya encontrado una etiqueta deltipo region.

    Sin embargo, existen algunas cuestiones adicionales a tener en cuenta al seleccionar subetiquetas. Porejemplo, se deben evitar las subetiquetas que se describan en el registro como redundantes odesaprobadas y debe usar subetiquetas de variantes en combinacin con ciertas subetiquetas indicadas.Para ms informacin sobre la seleccin de subetiquetas, consulte Cmo seleccionar una etiqueta deidioma (/International/questions/qa-choosing-language-tags) .

    Richard Ishida ha creado tambin una herramienta de bsqueda en el registro (http://rishida.net/utils/subtags/)que resulta amigable para el usuario.

    En las siguientes secciones se proporcionan ms detalles acerca de subetiquetas especficas.

    Subetiqueta de idioma primaria

    Todas las etiquetas deidioma deben comenzarcon una subetiqueta deidioma primaria.

    Algunos ejemplos deetiquetas simples queslo indican idioma son:

    en (ingls)ast (asturiano - noexiste un cdigo dedos letras para esteidioma en las listasISO)

    Estos cdigos provienen de los cdigos de idiomas ISO 639 y se mantienen actualizados en funcin dedicha norma.

    Debido a que la RFC 3066 no inclua una lista de subetiquetas vlidas y simplemente remita a los usuarios ala norma ISO 639, muchas veces resultaba confuso etiquetar idiomas cuando las listas de cdigos ISOcontenan cdigos tanto de dos como de tres letras (y, en algunos casos, ms de un cdigo de tres letras).Ahora, todas las subetiquetas vlidas se incluyen en un nico registro de la IANA

  • Subetiquetas de idioma extendidas

    zhyuearafb

    Ms informacin en la especificacin BCP 47:2.2.2 Subetiquetas de idioma extendidas (http://tools.ietf.org/html/bcp47#section-2.2.2)

    4.1.2 Uso de subetiquetas de idioma extendidas(http://tools.ietf.org/html/bcp47#section-4.1.2)

    (http://www.iana.org/assignments/language-subtag-registry) , que adopta un solo valor por idioma de las listas ISO.Si existe un cdigo ISO de dos letras, ser el que aparecer en el registro. De lo contrario, en el registrofigurar un cdigo de tres letras. Esto debera simplificar el proceso.

    Cuando se public la RFC 5646, se incorporaron ms de 7.000 nuevos cdigos ISO 639-3 de tres letras alRegistro de subetiquetas.

    Este es un ejemplo de cmo se ve en el registro la subetiqueta de idioma primaria para espaol, es:

    %%Type:languageSubtag:esDescription:SpanishDescription:CastilianAdded:20051016SuppressScript:Latn%%

    Si bien es indistinto el uso de maysculas y minsculas en trminos de escritura de cdigos, generalmentese utilizan letras minsculas, pero se trata simplemente de una convencin.

    Subetiqueta de idioma extendida

    En este artculo, lassubetiquetas de idiomaextendidas sedenominan subetiquetasextlang. Una subetiquetaextlang debe estarsiempre precedida poruna subetiqueta deidioma primariaespecfica. Una etiquetade idioma slo puedecontener una subetiquetaextlang, que se debeubicar antes de cualquierotra subetiqueta.

    Algunos ejemplos de etiquetas de idioma que incluyen subetiquetas extlang:

    zhyue (chino cantons)arafb (rabe del Golfo)

    Las combinaciones idioma+extlang se proporcionan para abarcar variantes de etiquetas de idiomapreexistentes; sin embargo, existe una nica subetiqueta de idioma disponible para cada combinacinidioma+extlang. Toda vez que sea posible, se debe usar la subetiqueta de idioma en lugar de la combinacinidioma+extlang. Por ejemplo, se debe usar yue en lugar de zhyue para cantons, y afb en lugar de arafb para rabe del Golfo cuando sea posible.

    Las subetiquetas extlang tienen siempre una extensin de 3 letras. Cada entrada extlang en el registro

  • Subetiquetas de sistema de escritura

    zhHansazLatn

    Ms informacin en la especificacin BCP 47:2.2.3 Subetiqueta de sistema de escritura (http://tools.ietf.org/html/bcp47#section-2.2.3)

    4.1 Seleccin de una etiqueta de idioma (http://tools.ietf.org/html/bcp47#section-4.1)

    contiene un campo Prefix en el que se especifica el idioma que debe preceder a la subetiqueta extlang.Las entradas tambin incluyen un campo denominado PreferredValue en el que se indica la etiquetade idioma equivalente.

    Este es un ejemplo de cmo aparece en el registro el cdigo extlang para rabe del Golfo, afb:

    %%Type:extlangSubtag:afbDescription:GulfArabicAdded:20090729PreferredValue:afbPrefix:arMacrolanguage:ar%%

    Macroidiomas Las subetiquetas de idioma primarias utilizadas con una subetiqueta extlang se conocencomo macroidiomas y comprenden distintos idiomas con subetiquetas de idioma primarias msespecficas. Las subetiquetas de macroidiomas se pueden usar solas, pero a menos que exista algn tipode convencin acerca de su significado dentro del contexto en el que se utilizan, no son lo suficientementeprecisas.

    Por ejemplo, zh significa chino, pero abarca varios dialectos chinos que generalmente resultanincomprensibles entre s. Cuando se usa zh en forma independiente, habitualmente se usa para representarel idioma predominante dentro del grupo al que se hace referencia, a pesar de que esto no se especificaexplcitamente en la BCP 47. Por ejemplo, por convencin se considera que zh representa la formapredominante de mandarn del idioma chino. Cuando se requiere extrema claridad, y siempre que noobstaculice la interoperabilidad, se puede reemplazar por cmn. Sin embargo, si se est usando zh pararepresentar un idioma que no es mandarn, como chino hakka, es preferible utilizar el cdigo explcito (en elcaso del ejemplo, hak).

    Por otra parte, en zhHans, zh se usa en sentido genrico. Esta es una manera muy til de describir laescritura en chino simplificado, ya que el chino tiende a escribirse de la misma forma independientementedel dialecto del lector.

    Subetiqueta de script

    Algunos ejemplos deetiquetas de idioma queincluyen subetiquetas desistema de escritura:

    zhHans (chinosimplificado)azLatn

    (azerbaiyano, escritocon caractereslatinos, ya que esteidioma se puedeescribir tambin con

  • Subetiquetas de regin

    caracteres arbigos)

    La subetiqueta de sistema de escritura se introdujo por primera vez en la RFC 4646. Las subetiquetasprovienen de la lista de cdigos de sistemas de escritura ISO 15924 y se mantienen actualizadas sobre labase de esta norma.

    Una etiqueta de idioma slo puede contener una subetiqueta de sistema de escritura, que se debe ubicarinmediatamente a continuacin del idioma o de cualquier subetiqueta extlang. Siempre est compuesta porcuatro letras.

    Slo se deben usar etiquetas de sistema de escritura cuando sean necesarias para indicar unadistincin. Como coautor de la RFC 4646, Addison Phillips afirma: "Prcticamente para cualquier contenidoque hoy no emplee una etiqueta de sistema de escritura, la mejor prctica sigue siendo no usar etiquetaalguna en el futuro".

    Si desea indicar especficamente que el contenido no es material escrito, existe una subetiqueta especialpara hacerlo. Por ejemplo, podra usar enZxxx para aclarar que una grabacin de audio en ingls no escontenido escrito.

    De hecho, en muchas entradas de subetiquetas de idioma del registro, se desaconseja expresamente el usode etiquetas de sistema de escritura mediante la inclusin del campo Supressscript. Dicho campo semuestra en el ejemplo anterior para espaol. All se indica que el espaol normalmente se escribe concaracteres latinos y, por lo tanto, la subetiqueta Latn no debera usarse con es.

    En este ejemplo, se muestra la entrada en el registro para el sistema de escritura en caracteres cirlicos,Cyrl, utilizado por idiomas como el ruso:

    %%Type:scriptSubtag:CyrlDescription:CyrillicAdded:20051016%%

    Si bien para las aplicaciones comunes de las etiquetas de idioma es poco probable que necesite especificarel sistema de escritura, existen algunas situaciones para las que ya desde hace tiempo era necesario unmecanismo adecuado. Uno de esos ejemplos es el idioma chino. Este idioma tiene muchos dialectos, engeneral, mutuamente ininteligibles. Sin embargo, todos utilizan el sistema de escritura chino simplificado otradicional. Generalmente se busca rotular los textos en idioma chino como simplificado o tradicional, perohasta hace muy poco tiempo, no haba forma de hacerlo. Era necesario utilizar una opcin algo forzadacomo zhCN (en referencia al chino hablado en China) para el chino simplificado, an en Singapur, y zhTW(en referencia al chino hablado en Taiwn) para el chino tradicional. (Otros, sin embargo, usan zhHK paraindicar chino tradicional.) La disponibilidad de los cdigos zhHans y zhHant en referencia al chinoescrito con caracteres simplificados o tradicionales, debera mejorar la coherencia y precisin y suutilizacin se est volviendo cada vez ms popular. De todas formas, es posible que deba seguir utilizandoen algunos casos las antiguas etiquetas de idioma por coherencia.

    Subetiqueta de regin

    Algunos ejemplos deetiquetas de idioma que

  • enGBes005zhHantHK

    Ms informacin en la especificacin BCP 47:2.2.4 Subetiqueta de regin (http://tools.ietf.org/html/bcp47#section-2.2.4)4.1 Seleccin de una etiqueta de idioma (http://tools.ietf.org/html/bcp47#section-4.1)

    Subetiquetas de variante

    slnedis

    incluyen subetiquetas deregin:

    enGB (inglsbritnico)es005 (espaolsudamericano)zhHantHK (chinotradicional hablado enHong Kong)

    Las subetiquetas deregin en la RFC 3066adoptaron sus valores delos cdigos de pas de la norma ISO 3166. El nuevo registro conserva estos cdigos de dos letras, perotambin incluye los cdigos de regin M.49 de 3 dgitos usados por Naciones Unidas. La ventaja de estoscdigos es que no slo sirven para hacer referencia a pases. Por ejemplo, un equipo de localizacin podraquerer sealar una esmerada traduccin al espaol como espaol latinoamericano en lugar de espaol dealgn pas en particular. A partir de la RFC 5646, esto es posible; la etiqueta de idioma correspondiente eses419.

    Las etiquetas de idioma slo pueden contener una subetiqueta de regin, que se debe ubicar a continuacinde la subetiqueta de idioma, extlang o de sistema de escritura. Se trata de un cdigo alfabtico de dos letraso de un cdigo numrico de 3 dgitos. Es posible ubicar un cdigo de idioma seguido por un cdigo deregin, tal como sucede habitualmente para etiquetas de idioma como enUS.

    Las subetiquetas de regin slo se deben usar cuando sean imprescindibles para marcar una distincin. Amenos que sea necesario destacar especficamente que se trata de italiano tal como se habla en Italia, sedebe usar it para italiano en lugar de itIT. La misma aclaracin aplica para cualquier otra combinacinposible.

    Estos ejemplos tomados del registro sealan los cdigos correspondientes a Austria, AT, y frica del Norte,015:

    %%Type:regionSubtag:ATDescription:AustriaAdded:20051016%%Type:regionSubtag:015Description:NorthernAfricaAdded:20051016%%

    Subetiquetas de variante

    Las subetiquetas devariante son valores

  • slnedisslITnedisdeCH1901

    Ms informacin en la especificacin BCP 47:2.2.5 Subetiquetas de variante (http://tools.ietf.org/html/bcp47#section-2.2.5)4.1 Seleccin de una etiqueta de idioma (http://tools.ietf.org/html/bcp47#section-4.1)

    Subetiquetas de extensin

    utilizados para indicardialectos o variaciones ensistemas de escritura nocontemplados por lascombinaciones desubetiquetas de idioma,de sistemas de escritura yde regin. Estoselementos se debenubicar luego de lassubetiquetas de idioma,de sistema de escritura ode regin, pero no esnecesario que exista una subetiqueta de sistema de escritura o de regin antes de la subetiqueta devariante.

    A menos que trabaje en un rea especializada, es poco probable que necesite usar subetiquetas de variante.

    Los siguientes ejemplos pueden resultar tiles para comprender la funcin de estas subetiquetas.

    slnedis (dialecto esloveno de la regin del Natisone/Nadiza)slrozaj (dialecto resiano del esloveno)slITnedis (variante especfica del dialecto esloveno de la regin del Natisone/Nadiza que sehabla en Italia)deCH1901 (variante de la ortografa alemana que data de las reformas de 1901, como la que seobserva en Suiza)

    Este ejemplo tomado del registro indica el cdigo para el dialecto esloveno de la regin del Natisone/Nadiza,nedis:

    %%Type:variantSubtag:nedisDescription:NatisonedialectDescription:NadizadialectAdded:20051016Prefix:sl%%

    En el registro, estas subetiquetas estn vinculadas a un idioma especfico (y, posiblemente, a subetiquetasadicionales entre esta subetiqueta y la subetiqueta de idioma primaria) mediante el campo "Prefix". Elejemplo anterior, nedis, slo se debe usar con el esloveno.

    Si debe expresar un matiz dialectal o de escritura especfico que no se encuentra actualmente disponible,puede proponer la inclusin en el registro de subetiquetas de variante mediante el procedimiento que sedescribe en la RFC 5646.

    Subetiquetas de extensin y uso privado

    Si siente que realmente necesita utilizar

  • deDEucophonebkSubetiquetas de uso privado

    enUSxtwain

    Ms informacin en la especificacin BCP 47:2.2.7 Subetiquetas de uso privado (http://tools.ietf.org/html/bcp47#section-2.2.7)

    2.2.6 Subetiquetas de extensin (http://tools.ietf.org/html/bcp47#section-2.2.6)

    4.1 Seleccin de una etiqueta de idioma(http://tools.ietf.org/html/bcp47#section-4.1)

    estas etiquetas, consulte la especificacin

    (http://www.w3.org/International/core/langtags/rfc3066bis.html) , en lugar de este artculo.

    Las subetiquetas de extensin y uso privado estn precedidas de una etiqueta de una sola letra, o"singleton". Una organizacin puede proponer un singleton para una extensin. Una RFC debe describir suuso determinado (especificacin IETF). Se debe agregar el singleton al registro si aprueba la revisin. Elsingleton x se reserva para uso privado. Se permiten mltiples subetiquetas despus del singleton; noobstante, cualquier subetiqueta debe tener 8 caracteres de largo como mximo.

    Las subetiquetas de extensin permiten incorporar extensiones a la etiqueta de idioma. Por ejemplo, lasubetiqueta de extensin u ha sido registrada por el Consorcio Unicode para agregar informacin sobre elidioma o el comportamiento local. Muchos identificadores locales requieren ms "adaptaciones" u opcionespara los valores especficos dentro de un idioma, cultura, regin u otra clase de variacin. Esta extensinbrinda un mecanismo para el uso de dichas adaptaciones dentro de las etiquetas de idioma en elintercambio general.

    Por ejemplo, a continuacin se indica que una aplicacin debe utilizar el orden de colacin del directoriotelefnico, que la informacin ordenada en un documento se ordene segn esta colacin, y assucesivamente.

    deDEucophonebk

    La extensin u se define en la RFC 6067 (http://www.rfc-editor.org/rfc/rfc6067.txt) , la cual se refiere alRepositorio de datos locales comunes del consorcio Unicode (Consortium's Common Locale DataRepository, CLDR) en caso de detalles sobre las subetiquetas que le siguen. BCP 47 no la define.

    Las subetiquetas de uso privado no aparecen en el registro de subetiquetas, y su seleccin y mantenimientose realiza por un acuerdo privado de partes.

    Debido a que estas subetiquetas tienen sentido slo dentro de los acuerdos privados y no pueden utilizarsecon interoperabilidad en la Web, deberan usarse con precaucin y evitar su uso cuando sea posible.

    El siguiente ejemplo de una subetiqueta de uso privado permite identificar un tipo especfico de inglsestadounidense, pero solo dentro de una comunidad cerrada. Fuera del acuerdo privado, no se debe confiaren su significado.

    enUSxtwain

  • Ms informacin en la especificacin BCP 47:2.2.8 Registros redundantes y antiguos (http://tools.ietf.org/html/bcp47#section-2.2.8)

    Subetiquetas redundantes y antiguas

    Las etiquetas antiguasson casos especiales,provistos para cuestionesde retrocompatibilidad. Se trata de subetiquetas registradas con anterioridad a la RFC 4646 que no sepueden componer completamente desde las subetiquetas existentes en el registro actual o que no seadecan a la sintaxis definida para las etiquetas de idioma actuales.

    Las etiquetas redundantes son etiquetas de idioma compuestas por una secuencia de subetiquetasregistradas con anterioridad a la RFC 4646 que ahora se pueden componer mediante la combinacin dedistintas subetiquetas del registro actual. Las entradas originales se conservan en el registro bsicamentecomo una "cuestin de inters histrico".

    Dentro del registro, muchas etiquetas antiguas han sido reemplazadas por subetiquetas o combinacionesde subetiquetas. Dichos elementos ahora se consideran desaprobados y generalmente contienen un campoPreferredValue en el que se indica cmo se debe representar actualmente dicho idioma. Por ejemplo,en el siguiente ejemplo de una etiqueta antigua se indica que se debe utilizar la etiqueta de idioma jbo enlugar de artlojban.

    %%Type:grandfatheredTag:artlojbanDescription:LojbanAdded:20011111Deprecated:20030902PreferredValue:jbo%%

    Correspondencia de etiquetas de idioma

    La correspondencia entre diferentes etiquetas de idioma es importante para distintas aplicaciones. Segn laBCP 47, en se puede considerar equivalente a enGB. Por ejemplo, el siguiente cdigo de CSS muestra encolor rojo todo el texto escrito en ingls en navegadores compatibles con el seudoatributo :lang.

    :lang(en){color:red;}

    En el siguiente cdigo, el texto que se describe como lang="enGB" se mostrar en color rojo.

    Enjanvier,touteslesboutiquesdeLondresaffichentdespanneauxSALE,maisenfaitcesmagasinssontbienpropres!

    Por otra parte, segn la siguiente declaracin de CSS,

    :lang(enGB){color:red;}

    la palabra "SALE" no debe aparecer en color rojo en el siguiente cdigo.

  • Enjanvier,touteslesboutiquesdeLondresaffichentdespanneauxSALE,maisenfaitcesmagasinssontbienpropres!

    Con la incorporacin de etiquetas adicionales en la RFC 5646, la correspondencia es algo ms compleja.Adems, en la especificacin acompaante, RFC 4647 Correspondencia de etiquetas de idioma(http://www.rfc-editor.org/rfc/rfc4647.txt) , se describe ms de un enfoque posible para lograrlo. Lacorrespondencia entre estos elementos se tratar en otro artculo.

    A propsito

    Las etiquetas de idioma para HTML se definieron formalmente por primera vez en la RFC 2070, F. Yergeau,et.al. Internacionalizacin del lenguaje de etiquetado hipertextual (http://www.ietf.org/rfc/rfc2070.txt) . La RFC2070 se incorpor a HTML 4 (/TR/html4) y fue reclasificada como histrica.

    Se debe tener en cuenta que se han producido modificaciones (http://www.loc.gov/standards/iso639-2/codechanges.html) en los cdigos ISO de idiomas. En 1989, se eliminaron los cdigos iw, in y ji, quefueron reemplazados por he, id y yi. Ms recientemente, el cdigo ISO de pas cs, que representaba aChecoslovaquia, pas a representar a Serbia y Montenegro. Dichos cambios pueden dar lugar a confusin alcomparar cdigos asignados a determinado texto durante perodos prolongados. El nuevo registro desubetiquetas de la IANA permite clasificar etiquetas como desaprobadas y reemplazarlas por nuevas, perono es posible eliminar ni modificar el significado de una subetiqueta. Se espera que se aplique una polticasimilar a las normas ISO en el futuro.

    Muchas otras especificaciones de W3C o relacionadas con la Web emplean etiquetas de idioma:

    XHTML 1.0 (http://www.w3.org/TR/xhtml1/) usa etiquetas de idioma en el atributo HTML lang y en elatributo XML xml:lang, como tambin en el atributo hreflang.El HTTP usa etiquetas de idioma en los encabezados AcceptLanguage y ContentLanguage.Los lenguajes SMIL y SVG pueden usar etiquetas de idioma en la declaracin switch.Los lenguajes CSS y XSL utilizan etiquetas de idioma para control detallado del estilo.

    Se debe tener en cuenta tambin que la informacin sobre idioma se puede aadir a objetos como lasimgenes y los archivos de audio incluidos.

    Lecturas complementarias

    Cmo comenzar? Idioma en la Web (/International/getting-started/language)

    Cmo seleccionar una etiqueta de idioma (/International/questions/qa-choosing-language-tags)

    Enlaces relacionados, Autora de HTML y & CSSIdioma (/International/techniques/authoring-html#language)

  • Enlaces relacionados, Autora de XMLIdioma (/International/techniques/authoring-xml#language)

    Enlaces relacionados, Autora de SVGIdioma (/International/techniques/authoring-svg#language)

    Enlaces relacionados, Desarrollo de esquemasIdioma (/International/techniques/developing-schemas#language)

    De: Richard Ishida, W3C. Traductor: Spanish Translation Team, TrustedTranslations, Inc..

    Traducido del ingls con fecha 2009-09-10. Traduccin modificada por ltima vez el 2011-05-3110:57 GMT.

    Para ver el historial de cambios del documento, busque article-language-tags en la bitcora deinternacionalizacin.

    Copyright 2006-2011 W3C (MIT, ERCIM, Keio, Beihang), All Rights Reserved. W3C liability,trademark, document use and software licensing rules apply. Your interactions with this site are inaccordance with our public and Member privacy statements.