n o debes descargar esa web para traducirla, y lo sabes... etim2015 noviembre de 2015 josé blanco...

Post on 25-Jan-2016

218 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

NO DEBES DESCARGAR ESA WEB PARA TRADUCIRLA, Y LO SABES...

ETIM2015

Noviembre de 2015José Blanco Pérezwww.locdep.com

INTRODUCCIÓN

• Introducción al curso• Breve introducción a la web• Riesgos de descargar o copiar un sitio• Cómo minimizar riesgos• Formatos típicos

- ----------------------------------------• Ruegos y preguntas

Contenidos

Atención

Truco

Recomendación

Ejemplo

Información

ConvencionesOtros

• Dirigido a traductores• Muy condensado• 45 minutos

Por favor, selecciona la respuesta correcta:

Porque han arrestado de nuevo a Manuel Mata.

Porque Matt Damon tiene más tirón que AntonioCarmona.

Porque Manuel Mata asiste este fin de semana al FEM (Festival Erótico de Madrid).

Porque el Madrid ha ganado al Barcelonala semana pasada.

¿Por qué estoy yo con vosotros en vez de Manuel Mata™?

Pista: Una de las respuestas anteriores es incorrecta.

Sobre mí:

- Traductor / Desarrollador

- Ingeniero de localización

- Especialista en evaluaciones

- Consultor de localización

- Co-fundador de

- Certified Passolo Trainer

- Profesor en la UAX

1994

2006

2007

1999

2009

• Introducción a la localización

• Localización con SDL Passolo

• Traducción con SDL Passolo

• SDL Trados Studio (todos los niveles)

• Internacionalización de documentation

• Internacionalización de software

• Internacionalización de ayudas

• Locales, juegos de caracteres y codificaciones

• Macros para localizadores

• Introducción a la traducción automática

• XPath y Regex para traductores

• Localización de software

• Localización de ayudas

• Localización web

• Localización multimedia

• Localización de documentación

• Single-sourcing

• Evaluación y análisis de proyectos

• Fuentes y localización

• DITA y locaización

• XML para localizadores y traductores

• Control de calidad/Evaluación de calidad

Nuestros cursos

INTRODUCCIÓN A LA WEB

DNS (servidor de nombres de dominio) Todo dispositivo en red tiene una dirección IP El DNS transforma los nombres en IPs ¿Nombres de dominio multilingües? Con IRI

Navegador Plataforma y Aplicación

- Windows, Mac, Linux, Android, iPhone…- IE, Firefox, Opera, Safari, Chrome, Edge…

Servidor Web Aplicación que sirve páginas solicitadas

- IIS (Internet Information Services)- Apache TomCat

Localización web – Conceptos básicos

Base de datos

Código

DNS

Usuario Servidor Web

1 2 3

45

3

2

5

4

1 El usuario llama a un dominio: www.locdep.com

El DNS enruta la llamada a la dirección IP: 219.76.130.238

El servidor web procesa las páginas solicitadas

El servidor web sirve las páginas solicitadas

El usuario recibe HTML

Localización web – Conceptos básicos

Nube

Base de datos

Código

DNS

Usuario Servidor Web

1 2 3

45

Localización web – Conceptos básicos

Regla Número 2

Las webs están alojadas en servidores, en formatos complejos:- HTML, ASP, ASPX, JS, VBS, PHP, CFM- Bases de datos: mySQL, SQL, Oracle, Access

Regla Número 1

Se navega en Internet mediante navegadores, y siempre recibimos HTML.

Ver>Código fuente.

Regla Número 3

Los contenidos a los que accedemos y los originales no son los mismos.

LOCALIZACIÓN WEB: DESCARGAS

¿Podrías traducir el siguiente sitio web:www.acme.com?

Solo tenemos la URL.

¿Podría recibir los archivos fuente u originales?

Bueno, no es seguro hacerlo así.

¿Por qué?

Localización web – ¿Descargar, copiar?

Eso, ¿por qué?

Si los demás lo hacen...

Los contenidos descargados no son los mismos que los que deben traducirse

Los navegadores solo procesan HTML Los archivos fuente pueden ser de todo tipo:

HTML, PHP, ASP, ASP.Net, SQL Server…

Localización web – ¿Por qué no se debe descargar un sitio web?

Localización web – ¿Por qué no se debe descargar un sitio web?

Los contenidos web son dinámicos

Los gestores de descarga solo pueden descargar lo que “ven”

Formularios dinámicos Capas ocultas Controles específicos Objetos en servidor Comportamientos (Mouse over)

Los contenidos web difieren según el navegador

Los gestores de descarga solo pueden descargar lo que «ven»

Se personaliza el código para los distintos navegadores No todos los navegadores interpretan y muestran el código igual

<!--[if IE 8]>

<style type="text/css">

/* css para IE 8 */

</style>

<![endif]-->

<!--[if lt IE 8]>

<link href="ie7.css" rel="stylesheet" type="text/css" /> <![endif]-->

Localización web – ¿Por qué no se debe descargar un sitio web?

Los contenidos web difieren según la plataforma

Los gestores de descarga solo pueden descargar lo que “ven”

Localización web – ¿Por qué no se debe descargar un sitio web?

Web en Flash en un PC Misma web en Flash en un iPad

Los contenidos web difieren según la plataforma y navegador

Los gestores de descarga solo pueden descargar lo que “ven”

Localización web – ¿Por qué no se debe descargar un sitio web?

Web en un PC Misma web en un iPhone

La mayor parte de la web está oculta No me refiero solo a deep web La mayoría de Internet está protegida por contraseña Los gestores de descarga no pueden descargar contenidos protegidos

Localización web – ¿Por qué no se debe descargar un sitio web?

Localización web – ¿Por qué no se debe descargar un sitio web?

Los sitios web “se protegen” de los gestores de descarga

Bots – Anti-bots CAPTCHA/ReCAPTCHA

(Completely Automated Public Turing TestTo Tell Computers and Humans Apart)

http://www.captcha.net/ https://www.google.com/recaptcha

Cabeceras (menús)

Lateral izquierdo

Pie

Los gestores descargan las páginas como un único bloque, no por módulos

Los gestores de descarga descargan cada página como una única página, sin tener en cuenta los elementos de los que estén hechas: las plantillas o páginas maestras, los complementos de JavaScript etc.

Eso lleva a muchas repeticiones falsas (luego veremos cómo tratarlas)

Partes comunes repetidas en todo el sitio (almacenadas en js)

Localización web – ¿Por qué no se debe descargar un sitio web?

Las imágenes mostradas y las originales suelen ser distintas Se muestran generalmente jpg, png y gif. No son editables. Los formatos originales, editables, suelen ser psd, ai, eps. Nuevo formato antiguo: split-depth gif

Localización web – ¿Por qué no se debe descargar un sitio web?

http://www.techtimes.com/articles/27890/20150121/split-depth-gifs-taking-over-internet.htm

Se entrega una copia de la web original, no una web multilingüe Los sitios web suelen ser multilingües Necesitan un mecanismo para mostrar un idioma determinado

Selección automática por el navegador (JavaScript) Selección manual Página de bienvenida

Necesitan un mecanismo para cambiar el idioma Cuadro de lista desplegable (con sus problemas de internacionalización)

Localización web – ¿Por qué no se debe descargar un sitio web?

Los caracteres copiados pueden ser distintos de los originales... Los navegadores interpretan los caracteres para mostrarlos:

á - &aacute; á - &#225; á - &#xE1; &nbsp;

Localización web – ¿Por qué no se debe descargar un sitio web?

Y además hay como unas etiquetas muy raras... Los archivos fuente tienen etiquetas, que no se ven en el navegador

Me llamo José. – Me llamo <b>José</b.

Localización web – Descargar un sitio web

Vale.

Ya sabes que nunca debe descargar o copiar una web para traducirla.

Ahora también sabes por qué no debes hacerlo.

Pero...

Te lo pedirán.

Y lo harás.

Y lo sabes...

DESCARGAR UN SITIO WEB

Localización web – Descargar un sitio web

Veamos cómo descargar una web de la forma más segura.

Y veamos qué pedir al cliente según el tipo de web.

Recomendaciones iniciales• Avisar de los problemas que hemos visto anteriormente• Preguntar cuál es el formato original o intentar reconocerlo• Pedir los archivos fuente “según el formato”• Definir los entregables• Preguntar sobre la estrategia de selección/cambio de idioma• Si no queda más remedio que descargar

– Hacerlo solo para estimaciones– Definir el alcance de la traducción (niveles, micrositios)– No descargar a mano sino utilizar gestores de descarga– Avisar de los problemas que hemos visto anteriormente

Localización web – Traducir un sitio web

Herramientas

1. HTTTrack• Gratuita• Mediante un asistente• www.htttrack.com

2. WebZip• Comercial (¿desfasada?)• Añade etiquetas en la cabecera• www.spidersoft.com/webzip

Se puede especificar los niveles de enlaces, la carpeta de destino, las contraseñas etc.

Crean sitios funcionales localmente, es decir, transforman las rutas absolutas en rutas relativas.

Localización web – Cómo descargar un sitio web

Cómo analizar un sitio web evitando repeticiones falsas

1. Descargarlo si se puede con dos herramientas

2. Extraer los contenidos repetidos

3. Analizar el contenido repetido

4. Pseudo-traducirlo y crear una memoria con el contenido repetido

5. Analizar el sitio web completo con la memoria

6. No considerar los 100% o ContextMatch

Palabras nuevas del contenido repetido

+ Palabras nuevas del sitio completo

= Estimación de sitio completo

Localización web – Análisis de un sitio descargado

Formatos típicos

1. HTML estático

2. HTML dinámico, PHP, CFM

3. ASP, ASPX – SQL Server, Oracle, mySQL, Access

4. Sistemas de gestión de contenidos (CMS)

5. Flash (cada vez menos) > HTML5

Localización web – Formatos

HTML

1. Sitios estáticos

2. Se reconocen por tener etiquetas estándar

3. Qué se traduce:- Archivos .htm y .html

4. Cómo se traduce:- Filtros estándar en todas las herramientas

<html>…</html>

Localización web – Formatos

DHTML, PHP, CFM

1. Sitios dinámicos

2. DHTML<script>function myFunction(){alert("Hello World!");}</script>

3. PHP<!DOCTYPE html> <meta charset=utf-8> <title></title><?php echo 'Hello World'; ?>

4. CFM<cfoutput>#VARIABLES.greeting# World!</cfoutput> </body> </html>

5. Qué se traduce:- Archivos .htm, .html, .php, .cfm, .js

6. Cómo se traduce:- Filtros estándar en todas las herramientas

que a veces hay que personalizar.

Localización web – Formatos

ASP, ASPX, Oracle, SQL Server, mySQL

1. Para aplicaciones empresariales

2. Generado con Microsoft Visual Studio

3. Capa de presentación, de negocios y de datos

4. Bases de datos1. Oracle

2. Microsoft SQL Server

5. Incluye muchos lenguajes/estándares/marcos de trabajo1. JavaScript

2. Json

3. JQuery

4. Ruby On Rails

5. Ajax

6. Flex

7. Silverlight (RIP)

Localización web – Formatos

ASP, ASPX, Oracle, SQL Server, mySQL

1. Cómo se reconocen:1. http://www.demo.com/Index.aspx

2. http://www.demo.com/Login (MVC)

2. Qué archivos se traducen:1. .ASP o .ASPX

2. .RESX

3. .CSHTML

4. Bases de datos

3. Cómo se traducen:1. Filtros estándar y personalizados

2. Volcados de base de datos

Localización web – Formatos

Sistemas de gestión de contenidos (CMS)

Separan el contenido del formato

Contenidos: almacenados en una base de datos

Formato: almacenado en plantillas Constan de un sitio de administración y de un sitio público Sirven para blogs, noticias etc. Cómo se traducen

Mediante complementos Mediante resx Mediante archivos exportados Mediante volcados de base de datos

Algunos son de pago y otros (muchos) gratuitos (y open source)- Múltiples extensiones, plugins- Comunidad activa

Localización web – CMS

Joomla

Sitio principal: http://www.joomla.org Ejemplos:

- www.unric.org- http://www.businesstoday-eg.com/

Drupal

Sitio principal: http://www.drupal.org Ejemplos:

- http://www.economist.com/- http://www.whitehouse.gov/

Localización web – CMS

Alfresco

Sitio principal: http://www.alfresco.com Ejemplos:

- NASA Langley Research Center

Wordpress

Sitio principal: http://www.wordpress.org Cómo se reconoce: ver código fuente> wp Ejemplos:

- http://www.husainbolt.com/- http://www.variety.com

Localización web – CMS

Blogger

Sitio principal: http://--.blogspot.com Ejemplos:

- http://blogsofnote.blogspot.com.es/

Localización web – CMS

Tiendas en línea Sitios completos o plugins Cómo se traducen: mediante base de datos Ofrecidos por los principales proveedores de acceso a

Internet- Ejemplo: http://www.arsys.es

Ejemplos- osCommerce- Magento- Zen Cart

Localización web – CMS

Adobe Flash Desde animaciones sencillas hasta sitios completos o formación en línea (eLearning) Banners Programados en fla, generan

- swf- exe

El HTML llama al SWF Problemas

- Seguridad- Actualizaciones

Futuro (presente)- Desaparecerá en breve (lo digo cada año)- > HTML5

Localización web – Contenidos multimedia

HTML5 Quinta revisión de HTML (2012) Busca la compaibilidad

- Navegadores, plataformas- HTML4, XHTML1 y DOM Level 2 HTML

Vídeo, Audio, SVG, MathML Incluye línea de tiempo Editado, generado por:

- Adobe Flash CS6 y superior- Adobe Edge- Microsoft Visual Studio 2013 y superior

Para saber más- http://html5center.sourceforge.net/- https://developer.mozilla.org/es/demos/tag/tech:html5

Ejemplos: http://html5demos.com/svg-clock http://html5demos.com/drag

Localización web – Contenidos multimedia

Los contenidos localizados no sirven si no se pueden encontrar.

Servicio “nuevo” No se trata de traducción sino de adaptación Políticas de dominio

- www.domain.com > www.domain.es- www.es.domain.com- www.domain.com/es

Selección de idiomas Distintos niveles

- Informes- Traducción de palabras clave- Enlaces localizados (localized linking)

Localización web – SEO

Motores de búsqueda dentro de los sitios

Nuevo servicio (ingeniería) Indexación de contenidos localizados Google Search o software específico

Localización web – Motores de búsqueda

Accesibilidad web

Accesibilidad de navegadores (compatibilidad) vs accesibilidad Permite a los usuarios con discapacidad(es) acceder a contenidos web Lista de comprobación para sitios web accesibles Herramientas para comprobar la accesibilidad (

http://www.w3.org/WAI/ER/tools/complete)

Localización web – Accesibilidad

Bases de datos

1. Microsoft SQL Server

2. Oracle

3. mySQL

Localización

1. Volcado a texto/Excel

2. Consultas/Script (Select FROM/Insert TO)

3. Conexión ODBC (Passolo)

Localización web – Formatos

Adobe Flash

1. Descompilación (Sothink/Avral)

2. Texto estático

- Redimensionamiento dinámico/estático

3. Tablas de localización dinámicas

- Redimensionamiento dinámico/estático

4. Componentes de terceros

5. Estrategia de cambio de idioma

- Idioma de la escena

- Idioma del sistema operativo

Localización web – Formatos

HTML5

1. Filtro estándar + personalización

2. JS: Filtro estándar + personalización

3. SVG: filtro estándar

TURNO DE PREGUNTAS

...Y GRACIAS

top related