Hoy he asistido a una serie de conferencias organizadas por la oficina española del World Wide Web Consortium en la FIB. Gracias al powerbook de Trancos he podido seguir el evento en línea, conectado a la Wireless de la facultad. Ya comentaré algo sobre el powerbook más tarde xD

Las fotos las he puesto en esta página cutremente hecha a mano a modo de álbum.

El artículo es bastante extenso, de hecho han sido aproximadamente cuatro horas de charlas. Así que, por favor, haced clic en “leer más” para poder disfrutarlo al completo…

José Manuel Alonso, el responsable de la oficina del W3C española, fue quien presentó la conferencia e hizo una introducción sobre el consorcio. Paso a comentar las charlas de manera un poco esquemática, que tampoco puedo reescribir las seis páginas de notas que he tomado.

José Manuel Alonso - Presentación Transparencias de la charla

El propósito de la oficina del W3C española es llenar el hueco provocado por la baja representación hispana del W3C. Sus funciones más básicas son la educación y difusión de los estándares, y ayuda a webmasters y empresas sobre temas de accesibilidad web y nuevas tecnologías y protocolos.

Aprovechando la gira, se ha montado un premio a la estandarización web, pensado para dotar de una beca e integrar en el grupo de desarrollo W3C al participante que consiga la mejor idea de integración de estándares. Por ejemplo, si cogemos el SVG y lo mezclamos con RSS, podríamos conseguir los titulares de una página en forma de gráfico vectorial (es un ejemplo chorra). Hay cinco portátiles ACER para los cinco mejores trabajos. Para más información podéis visitar la web del concurso

El W3C es un organismo neutro que desarrolla estándares: especificaciones como XML o RDF, directrices para personas con discapacidades (WAGC) y herramientas para webmasters como el validador de código HTML, el navegador/editor Amaya y otros.

Todo ello se hace con el objetivo de conseguir una web universal y diversa. Antes se veían muchas páginas del estilo “este sitio se ve mejor con IE a una resolución de blablabla”, pero se está evolucionando hacia el extremo opuesto, es decir, que una página se visualice de diferentes formas dependiendo del user-agent que la visite. De forma transparente para el usuario, claro está

Otro componente importante es la llamada “web semántica”. Hay una charla más tarde que habla de ello, pero la idea principal es cambiar el estilo de introducir información, agregando metadatos para que no sólo se sepa qué información hay, sino también a qué va referida

El W3C tiene un sistema de patentes muy transparente: su objetivo es que toda la tecnolofgía creada por ellos se haga sin ánimo comercial y disponible para el público.

Antes la web era simplemente una página HTML encima del protocolo HTTP que estaba encima de una URL. En uno de los flyers se puede ver que esto ha evolucionado muchísimo, y hay una infinidad de tecnologías que se apoyan en el XML para representar no sólo datos sino también ideas

El mundo va evolucionando de forma que si bien antes solamente había un PC por familia -si acaso-, dentro de pocos años cada persona tendrá un dispositivo móvil personal. Hay que conseguir que todos estos dispositivos accedan a la web sin saturarla, por ello se han modularizado los componentes y se ha separado el contenido (HTML) de la representación (CSS)

Otra tecnología que me ha parecido tremendamente interesante ha sido CC/PP, que permite que cada dispositivo envíe su especificación, capacidades y preferencias del usuario para que el servidor le pase una página totalmente adaptada a sus capacidades (imágenes en B/N o redimensionadas, filtrando sonidos, aumentando determinados tipos de letra…

El futuro es XHTML 2.0, que incorporará nuevos elementos como <section>, que permitirá definir a antojo los <h> -al estilo latex-, cambiar los <img> por <object> y la posibilidad de convertir todo objeto en un hipervínculo

Respecto a los afiliados del W3C, hay que destacar que muchas empresas importantes están destinando fondos para el Consorcio. Aunque algunas de ellas tengan páginas web que, como mínimo, no pasen el validador HTML, internamente se benefician mucho de participar activamente en la creación de estándares, aparte de ser más barato que tener a un grupo de ingenieros en I+D dedicándose en exclusiva a la web.

En definitiva, existen una cantidad brutal de tecnologías creadas por el W3C, de las cuales no he hablado ni de la décima parte, pero que ya están aprobadas e implementándose. Si miráis la guía de la charla podréis encontrar con más detalle qué hace cada una y por qué son tan útiles y potentes

Bert Bos - Multiple Input Media, Multiple Output Media, but only One Web

Bert Bos es el padre de CSS, así que era de esperar que esta charla fuera muy interesante. Realmente, se han tratado unos temas de integración que, al menos para mí, me parecen ciencia-ficción (aunque kirai ya los está viviendo, al menos en parte)

La charla fue en inglés, así que perdonadme los anglicismos o algún fallo de traducción

Cuando se necesitan datos, es posible que no siempre se esté delante de un ordenador. Por ejemplo, puedes ir en coche y decir “quiero ir aquí”, y señalar una ciudad en el GPS con el dedo. Entonces el sistema de reconocimiento de voz debe entender que “quiero ir aquí” significa que hay una localización de destino, y entenderse con el sistema de reconocimiento de la pantalla táctil.

Entonces, como estamos conduciendo y no podemos apartar la vista de la carretera, una voz nos dice “tantos kilómetros a la derecha, toma el desvío blablabla…”. Como no estábamos muy pendientes, decidimos parar. El sistema reconoce que hemos parado, y cambia la forma de representar los datos, de la voz a la pantalla. No necesita descargarlo de nuevo, simplemente el dispositivo los transforma.

La tecnología encargada de todo esto se llama EMMA. Se relaciona estrechamente con la forma de representar (CSS, XSL) los datos (música, páginas web…) en un dispositivo de salida (pantalla, LEDs, pitidos, voz…)

Hay diferentes posiblidades para llevar a cabo esto: todo el trabajo lo puede hacer el cliente, para descargar de trabajo al servidor. O bien, si nuestro dispositivo es muy cutre, el servidor podría hacer el trabajo por nosotros (usando CC/PP podemos decírselo, por ejemplo). En cambio, si la información puede contener datos peligrosos para niños, podemos transmitir al servidor que no nos los envíe, o bien bloquearlos a su llegada

Por ejemplo, si bajamos una web desde el móvil y luego queremos imprimirla por bluetooth en la impresora del despacho, este sistema se encarga de reconocer los datos y adaptarlos para su representación en papel escrito

El Extensible MultiModal Annotation Markup Language (EMMA) permite otras tareas. Supongamos que queremos ir a Vilafranca. El sistema de reconocimiento de voz duda entre “Vilanova” y “Vilafranca”. El sistema le asigna una probabilidad del 0.6 de que sea Vilanova, y del 0.85 de que sea Vilafranca, entonces escoge un destino. InkML, por ejemplo, reconoce los trazos de un lápiz óptico, además de la velocidad y la presión.

Los Media Queries permiten pedir datos técnicos del dispositivo y mostrar información en función de sus capacidades, ej: <link href="a.css" media="handheld and (color) and (min-width: 400px)">

La charla fue mucho más larga, y aunque no sé la URL de las transparencias, podréis encontrar la mayoría de las tecnologías en la página del W3 Consortium. A mí, personalmente, se me quedó la boca abierta escuchando todo esto…

La charla sobre “Interacción Natural para aplicaciones móviles” se suspendió, así que pasaremos a la siguiente

Richard Benjamins - Web Semántica

Esta es otra de las conferencias que me dejó de piedra. Trata de cómo hacer que los ordenadores entiendan realmente a las personas. Y parece ser que no es un problema de algorítmica, sino que lo que realmente se necesita es información adicional, metadatos

Si leéis archivos RDF con algún programa, es posible que hayáis visto información del tipo “dc author: topopardo”. Esto quiere decir que el autor del texto es topopardo. Prueba superada. ¿Para qué sirve esto? Pues, por ejemplo, para que cuando busquemos “autor del artículo sobre la conferencia del w3c” salga “topopardo”. Esto puede parecer sencillo, pero no lo es

Vamos a poner otro escenario: Queremos buscar música de “las ketchup” (¡aaaaargh!). Si buscamos “las ketchup” en google, puede que nos salga tanto la página de música que estábamos buscando como una empresa de ketchup. ¿Cómo puede el software distinguirlas?

Actualmente las tecnologías de búsqueda se limitan a las palabras clave (keywords) para encontrar información. Pero cuando éstas no son suficiente, nos encontramos con resultados no deseados. Ahora vamos a suponer que, por algún lado, en el código de la página, añadimos metadatos diciendo que “las ketchup” es un artista y que “hijas del tomate” es un disco. Cuando busquemos, se podrá saber exactamente qué tipo de información buscamos: comida o música. Entonces el software dará resultados muchísimo mejores, y más acordes con el lenguaja natural

El principal problema es que reconvertir todas las webs e insertar metadatos es imposible. Una posible solución es detectar inferencias en las páginas, es decir, deducir los metadatos a partir de información implícita. Esto se escapa de mis conocimientos de Inteligencia Artificial, pero a juzgar por la cara de Richard, parece ser un problema complicadísimo

Parece ser que la web semántica cada vez está más en auge, y medios como google news se están llenando de noticias sobre ella. El W3C está tremendamente interesado en ella, pero empresas de buscadores y muchas otras también desean dar el salto a la web semántica. Además se piensa añadir un sistema de confianza (trust) para saber si las fuentes de información son realmente fiables o no

Un ejemplo de buscador semántico está en http://elcano.isoco.net/. Se recoge información de diferentes sitios (la información no es realmente el problema) y se intenta saber qué es lo que realmente está diciendo ese bloque de texto. Se intenta cambiar el paradigma de la búsqueda de información hacia un sistema de respuesta a preguntas del usuario

Por favor, probad ese buscador. Venga, os doy un minuto. Buscad cosas como “cual es la población de españa?” y veréis que lo que interpreta es “Obtener Poblacion de Pais el nombre del cual es España”. ¡Bingo!

Una vez formada la base de datos de información, se intenta enlazar la pregunta (entenderla) hacia la lista de respuestas. Si busco “quien es zapatero”, quiero saber quién es, no me importa dónde vive ni a qué se dedica.

El objetivo final es conseguir que los ordenadores entiendan el lenguaje natural y fusionar todas las tecnologías de descripción de datos para conseguir unas búsquedas hiper-exactas

Como dicen en Futurama… “¡¡bieeeeenvenidooo al mundo deel mañanaaaaaa!!”. Ah, si estás leyendo por aquí, anuncio que próximamente escribiré un artículo sobre Futurama. No todo iban a ser rollazos de este calibre xD

José Ramón Morales – Aspectos legales del código abierto

Esta charla fue, quizá, la más aburrida -con perdón- porque la mayoría de los asistentes conocemos el modelo de desarrollo del software libre, sus licencias, y las ventajas sobre el software privativo. También conocemos los litigios entre Sun y Microsoft o entre SCO e IBM. De todas maneras, como tomé apuntes, voy a dejarlo por aquí. Perdonad las faltas, es lo que tiene escribir con un teclado que no es el propio

El software propietario ha sido objeto de la protección clásica del copyright. Si se lleva al extremo puede limitar la innovación y crea dificultades para la creación de estándares y la interoperabilidad. Las ventajas del soft abierto facilita la corrección de errores, evita también que algunas compañías marquen el desarrollo y la innovación según sus conveniencias.
Uno ya no tiene por qué verse obligado a upgradear cuando lo requiera la empresa porque una serie de desarrolladores internos pueden mantener el código.

Muchas compañías como IBM y novell se implican con el soft libre, y hay un “asian linux” donde los gobiernos quieren cortar el crecimiento de M$ en asia

Hay un litigio entre sun y microsoft y se descubrió que no era la única empresa a la que M$ le habia negado las especificaciones de sus interfaces. También se descubrió que el windows media player se incluia de forma abusiva empotrado en el sistema. Un juez decretó que o se requiere liberar el código de windows, solo se necesita liberar las interfaces

Se está potenciando linux con linex, guadalinex, lliurex, etc.

En el derecho español la ley de patentes excluye a los programas de ordenadores, pero la tendencia europea quiere abrir el paso a las patentes de invenciones en las que estén presentes los programas de ordenador.

La posición del w3c respecto las patentes es la de establecer un compromiso entre los creadores para que luego no reclamen derechos sobre lo que han creado. Se hacen licencias libres de royalties.

Patentes de bt exigian el pago de royalties a prodigy por el uso de hyperlinks. El resultado judicial negó que la patente de bt cubriera los hyperlinks.

Conclusiones

Hay que usar tecnologías que sean estándar. Porque son las más potentes. Porque son seguras y con futuro. Porque las empresas, aunque no lo parezca, invierten en ellas.

Cuando el hardware nos permita realizar todas las capacidades de este software, como la interacción entre dispositivos, llegaremos por fin a un mundo donde la comunicación es totalmente libre, fácil, independiente y accesible para todos

Fotos del evento

Actualización 11/11/04 12:16 - He arreglado los fallos 403 que daban las imágenes de los flyers. Siento las molestias