Saltar al contenido
Noticias de tecnologia

De arriba hacia abajo: un nuevo enfoque de la web semántica

De arriba hacia abajo: un nuevo enfoque de la web semántica

A principios de esta semana escribimos sobre el enfoque clásico de la web semántica y las dificultades con ese enfoque. Si bien la visión original de la capa en la parte superior de la web actual, que anota información de una manera que es “comprensible” para las computadoras, es convincente; hay cuestiones técnicas, científicas y comerciales que han sido difíciles de abordar.

Una de las dificultades técnicas que describimos fue la naturaleza ascendente del enfoque clásico de la web semántica. Específicamente, cada sitio web necesita anotar información en RDF, OWL, etc. para que las computadoras puedan “entenderlo”.

Tal como están las cosas hoy en día, hay pocas razones para que los propietarios de sitios web hagan eso. Las herramientas que aprovecharían la información anotada no existen y no ha habido ningún valor comercial y para el consumidor claramente articulado. Lo que significa que no hay ningún incentivo para que los sitios inviertan dinero para ser compatibles con la web semántica del futuro.

Pero existen enfoques alternativos. Argumentaremos que un enfoque más pragmático y de arriba hacia abajo de la red semántica no solo tiene sentido, sino que ya está en camino de convertirse en realidad. Muchas empresas han aprovechado la información existente no estructurada para crear servicios semánticos verticales. A diferencia de la visión original, que es más bien académica, estas soluciones emergentes están impulsadas por el potencial comercial y del mercado.

En esta publicación, veremos la solución que llamamos enfoque de arriba hacia abajo a la web semántica, porque en lugar de requerir a los desarrolladores que cambien o aumenten la web, este enfoque aprovecha y se basa en la web actual tal como está.

¿Por qué necesitamos la web semántica?

La complejidad de la visión original de la web semántica y la falta de beneficios claros para el consumidor hacen que todo el proyecto sea poco realista. La pregunta simple: ¿Por qué necesitamos computadoras para comprender la semántica? permanece en gran parte sin respuesta.

Si bien algunos de nosotros pensamos que construir IA es genial, la mayoría de la gente piensa que la IA es un poco tonta, o tal vez incluso inquietante, y tienen razón. La IA por el bien de la IA no tiene ningún sentido. Si estamos hablando de construir máquinas inteligentes, y si necesitamos gastar dinero y energía anotando toda la información del mundo para ellas, entonces debe haber un beneficio muy claro.

Expresado como está, la web semántica se convierte en una visión en busca de una razón. ¿Qué pasa si el problema se vuelve a plantear desde el punto de vista del consumidor? Esto es lo que realmente esperamos con la web semántica:

  • Dedique menos tiempo a buscar
  • Dedique menos tiempo a mirar cosas que no importan
  • Dedique menos tiempo a explicar lo que queremos a las computadoras

Es necesario que exista un enfoque en el consumidor y un beneficio claro para las empresas para que la webvision semántica sea adoptada por el mercado.

¿Y si el problema no es tan difícil?

Si todo lo que estamos tratando de hacer es ayudar a las personas a mejorar sus experiencias en línea, tal vez ni siquiera sea necesaria la “comprensión” completa de la semántica por parte de las computadoras. La mejor herramienta de búsqueda online en la actualidad es Google, que es un algoritmo basado, fundamentalmente, en el análisis estadístico de frecuencias y no en la semántica. Hasta ahora, las soluciones que intentan mejorar Google centrándose en la semántica generalizada no lo han encontrado fácil.

La verdad es que la comprensión del lenguaje natural por parte de las computadoras es un problema realmente difícil. Tenemos el lenguaje entrenado en nuestros genes. Aprendemos el idioma a medida que crecemos. Aprendemos cosas de forma iterativa. Tenemos la oportunidad de aclarar las cosas cuando no las entendemos. Nada de esto se replica fácilmente con computadoras.

Pero, ¿y si ni siquiera es necesario construir la primera generación de herramientas semánticas? ¿Qué pasaría si en lugar de tratar de enseñar a las computadoras el lenguaje natural, conectamos en las computadoras los conceptos de cosas cotidianas como libros, música, películas, restaurantes, acciones e incluso personas? ¿Nos ayudaría eso a ser más productivos y a encontrar las cosas más rápido?

Semántica simple: sustantivos y verbos

Cuando pensamos en un libro, pensamos en un puñado de cosas: título y autor, quizás género y el año en que se publicó. Por lo general, sin embargo, no nos importa el editor, la edición y el número de páginas. Del mismo modo, las recetas provocan pensamientos sobre la cocina y los ingredientes, mientras que las películas nos hacen pensar en la trama, el director y las estrellas.

Cuando pensamos en personas, también pensamos en un puñado de cosas: cumpleaños, dónde viven, cómo nos relacionamos con ellos, etc. Los perfiles que se encuentran en las redes sociales populares son excelentes ejemplos de semántica simple basada en personas:

Libros, personas, recetas, películas son ejemplos de sustantivos. Las cosas que hacemos en la web durante estos días, como buscar libros similares, encontrar más personas que trabajen para la misma empresa, obtener más recetas del mismo chef y buscar fotografías de estrellas de cine, son similares a verbos en el lenguaje cotidiano Estos son datos contextuales que se basan en la comprensión del sustantivo.

¿Qué pasaría si las aplicaciones semánticas integraran la comprensión y el reconocimiento de los sustantivos y luego también integraran los verbos que tienen sentido? De hecho, estamos bien encaminados haciendo precisamente eso. Los motores de búsqueda verticales como Spock, Retrevo, ZoomInfo, la tecnología de anotación de páginas de Clear Forrest, Dapper y la extensión Map + para Firefox son solo algunos ejemplos de servicios web semánticos de arriba hacia abajo.

El servicio web semántico descendente

La esencia de un servicio web semántico descendente es simple: aproveche la información web existente, aplique conocimiento semántico vertical específico y luego vuelva a entregar los resultados a través de una aplicación centrada en el consumidor.Considere el motor de búsqueda vertical Spock, que escanea la web en busca de información sobre personas. Sabe cómo reconocer nombres en páginas HTML y también busca información común sobre las personas que tienen todas las personas: cumpleaños, ubicaciones, estado civil, etc. Además, Spock “comprende” que las personas se relacionan entre sí. busque a Bush, entonces Clinton aparecerá como un predecesor. Si buscas a Steve Jobs, entonces Bill Gates aparecerá como un rival.

En otras palabras, Spock toma una semántica simple y cotidiana sobre las personas y la aplica a la información que ya existe en línea. ¿El resultado? Un motor de búsqueda vertical único y útil para personas. Además, tenga en cuenta que Spock no requiere que la información se vuelva a anotar en RDF y OWL. En cambio, la empresa crea adaptadores que utilizan heurística para obtener los datos. Sin embargo, el motor no tiene una comprensión completa de la semántica de las personas. Por ejemplo, no sabe que a la gente le gustan diferentes tipos de helado, pero no es necesario. El punto es que al enfocarse en una semántica simple, Spock puede entregar un servicio útil para el usuario final.

Otro ejemplo mucho más simple es el complemento Map + para Firefox. Esta aplicación reconoce direcciones y proporciona un mapa emergente usando Yahoo! Mapas. Es la simplicidad de esta aplicación lo que transmite con precisión el poder de la semántica simple. El complemento “sabe” cómo son las direcciones. Claro, a veces comete errores, pero la mayoría de las veces etiqueta correctamente las direcciones en los documentos en línea. De modo que aprovecha la información existente y luego proporciona una utilidad directa al usuario final combinándola con Yahoo! Mapas.

Los desafíos que enfrenta el enfoque de arriba hacia abajo

A pesar de ser efectivo, el enfoque de arriba hacia abajo algo simplista tiene varios problemas. Primero, no es realmente la web semántica como se define, sino que es un grupo de servicios y aplicaciones web semántica que crean utilidad al aprovechar la semántica simple. Entonces, los defensores del enfoque clásico protestarían y tendrían razón. Otro problema es que estos servicios no siempre tienen la semántica correcta debido a ambigüedades. Dado que el reconocimiento es algorítmico y no se basa en una representación RDF subyacente, no es perfecto.

Me parece que es mejor tener soluciones más simples que funcionen el 90% del tiempo que complejas que nunca llegan. Las preguntas clave aquí son: ¿Cómo se manejan exactamente los errores? Y, ¿hay alguna forma de que el usuario corrija el problema? Las respuestas quedarán en manos de la aplicación individual. En la vida, estamos acostumbrados a que otras personas sean impredecibles, pero con las computadoras, al menos en teoría, esperamos que las cosas funcionen siempre igual.

Otro problema más es que estas soluciones simples pueden no escalar bien. Si los datos subyacentes no estructurados cambian, ¿se pueden cambiar los algoritmos con la suficiente rapidez? Esto siempre es un problema con las cosas que se encuentran encima de otras cosas sin una API. Por supuesto, si más sitios web tuvieran API, como sugerimos anteriormente, la web semántica descendente sería mucho más fácil y segura.

Conclusión

Si bien la visión original de la web semántica es grandiosa e inspiradora en la práctica, ha sido difícil de lograr debido a los desafíos de ingeniería, científicos y comerciales. La falta de un enfoque simple y específico para el consumidor lo convierte principalmente en un ejercicio académico. Mientras tanto, los datos existentes se aprovechan aplicando heurísticas simples y haciendo suposiciones sobre verticales particulares. Lo que hemos denominado aplicaciones web semánticas de arriba hacia abajo han estado apareciendo en línea y mejorando las experiencias de los usuarios al aprovechar la semántica para brindar servicios reales y tangibles.

¿Ocurrirá alguna vez la web semántica ascendente? Posiblemente. Pero, en este momento, el camino preciso para llegar allí no está del todo claro. Mientras tanto, todos podemos disfrutar de una mejor experiencia en línea y llegar a donde necesitamos ir más rápido gracias a los simples servicios web semánticos de arriba hacia abajo.