Wikia Search: los Reyes Magos visitan a Jimbo

Wikia Search es un motor de búsqueda para internet que se encuentra en su fase final de desarrollo, promovido por Wikia, la empresa de Jimbo Wales.

Su lanzamiento, previsto originalmente para algún momento de 2007, se ha ido demorando y ahora parece tener nueva fecha: según Jimbo, el 7 de enero de 2008, los Reyes Magos dejarán un bonus track en sus zapatitos. Wikia Search ha renovado en los últimos días la expectativa de su aparición, debido a cierta polémica que se generó con el anuncio de Google con su iniciativa enciclopédica, y algunas especulaciones que vinculaban estos dos lanzamientos.

En efecto, no pocos señalaron que el desarrollo de una enciclopedia en línea por parte de Google era una respuesta al lanzamiento de Wikia Search por parte de Jimbo. Algunos sensacionalistas mal informados titularon incluso “Wikipedia se lanza al mercado de los buscadores”.

Ya hemos escrito algunas líneas acerca de Knol, pero lo cierto es que hasta ahora no hay mucho más que humo: declaraciones imprecisas y vagas expresiones de deseo.

De Wikia Search se sabe bastante más: en primer lugar que es una iniciativa de Wikia, no de Wikipedia ni de la Fundación Wikimedia. Wikia es un emprendimiento comercial creado por Jimbo (entre otros) que desarrolla actividades en internet, básicamente promoviendo comunidades en línea que desarrollan contenidos mediante el uso del software Mediawiki. La Wikipedia es una enciclopedia en línea, mantenida por una organización sin ánimo de lucro llamada Fundación Wikimedia. Jimbo ha sido el creador de la Wikipedia y es miembro de la Fundación Wikimedia pero eso no convierte a sus emprendimientos comerciales en iniciativas de la Fundación. Elemental, pero hay mucha gente que parece empeñada en confundir las cosas.

En segundo lugar, Wikia Search prevé algunas características que en principio lo diferenciarán del resto de los buscadores: lo principal es que estará basado en software libre y sus algoritmos también serán abiertos. Esta es, en mi opinión, la innovación en buscadores más importante desde Google hasta hoy. De hecho, pienso que las demás características (la posibilidad de participación comunitaria para ajustar los resultados, la garantía de privacidad, la calidad de los resultados, etc.), son posibles en gran parte debido a esto. El motor de rastreo (crawling) será Grub, un desarrollo libre que hoy mismo cualquiera puede bajar y probar. Claro que para rastrear e indexar toda la web hace falta un poco más de infraestructura que una PC con banda ancha.

¿Alguien recuerda cómo era internet antes de Google? Los buscadores ordenaban sus resultados de acuerdo a una pauta de publicidad en la mayor parte de los casos, buscar información era engorroso, al punto que los índices de sitios web a menudo eran más útiles que los buscadores, y de hecho, había relativamente pocos sitios orientados al contenido. El aporte fundamental de Google es el pagerank: la idea de que los enlaces de un sitio a otro podían ser una medida de valor en la red social de la web. Ordenar los resultados en base a un conjunto de indicadores cuyo eje es el concepto de pagerank permitió ordenar la web en términos de relevancia, no de publicidad, y supuso un impulso fabuloso para el desarrollo de los sitios basados en contenido y en servicios.

Hoy el concepto desarrollado por Google supone un estándar para todos los buscadores, que implementan cada cual a su manera criterios similares. A pesar de que todos han intentado parecerse, han quedado irremediablemente lejos: Google ha acaparado las búsquedas que se hacen en internet, no sólo porque es, efectivamente, una herramienta magnífica (increíblemente fácil de usar, con una interfaz limpia y clara, y que además, funciona de maravillas), sino porque al haber surgido en oposición a la indexación por publicidad, todos asumimos que los resultados de Google no están manipulados por intereses comerciales sino que son el resultado estricto de aplicar un algoritmo imparcial sobre las páginas rastreadas. Es decir, usamos Google porque arroja excelentes resultados pero además porque creemos en Google.

El punto es que el algoritmo de indexación de Google es secreto. Es muy probable que no exista manipulación alguna, pero lo cierto es que resulta imposible saberlo. El anuncio de lanzamiento de Knol, la enciclopedia de Google, no me pareció inquietante por su eventual competencia con la Wikipedia (si los contenidos son libres, bienvenido sea, pues el objetivo de la Wikipedia no es promocionarse a sí misma sino promover el conocimiento libre; si sus contenidos no son libres, no creo que logre desarrollarse al punto de suponer competencia, pero este es tema de otro post). Me pareció inquietante, sí, por una afirmación perdida en el blog oficial de Google: se espera que haya artículos de diversa calidad, el trabajo de Google, dice el artículo, será rankearlos (en las búsquedas) adecuadamente de acuerdo a su calidad. ¿Google acaso favorecerá a los mejores artículos de Knol por su calidad? La forma en que Google determina la posición de una página en una búsqueda no incluye una valoración de calidad, salvo por indicadores objetivos (cantidad de enlaces entrantes, origen de esos enlaces, etc.). Si así fuera, si los artículos de Knol fueran tratados de manera diferencial al resto de la web sería una gran decepción para esa fe (el “creemos en Google”) que es parte sustancial del valor que tiene Google como servicio y como empresa. Pero lo más triste es que, como se ha dicho más arriba, no habrá forma de saberlo.

Si Wikia Search funciona de manera razonable traerá el enorme valor agregado del carácter libre y abierto: no sólo se podrá analizar el mecanismo de rastreo e indexación, sino que se podrán hacer implementaciones paralelas para verificar que no haya distorsiones en los resultados. Claro que, como dije al principio, para ello será necesaria una infraestructura informática de dimensiones, pero la sola posibilidad de hacerlo enriquece la herramienta de búsqueda (y la fe en ella).

Dice el sitio del proyecto Grub:

La búsqueda es parte fundamental de la infraestructura de Internet. Y actualmente está rota.

¿Por qué está rota? Está rota por la misma razón que hace que el software propietario esté siempre roto: falta de libertad, falta de comunidad, falta de transparencia. Aquí comenzaremos a cambiar todo eso.

Uno no puede menos que suscribirlo.



Artículos relacionados

3 comentarios ↓

#1 Talita on 12.29.07 at 9:46 pm

Me encantó el comentario sobre parís, yo igual hice el recorrido de oliveira!

#2 Patricio on 01.02.08 at 7:02 pm

Gracias por el comentario, Talita, aunque no sé bien por qué está en este post :)

#3 Wikia Search versión pre-alpha — Señales de Humo on 01.07.08 at 9:19 am

[...] bien deseo fervientemente que este nuevo buscador tenga éxito (ya he explicado mis razones), lo cierto es que más que una versión pre-alpha (que significa que se trata de la última [...]

Deja un comentario