sábado, diciembre 13, 2003

Un anillo para encontrarlos...

Durante meses, los webmasters del mundo habían visto que un programa crawler (mapeador del web) llamado "Almaden" iba a sus sites. Ese infobot fue identificado rapidamente como proveniente del afamado laboratorio Almaden de IBM, situado en San Jose, California. Los webmasters se preguntaban qué estaba tramando IBM ahora... la respuesta vino en septiembre de este año, y ha dejado a todos boquiabiertos.

IBM decidió después de años de investigación lanzar su sorpresa bajo la marca de "Webfountain". Este no es un nuevo motor de búsqueda para el público en general, o no... Se trata de una herramienta para las grandes empresas -piensan enfocarse en las "Global 2000", como les llaman- capaz de extraer automaticamente los datos del internet para realizar patrones utiles en estudios de mercado o en la inteligencia económica. Por ejemplo, la primera utilización práctica fue la de peinar la red para saber por adelantado cuál iba a ser el éxito de un album que iba a lanzar cierta companía de discos. Webfountain detectó todas las discusiones en línea, todos los anuncios, comentarios de internautas antes del lanzamiento mismo del disco, permitiendo así determinar el número de CDs a grabar antes de su salida y adaptar el presupuesto de promoción teniendo en cuenta el "boca a boca" creado naturalmente alrededor del disco.

Pero las posibilidades son aún más vastas para todo estudio de inteligencia:
- el crawler, según IBM, puede peinar la red en 32 horas.
- algoritmos especializados en semántica pueden identificar el contenido de no importa qué pagina del web, sin importar el idioma.
- la arquitectura del motor es escalable, por lo que este puede evolucionar en base a su propio aprendizaje.

Ante todo Webfountain es hija de uno de los investigadores más brillantes de Almaden: Andrew Tomkins. Este inglés de 34 años es uno de los mayores expertos en análisis y recolección de datos con una aproximación heuristica. El escribió un artículo legendario en 1999: "The Web as a graph", una visión de la red en base a la teoría de gráficas. El equipo lidereado por Tomkins se preguntó qué era la web. Y se enfocaron a estudiarla con una premisa: ante todo es un producto humano. De ahí realizaron un modelo matemático que reflejara la distribución de temas y comundades en la web. IBM vió el potencial del modelo e invirtió grandes cantidades en hacerlo operativo. Hoy es su arma secreta en la conquista de la red.

Ya veo a todas las policías del mundo suscribiéndose...

No hay comentarios.: