ENTREVISTA CON MONIKA HENZINGER DE GOOGLE - Calendae | Informática, Electrónica, CMS, Ciberseguridad

ENTREVISTA CON MONIKA HENZINGER DE GOOGLE

Hola, un placer verte por aquí. Soy Simón Sánchez y en el día de hoy hablaremos sobre ENTREVISTA CON MONIKA HENZINGER DE GOOGLE

por Christopher Poeppe

Los motores de búsqueda, programas especiales que se utilizan a través de la red, se han convertido en guías indispensables en la caótica diversidad de la World Wide Web. Después de ingresar una palabra clave, un motor de búsqueda proporciona una lista de páginas web que tienen algo importante que decir. en la palabra clave (caso ideal) o que contenga la palabra clave en algún lugar (caso real). Hace aproximadamente un año, el motor de búsqueda de Google se hizo conocido también en Europa por la propaganda verbal y pronto se convirtió en el motor de búsqueda más solicitado de todos. El nombre Google alude al apodo estadounidense «googol» para 10 ^ 100, que es una ligera exageración para el número actual de páginas web registradas.

Monika Henzinger, directora de búsqueda de Google Inc., habla sobre el estado actual de los motores de búsqueda en la 17ª Conferencia Internacional sobre Supercomputadoras, ISC2002, en Heidelberg. El Dr. Henzinger fue invitado al discurso de apertura de ISC2002 el jueves 20 de junio de 2002 y dará una presentación sobre el tema «Indexación web: un desafío para la supercomputación».

Esta entrevista para Calendae fue realizada por Christoph Poeppe, editor de la revista «Spektrum der Wissenschaft», que es la versión alemana de «Scientific American».

Calendae: ¿Qué tamaño tiene Google hoy?

HENZINGER: Tenemos 3 mil millones de páginas en nuestro repositorio. Entre ellos se encuentran 700 millones de artículos de grupos de noticias del pasado lejano, que hemos comprado en Deja-News, 300 millones de imágenes y más de 2 mil millones de páginas web.

Calendae: ¿Y los ha almacenado todos en su base de datos?

HENZINGER: Sí, en forma de tableta.

Calendae: ¿Esta es toda la web?

HENZINGER: ¡No, en absoluto! En realidad, la web es infinita. Existen bases de datos que pueden crear una gran cantidad de páginas web bajo demanda. Evidentemente de nada sirve tenerlos todos en el buscador. Nos limitamos a páginas de alta calidad.

Calendae: ¿cuál es la medida de la calidad?

HENZINGER: PageRank. Este es un tipo de calificación que le damos a cada página, independientemente de las consultas para las que esta página pueda ser relevante. De hecho, la calidad de una página aumenta con el número de otras páginas que apuntan a ella y la calidad de estas otras páginas. Además, PageRank determina esencialmente el orden en que Google presenta los resultados de búsqueda al usuario.

Calendae: ¿Es posible manipular el cálculo de PageRank, por ejemplo, poniendo algo como etiquetas de precio Online?

HENZINGER: Los spammers al menos lo intentan una y otra vez. Por ejemplo, hay muchas preguntas para «Britney Spears». Muchas personas intentan aumentar su PageRank para estar en la parte superior de las respuestas de «Britney Spears», incluso si solo venden zapatillas.

Calendae: ¿Qué estás haciendo al respecto?

HENZINGER: Si vemos un abuso obvio, eliminemos la página correspondiente. Esto redunda en interés de nuestros usuarios para quienes queremos preservar la calidad.

Calendae: Además de estas correcciones individuales, ¿también toma otros pasos?

HENZINGER: Sí, pero no lo discutimos en público, ya que no queremos entrar en una carrera armamentista con los spammers.

Calendae: ¿Cuánto tiempo ha existido Google?

HENZINGER: La empresa se fundó hace tres años. Hace más de dos años nos hicimos públicos. Las noticias sobre nosotros se difundieron de boca en boca. Mientras tanto, la mitad de las solicitudes provienen de fuera de Estados Unidos, el 12 por ciento de países de habla alemana solamente. Respondemos más de 150 millones de preguntas al día, directamente o a través de nuestros socios. Por ejemplo, si el motor de búsqueda de Yahoo no encuentra una palabra clave en su índice, nos pasa la consulta y devuelve nuestra respuesta al usuario.

Calendae: ¿Qué hardware funciona su sistema?

HENZINGER: Tenemos más de 10,000 PC, distribuidas en cuatro centros de datos. Nuestro sistema operativo es Linux.

Calendae: ¿Con qué frecuencia comprueba si las páginas web que enumera todavía existen?

HENZINGER: Actualizamos nuestra base de datos cada 28 días. Además, hay algunas páginas web muy populares que visitamos a diario. Cada 28 días recreamos el índice que, para cada palabra, enumera todas las páginas web que contienen esta palabra. Si ingresa dos palabras en el campo de búsqueda, se le presenta la intersección de ambas listas, ordenadas por PageRank y algunos otros criterios. En particular, puede suceder que la página de inicio de una empresa ni siquiera contenga el nombre de la empresa en una forma legible, pero tal vez solo como parte de una imagen. Pero por las muchas páginas web que apuntan a esta página de inicio y mencionan el nombre de la empresa, sabemos que esta tiene que ser la página de inicio y presentarla así.

Calendae: ¿Qué tan desafiante es esta indexación?

HENZINGER: Mucho. Alrededor de una semana.

Calendae: ¿Cuántos empleados tiene su empresa?

HENZINGER: alrededor de 350. Hasta la fecha, el número de empleados se ha duplicado cada año.

Calendae: ¿Cómo se financia Google?

HENZINGER: Primero, con el anuncio habitual: anuncios de texto que se ejecutan en una línea. Aparecen sólo para consultas como «máquinas», es decir, si pueden ser de interés para el interrogador; a esto lo llamamos orientación por palabra clave. En segundo lugar, cualquiera puede comprar un anuncio Online con su tarjeta de crédito. Si quieres felicitar a tu esposa por su cumpleaños con Google, puedes colocar un anuncio que aparezca solo por su nombre. Sin embargo, el anunciante típico es un pequeño productor de jarabe de arce en Maine. Su anuncio aparecerá a la derecha de los resultados de búsqueda si el usuario escribe «jarabe de arce». En tercer lugar, de los servicios de investigación. Por ejemplo, Yahoo nos paga por mostrar nuestros resultados de búsqueda en su página. Algunas empresas quieren configurar la función de búsqueda para su página web, pero no quieren programarla ellas mismas. Para estas empresas, creamos un índice separado y respondemos las preguntas de investigación que se le hacen a la empresa. Cuarto, recientemente comenzamos a vender nuestros productos para uso interno en intranets corporativas. Somos una de las pocas startups que lo está haciendo realmente bien.

Calendae: ¿Hay nuevos proyectos?

HENZINGER: Hay varios. Entrada de voz, por ejemplo. El usuario dice su pregunta en un micrófono y obtiene las respuestas en la pantalla, en el futuro también puede haber respuestas de voz. Otro proyecto es nuestra búsqueda de noticias. Nuestras máquinas leen periódicos y artículos de grupo sobre el mismo tema de muchos países diferentes. Esto es realmente interesante, porque la cobertura suele ser local. La confrontación regular puede ampliar enormemente su horizonte. Haga clic en «Noticias y servicios» y luego en «Pruebe nuestra búsqueda de noticias beta». O interfaces de usuario. ¿Cómo puede hacer que un usuario escriba más de dos palabras? Cuantas más palabras nos diga, mejor podremos servirle.

Sitio web: http://www.google.com

Sitio web: http://www.google.de

Sitio web: http://www.supercomp.de/

=============================================== ==========

No te olvides compartir en en tu Twitter y Facebook para que tus colegas lo flipen

??? ? ? ???

Comparte