La era Google

(publicado el 1 de Septiembre de 2003)

Se ha comparado Internet incontables veces con la Biblioteca de Babel de Borges (la mención más famosa, creo, es la de Ignacio Ramonet, que provocó un excelente texto de Christopher Rollason): la idea de un océano de datos donde la información es difícil de pescar, y una vez pescada, de comprobar su valor de verdad. Hubo un tiempo en que Yahoo y Altavista se disputaban el dudoso honor de ser los que proveyeran el índice a esa marisma; Altavista procuraba un motor de búsqueda bastante eficiente, mientras que Yahoo acometía vanamente la ciclópea (y acaso imposible) tarea de ordenar en categorías los heterogéneos sitios. ¿Cuántas categorías puede haber?, pensaba uno, y recordaba las clasificaciones arbitrarias de Borges o Greenaway; recordaba ese cuento, "El Congreso", donde se pretendía tener un libro representativo de cada uno de los aspectos de la humanidad, o ese otro mítico orden chino para los animales, citado infinitas veces:

a) pertenecientes al Emperador
b) embalsamados
c) amaestrados
d) lechones
e) sirenas
f) fabulosos
g) perros sueltos
h) incluidos en esta clasificación
i) que se agitan como locos
j) innumerables
k) dibujados con un pincel finísimo de pelo de camello
l) etcétera
m) que acaban de romper el jarrón
n) que de lejos parecen moscas

Naturalmente el propósito de Yahoo fracasó (o fue heredado y continuado irracionalmente por la gente de DMoz) y el insoslayable Altavista fue reemplazado gradualmente por Google, que traía bajo el brazo un nuevo algoritmo que hacía que los resultados de las búsquedas se parecieran sorprendentemente a lo que nosotros esperábamos. Google ostentaba un botón etiquetado "I'm feeling lucky" ("voy a tener suerte", en la versión vernácula) que sugería que la mayor parte de las veces el primer sitio propuesto por el motor resultaría el indicado. Pronto este innegable éxito borró a Altavista y a Yahoo, y de ahí en más todo fue Google. Fuera de la felicidad de contar con una mejor herramienta de búsqueda, no tardamos en darnos cuenta de que lo que antes era franca competencia entre dos colosos, hoy es un monopolio, que cuenta con un nuevo juego de reglas.

La moral vista desde Google

Una de estas nuevas reglas es la selectividad: Google no lista cualquier contenido de la red, sólo aquellos que ellos consideran válido. La romántica idea de que internet es libre para todos se angosta viendo que la guía donde uno busca la información ejerce una selección previa. Es de dominio público que Blockbuster decide que si una cinta de video no es para toda la familia, no será distribuida por su cadena. Pero al ser Blockbuster el más grande distribuidor de cintas de video de Estados Unidos, esta desaprobación importa la pérdida de millones en ventas para los que caen debajo de su pulgar, por lo que esto deriva en la decisión de los productores de películas de cuidarse de estar siempre dentro de los parámetros "familiares" decididos por Blockbuster, y se genera una suerte de autocensura. Wal-Mart, MTV, los periódicos y otras grandes cadenas deciden los destinos de otros tantos géneros. Similarmente, cuando se trata de encontrar contenido en Internet, uno no tipea un URL en la barra de dirección, sino que inevitablemente termina buscando en Google. Para ciertos gobiernos, sin embargo, no es conveniente que uno acceda a toda la información disponible. Así, el gobierno de China prohíbe (a través de Google) que sus ciudadanos obtengan datos indeseables. Para fines políticos, si se tiene suficiente poder, es más sencillo poner filtros si hay una puerta de salida que si hay varias. Pero esta censura no se limita a la (dudosa) moralidad de cada uno de los gobiernos regionales, sino que el mismo Google la ejerce con sus propias convicciones. Así, en Alemania y Francia las páginas neonazis o racistas fueron excluidas, y globalmente la pornografía pasó a ser "políticamente incorrecta" en los resultados (en la práctica no es tan sencillo, pero eso es harina de otro costal). Claramente hoy se está en Google o no se está en Internet, por lo que se debe coincidir forzosamente con el punto de vista de este motor acerca de qué es ético y qué no. Así, la famosa controversia de Xenu.net, quienes tienen una página contra una de las incontables sectas religiosas de Estados Unidos, la así llamada Cientología. Google decidió no listar las diversas protestas contra el "lavado de cerebros" de esta religión, alegando una aparentemente falsa infracción de copyright. Cuando la gente de Google fue apretada admitieron el paso de algunas de estas páginas, pero les negaron la publicidad a través del programa de avisos del motor, llamado "Ad-Words", aduciendo que desaprobaban los sitios que abogan en contra de individuos, grupos u organizaciones. Inútil advertir que la línea que separa la simple crítica de esa idea que propone Google es finísima. Así, un grupo de modernos censores decide qué es éticamente correcto y qué es impugnable en Internet. Nadie me prohíbe publicar este artículo, pero alguien decidirá si la gente podrá encontrarlo alguna vez en esta Biblioteca de Babel.

¿En qué puesto estoy hoy?

La segunda regla implica la vida o muerte de algunos emprendimientos. Si bien hoy es muy difícil ser censurado por Google, es en cambio desalentadoramente sencillo que nuestro querido sitio se encuentre (o nadie lo encuentre, que es lo mismo) en la décima página de una búsqueda Google por ciertas palabras-clave que coinciden con nuestro contenido. Es claro que nadie en su sano juicio revuelve páginas y páginas de resultados; así, buscando por "Tienda Vudu" este sitio de noticias se muestra orgullosamente primero, pero buscando más naturalmente "noticias open source linux", podemos pasar incontables páginas sin que aparezca. Los webmasters matan por lograr un mejor lugar en la lista de resultados; el aparentemente democrático mecanismo de ubicación lleva a muchos a replantear el diseño (y a veces hasta los contenidos) de sus páginas. Leyendo con atención el paper original donde Sergey Brin y Lawrence Page presentan a Google en la Universidad de Stanford, podemos visualizar la fórmula que es la obsesión que desvela a algunos miles de diseñadores:

    PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))

Tecnicismos afuera, esta fórmula bautizada "PageRank" implica que cuanta más gente tenga enlaces a mi sitio y menos gente yo enlace desde mi sitio, mi lugar en la lista de Google será más beneficioso. Cuando uno piensa en la expresión "world wide web", uno se imagina que una red hecha de nodos que apuntan hacia muchos otros nodos, y que es apuntado a su vez por otros tantos. Esta imagen está basada en la revolucionaria idea del hipertexto, que dice que si al leer la historia de la literatura en idioma alemán me topo con Franz Kafka, habrá seguramente un enlace al alcance de un simple clic de mouse que me permitirá saltar a la vida y obra del escritor checo. Sin embargo, la nueva filosofía que propone Google es que, a menor cantidad de enlaces hacia el exterior tenga, mejor posicionamiento tendré, porque perderé menos puntaje en esa especie de drenaje de energía vital que es el PageRank. Sin embargo, he de conseguir que alguien me enlace a mí, porque debo obtener la mayor cantidad de "votos" posible, especialmente de aquellos sitios que tengan un alto puntaje a su vez. Incluso corre el rumor de que una página que no es enlazada por al menos un site, no tiene entrada en Google. ¿Cuál es el modelo ideal de un sitio que reciba la bendición del famoso "I'm feeling lucky"? Naturalmente, un sitio comercial como la página de web de la tarjeta Visa, que muchos enlazan pero que no enlaza a nadie más: la razón de ser de ese tipo de páginas es promocionar un producto, no el permitir al navegante enriquecerse con otras experiencias similares alternativas. Nadie esperaría que Visa enlace a MasterCard. ¿Cuál es el modelo menos ideal para Google? Un sitio que no es muy conocido, pero que sirve como un buen repositorio de recursos para acceder a otros sitios de Internet. Por ejemplo, tengo en mi página una sección dedicada a sitios que proporcionan información sobre algunos lenguajes europeos. El PageRank se escapa por todos esos muchos links como si de un balde lleno de agujeros se tratara. Ahora, de más está decir que lo que es bueno para Google es el reverso de lo que es bueno para la internet como un ente orgánico de expresión colectiva, o lo que es bueno para un navegante asiduo como vos, o como yo.

Actualización: hay bastante más tela que cortar acerca de Google, como he descubierto en su debido tiempo. En mi weblog escribí un poco más sobre este tema.

VolverVolver...