Ir al contenido principal

Sobre puntos, líneas, calcetines desparejados y contubernios matemáticos

Mi móvil sabe que hablo francés y yo no se lo he dicho. Sabe que me gusta más la comida japonesa que la italiana, que no estoy interesada en saber nada sobre fútbol pero sí sobre yoga y que cualquier noticia sobre arte contemporáneo o arqueología llama mi atención. Una vez una amiga me dijo que su móvil le escuchaba y que por eso, cuando luego buscaba algo en Google le mandaba a páginas de cosas que ella había pensado ya pero no sabía cómo encontrar. ¡Ostras! ¡Su móvil no solo le escuchaba sino que además le leía la mente! ¿Estamos siendo controlados? ¿Existirá un nuevo contubernio judeo-masónico-comunista que están conspirando contra nosotros? En todo caso se trataría de un "contubernio matemático" que se sirve del algoritmo Page Rank que es el que controla las búsquedas de Google. La forma que tiene de hacerlo me ha recordado un poco a cuando mi madre me habla de alguna persona diciéndome quién es su madre, con quien trabaja, dónde estudió, con quién se ha casado, dónde vive...todo un árbol genealógico con ramificaciones... ¡o un grafo! según cómo se mire.

Cuando a finales de los años noventa se popularizó internet existían distintos buscadores (Yahoo!, Altavista, Lycos, Excite, Olè.com...) que te ofrecían resultados diferentes para la misma búsqueda de información ya que cada uno de ellos lo hacía de una manera parecida, pero distinta. En la WWW había miles de páginas de todo tipo y había que ordenarlas de alguna manera. Era como un enoooorme armario de adolescente en el que tienes que buscar el calcetín perdido entre jerséis sin doblar, camisetas, pantalones y demás, todo sin orden ni concierto. Pero aquí aparecen las matemáticas para poner orden en este desconcierto. Los motores de búsqueda navegaban a través de toda la web utilizando, sobre todo, buscadores semánticos, algoritmos que analizaban las palabras de la búsqueda, localizaban páginas web que las contenían y nos las ofrecían como respuesta. Cada motor de búsqueda funcionaba con su propia combinación de algoritmos lo que hacía que las búsquedas aportaran respuestas distintas, por eso en aquellos momentos no era raro abrir dos y hasta tres buscadores para intentar localizar las mejores respuestas a lo que habíamos preguntado. Y en esto  andábamos cuando aparecieron Larry Page y Sergey Brin dos matemáticos que estaban estudiando su doctorado en Ciencias de la computación en la Universidad de Standford y que se unieron para desarrollar un nuevo y mejorado algoritmo que produjera unos resultados de búsqueda más cercanos aún a lo que demandaban los usuarios. Este nuevo algoritmo de búsqueda fue denominado Page Rank es el origen del predominio actual de Google sobre los demás buscadores. 


El fin de los calcetines desparejados

La red está llena de páginas y de alguna forma tendremos que organizarlas...el Page Rank es el Marie Kondo de internet: coge todas las páginas y las cataloga y ordena según nuestra demanda; igual que se hace con la ropa en los armarios que se ordena, dobla y se guarda por colores o por tipo de prenda y, si se hace bien, es el fin de los calcetines desparejados. Page Rank vino a dar relevancia a las páginas según los enlaces que tuviera: estudiaba con quién se relacionaba y dependiendo de esto, la posicionaba más adelante o más atrás en las búsquedas. 

Como ya hemos mencionado más arriba, los primeros buscadores realizaban análisis de los términos (las palabras) de búsqueda para proponernos páginas pero utilizar solamente ese tipo de algoritmos semánticos hacía que la concreción se centrara solo en las palabras que habíamos tecleado en el buscador, en las coincidencias de textos, y Page y Brin pensaron que si se usaba el contexto de cada usuario se podrían aportar resultados más cercanos a sus verdaderos intereses, aún y cuando no los hubiera tecleado en su búsqueda. Así, además de analizar y catalogar las páginas según los términos su algoritmo realizaba un posicionamiento de las páginas útiles o relevantes. Una página es relevante cuando enlaza a páginas que son relevantes. Para las empresas, convertir su página en relevante para que apareciera en los primeros puestos de búsqueda empezó a ser importante ya que les suponía mayores ingresos. Cuanto más arriba aparecieran en la búsqueda más facilidad de que se adquirieran sus productos. Pero fueron más allá y lograron utilizar los datos de navegación de los usuarios para incluirlos como factores de búsqueda y, con todo esto, hacer un análisis de la calidad de estos resultados tras estudiarlos y cotejarlos con los datos del usuario de tal manera que las respuestas fueran más significativas y personalizadas. 

El uso de nuestros datos pasivos por parte de Google (qué leemos, durante cuanto tiempo, qué clicamos, a qué le damos "me gustas" o compartimos, qué busco, qué hashtags usamos, cómo nos movemos por la red, qué compramos, qué aplicaciones tenemos y cómo las usamos...) es controvertido. Google almacena gran cantidad de esos datos de navegación y luego los utiliza para ofrecernos la información que queremos, por eso mi amiga piensa que su móvil le espía. Cada vez que entra en internet está alimentando a Page Rank y los demás algoritmos que usa Google. No adivina lo que queremos, se lo estamos diciendo en idioma matemático, aunque no somos conscientes de ello. 

El algebra computacional se sirve de los grafos para unir las distintas páginas web, con nuestros datos pasivos y los términos de búsqueda y elaborar listas personalizadas de resultados relevantes para esa búsqueda concreta. Los grafos son unos conjuntos de puntos o nodos (en este caso los sitios web) que se unen entre ellos por medio de líneas en relaciones binarias, estas conexiones y la probabilidad de que ocurran entre una página y otra es lo que ordena  Page Rank. Dada la gran cantidad de información que circula por la web, los algoritmos cambian y se adaptan y continuamente y a gran velocidad, modificándose más de una vez al día para ser más precisos. Cada "me gusta" o interacción establece una conexión directa con otros datos digitales: es la estructura de un grafo que puede procesarse con un algoritmo que nos ofrece una solución derivada de la probabilidad. 

Pero a pesar de que existe un indudable riesgo en el monopolio de los datos por parte de una empresa, está también fuera de toda duda que este algoritmo y los posteriores que lo han ido actualizando han sido fundamentales en el avance de la técnica y la computación. Por eso, sus descubridores han recibido premios con el Marconi o el Princesa de Asturias. 

Después de todo esto, espero, amiga, que hayas entendido que tu teléfono no te espía ni te lee la mente, eres tú la que pones toda la información en un inmenso escaparate para que los algoritmos se alimenten de tus datos.

Fuentes:

Blog ¡Magufos! Esta es mi internet y busco como quiero

You Tube canal Derivando; Page rank: el algoritmo matemático que hizo a Google dominar el mundo

Wikipedia Larry Page

Wikipedia Sergei Brin

Saorin, T. Así alimentamos los algoritmos de Google (sin pretenderlo) The conversation

Blog La ciencia de la mula Francis, La ciencia oculta detrás del algoritmo Page Rank de Google

Búsqueda de Google. Cómo funcionan los algoritmos de búsqueda. 

Comentarios

Lo más leído

Annette Laming-Emperaire, gran innovadora en los estudios sobre el significado del arte paleolítico

  Annette Laming-Emperaire fue una arqueóloga francesa de origen ruso que realizó investigaciones innovadoras y trascendentales para estudiar el significado del arte paleolítico. También dedicó gran parte de su vida a la prospección arqueológica de Sudamérica descubriendo en 1975 el fósil humano más antiguo del continente. Nació en Petrogrado, actual San Petersburgo, en octubre de 1917, en pleno estallido de la revolución rusa. Su familia huyó de allí hacia Francia donde se establecieron en París. Annette empezó a estudiar filosofía y biología en la universidad hasta que la Segunda Guerra Mundial le impidió continuar sus estudios. Durante la contienda, se dedicó a la enseñanza y entró en la Resistencia para luchar contra los nazis. Se fue a Alemania para colaborar en la ayuda a los prisioneros en los campos de concentración y allí estaba cuando terminó la guerra. Cuando volvió a París se matriculó de nuevo en la Sorbona, pero esta vez para estudiar arqueología. En 1946 entra a formar p

Neri Oxman: Ecología de materiales para construir el futuro (Retrato alfabético)

  A rquitectura Neri Oxman es una arquitecta , diseñadora, científica y profesora del MIT Media Lab donde dirige un grupo multidisciplinar de investigadores. Sus proyectos de investigación abordan temas relacionados con la construcción y el diseño ambiental. Junto con su equipo realiza proyectos combinando la ingeniería de materiales, la biología, el diseño y la computación, entre otras disciplinas. Ella define su trabajo como Material ecology (ecología de materiales) porque investiga sobre nuevos materiales basándose en la naturaleza y siendo respetuosa con ella, pero desde una perspectiva muy innovadora. Se inspira en los ecosistemas naturales para crear biomateriales que puedan producirse a escala industrial pero que no dejen residuos si no que se biodegraden. Se basa en que, en los ecosistemas, la materia de cada organismo que lo compone alimenta el ciclo de vida de otro, no hay desperdicio porque todo tiene un valor y una función. Esta noción de ciclo natural donde todo sirve

“Se ha perdido mucho tiempo en no relacionar los problemas medioambientales con la salud de las personas” Entrevista a Cristina Linares y Julio Díaz @Ensgismau

El cambio climático es uno de los problemas más complejos a los que se ha enfrentado la humanidad. Comunicarlo y lograr que la ciudadanía sea consciente de su magnitud y de cómo nos afecta es una labor dificil. Cristina Linares y Julio Díaz son investigadores de la Unidad de referencia en cambio climático, salud y medio ambiente dentro del Instituto Carlos III. Investigan sobre cómo la emergencia climática nos afecta directamente a nuestra salud y lo cuentan desde 2015 a través de su cuenta de Twitter @ensgismau y por medio de publicaciones divulgando sus investigaciones y charlas en distintos foros. Hablamos con ellos sobre salud, emergencia climática, educación ambiental y divulgación científica. Dentro de la Unidad de referencia en cambio climático, salud y medio ambiente del Instituto Carlos III donde trabajáis investigáis temas relacionados con la salud y el cambio climático. Son temas complejos de explicar a la ciudadanía, a personas no cercanas a la ciencia ¿Qué herramientas

El buen uso de la ciencia. Fritz Haber y Clara Immerwahr

La historia de la familia Haber es una historia que habla del bien, del mal y de la química. No de la química entre el bien y el mal, ni de la que hubo entre los dos personajes principales, que también podría ser, si no de la química como ciencia capaz tanto de salvar como de acabar con las vidas de millones de personas. Clara Immerwahr y Fritz Haber nacieron con dos años de diferencia (1870 y 1868) en Prusia. Ella era la hija pequeña de una familia de granjeros y él pertenecía a una antigua y conocida familia de comerciantes judios de Breslau (actual Worclaw, en Polonia) a pocos kilómetros de donde la familia de Clara tenía sus tierras. Ambos tenían inquietudes científicas, en concreto les apasionaba la química. En el caso de Fritz, esto no supuso ningún problema para su pudiente familia que lo envió a Berlín a la universidad, ya que pensaban que cursando estos estudios podía ayudar en el negocio familiar que era el comercio de tintes. Clara, en cambio, lo tuvo más complicado, ya que,

Los monólogos de divulgación científica y la historia de la ciencia. El ejemplo de Naukas Bilbao 2022

Cuando se hace historia de la ciencia (o de las ciencias, que de eso ya hablamos antes ) siempre aparecen más preguntas que respuestas. Hablar de cómo ayuda a entender el ejercicio de la historia al desarrollo de las distintas ciencias puede ser tan complejo como las propias disciplinas objeto de su estudio. Esto se debe, sobre todo, a que cuando hacemos historia de algo estamos construyendo a la vez el propio objeto de nuestro estudio. Toda persona tiene su propio contexto: su familia, su lugar de origen, cultura, educación, creencias religiosas o ausencia de ellas, idioma en el que se comunica…y a partir de estas bases se relaciona con el mundo. Cuando alguien hace historia, mira al pasado desde su propio contexto y desde la época que le toca vivir y relata los hechos bajo el sesgo de su cultura, sus necesidades, y desde sus propios objetivos. Seleccionamos el pasado que queremos en función de nuestro presente, usamos las fuentes de manera presentista, siendo conscientes o no de el