88.-Google

Destripando Google

Cualquier tecnología suficientemente avanzada es indistinguible de la magia.

Arthur C. Clarke

Hay cosas un tanto mágicas que, a fuerza de repetición, dejan de maravillarnos. Varios vivimos en el medio de la ciudad, a kilómetros de cualquier espejo de agua y, sin embargo, abrimos la canilla y el indispensable líquido simplemente aparece. Casi nunca pensamos en la fenomenal obra de ingeniería necesaria para que eso suceda y tampoco solemos recordar que no siempre fue así (y que, lamentablemente, en muchos lugares todavía no es así). Con Internet pasa algo similar. Con el buscador, para ser más precisos. Ponemos una frase, una palabrita, y enseguida aparecen los resultados. Muy enseguida. En una fracción de segundo. Casi demasiado enseguida, considerando la inmensa cantidad de información que hay en Internet. Entonces, ¿qué hay detrás de la brujería que permite encontrar la página que queremos entre las casi 4,5 mil millones existentes?

Lo que hay no es ni más ni menos que otra obra monumental del pensamiento humano. Un puñado ideas geniales, brillantes. Y la mayoría no se le ocurrieron a Google.

Cualquier sitio de búsqueda de Internet como Google, Yahoo o Bing, primero debe asegurarse de tener la información disponible. Para eso es necesario hacer dos cosas en simultáneo: recorrer toda la web y almacenar la información que contiene. Si vamos a reunir más de 4,5 mil millones de páginas, claramente necesitamos mucho espacio, y para eso están destinados buena parte de los centros de cómputo que Google tiene por todo el mundo, ya que la información no se guarda en un único disco rígido XXXXXXL, sino en millones de discos rígidos normales, distribuidos en millones de computadoras interconectadas entre sí. Eso no es nada original, aunque hay que reconocerle a Google que sí innovó sobre la forma en la que utiliza esa interconexión.

Pero lo más interesante es analizar la parte encargada de hacer el tour por la web, una idea sencilla que viene a ser una receta de tres pasitos nada más:

  1. Empiezo por una página web (www.elgatoylacaja.com, ponele, o alguna más copada).
  2. Almaceno en una gran base de datos las palabras que aparecen, asociadas a la página web en la que están. Por ejemplo, si en la página encuentro las palabras ‘instrucciones para armar un pollo’, voy a almacenar:
    1. instrucciones → www.elgatoylacaja.com
    2. para → www.elgatoylacaja.com
    3. armar → www.elgatoylacaja.com
    4. un → www.elgatoylacaja.com
    5. pollo → www.elgatoylacaja.com
  3. Veo qué links tiene esa página y los voy siguiendo, pasando a las páginas que indican. Y es acá donde el proceso vuelve al segundo paso. Así, una página lleva a otras, que llevan a otras, que llevan a otras…, y de esta forma voy ‘descubriendo’ la famosa red.

La manera en la que Google hace esto no es obra de Google. Es muy conocida y se llama BFS: Breadth First Search, o búsqueda ‘a lo ancho’, que a su vez pertenece a un área del conocimiento humano llamada ‘Teoría de grafos‘. Los grafos son una generalización de la idea de ‘cosas’ conectadas entre sí. O sea, puntitos conectados con flechitas. Esos puntitos pueden ser páginas web y las flechitas pueden ser los links; o los puntitos pueden ser ciudades y las flechitas los vuelos que las conectan; o los puntitos pueden ser vos, tu novia, tu ex, el ex de tu ex, el pibe que ahora sale con la ex de tu actual, y millones de otras cosas menos complicadas que todo ese stalkeo que hiciste. La teoría de grafos ha desarrollado muchas formas de recorrer y analizar este tipo de estructuras de redes. Y lo mejor de todo es que este conocimiento es público.

La idea detrás de BFS es simple, potente y, por qué no, hermosa. Si la entendemos, nos da conocimiento y nos habilita a construir otras ideas sobre ella. En definitiva, nos da poder. Si no la conocemos, volvemos a la magia, pero no a la magia copada, sino a la magia mala, la magia de no saber. Esa noche oscura del pensamiento en la que el poder para hacer cosas lo tienen otros, y nosotros no sólo no podemos, sino que tampoco entendemos.

Ahora, con la información almacenada, vamos por más. Encontramos que la palabra pollo estaba en www.elgatoylacaja.com, y supongamos que a medida que seguimos recorriendo la red aparece en unos 75 millones de lugares más, entre ellos, la página de Wikipedia que describe al ‘Gallus gallus domesticus’ (que así se llama el pobre bicho, uno viene a enterarse). Lo cierto es que, si alguien busca la palabra ‘pollo’, tal vez sería deseable que el artículo de Wikipedia quede listado (bastante) antes que el artículo de Pablo sobre el ADN (con todo respeto por el ADN, no tanto por Pablo). Para eso Google usa, de nuevo, una idea original y otra de dominio público.

Todo muy listo el pollo, pero ¿qué sucede cuando alguien tipea P-O-L-L-O (enter) en el buscador? Tenemos ese listado inmenso de palabras, cada una de ellas con una gran cantidad de páginas web asociadas. ¿Cómo hace Google para brindarnos un resultado en menos de medio segundo? ¿Es porque tiene computadoras poderosas y buena conectividad? En parte, pero no principalmente. ¿Es porque tiene muchas computadoras que hacen distintas partes del trabajo? En parte, pero no sólo por eso. ¿Es porque tiene un ejército de gnomos en dudosas condiciones laborales atentos a tus dudas? No, definitivamente no, pero todos lo pensamos alguna vez.

La idea responsable de la alta velocidad es también muy sencilla. Y de dominio público. Patrimonio de toda la humanidad: los árboles. No los árboles de la sombra, la leña y la fotosíntesis, sino otros un poco más abstractones.

El truco consiste en que el dichoso ‘listado’ inmenso de palabras no se guarda como un listado, con las palabras una a continuación de la otra, sino de la forma que los computólogos llamamos árbol:

 

arbolj

 

Hay algo interesante a señalar, una propiedad estructural del dibujo. Si nos concentramos en ‘instrucciones’, vamos a ver que la palabra que está a la izquierda es anterior en sentido alfabético y la que está a la derecha es posterior. Más aún: no sólo la que está inmediatamente a la izquierda, unida por la flechita, es anterior, sino que todas las que ‘cuelgan’ de ella lo son. Y por la derecha pasa lo mismo, son todas mayores. Pero hay más: esa característica es estructural porque también se da en cualquier parte del árbol. Por ejemplo, si analizamos la palabra ‘pollo’, también sucede que todas las de su izquierda son anteriores y todas las de su derecha son posteriores.

Acá está la magia, y de la buena. Si las palabras estuviesen en un listado, ¿cuántos pasos nos tomaría encontrar ‘pollo’? Si el listado no tuviese orden, dependería de dónde quedó, así que por ahí tenemos mala suerte y es la última, en nuestro ejemplo, 8 pasitos. Si estuviese por orden alfabético, quedaría anteúltima: 7 pasitos. Pero qué lindo el árbol que nos deja comparar la palabra que estamos buscando con la primera que aparece; aquí, ‘instrucciones’. Si la que buscamos es posterior (alfabéticamente hablando), ya sabemos que va a estar a la derecha y, si fuese anterior, a la izquierda. Ahí podemos ‘ir’ para el lado correspondiente y repetir el procedimiento hasta encontrarla. O sea, llegamos a pollo en dos pasos. De hecho, llegamos en a lo sumo 4 pasitos a cualquiera de las palabras que tenemos (porque, como se ve en el dibujo, en 4 pasos se acaban el árbol, el pollo y la metáfora).

¿Y si tuviese 20 millones de palabras? Ahí viene otra propiedad de estos árboles: están balanceados, lo que significa que, parado en cualquier palabra, la cantidad de pasos que hay que dar para llegar a la última de ellas por izquierda, vs. la cantidad de pasos para llegar a la última por derecha, difieren en a lo sumo 1 paso. Eso, sumado a un poco más de matemática, permite demostrar que siempre vamos a encontrar la palabra que buscamos en a lo sumo una cantidad logarítmica de pasos. O sea que encontrar una palabra entre 20 millones toma sólo 24 pasos. Y, si incrementamos por 100 el caudal de datos (pasamos a 2000 millones), son 31 pasos. 31 pasitos te los hago con los ojos cerrados y las manos atadas detrás de la espalda, 2000 millones (como en el caso del listado), capaz demoran un toque más.

Este árbol maravilloso que acabamos de analizar se llama árbol binario de búsqueda balanceado, también conocido como AVL, que por suerte no es lo mismo que ABL, y que ni siquiera tiene A de Árbol o B de Balanceado o L de binario (?), sino que viene de Adelson-Velskii y Landis, los matemáticos rusos que lo inventaron. Y lo publicaron. Y es patrimonio de la humanidad.

Cuando una idea tan increíblemente potente como la del AVL, tan presente de manera casi invisible en nuestra vida cotidiana bajo diversas formas, tan abiertamente patrimonio humano, se vuelve a la vez tan desposeída, en el sentido de que sólo la conoce una fracción muy pequeña de la población; estamos frente a la peor forma de la magia. Porque a los que la conocen y la usan les da poder, y a los que la ignoran, los somete y les hace pensar que esas características que los separan de los otros son inalcanzables, insondables e incomprensibles. Porque parecen magos y no mortales que se equivocan, que tienen deseos, intenciones, restricciones, y contextos.

Aprender se trata de tomar ese capital humano que ya nos pertenecía aunque no lo supiéramos. Somos varios los que queremos que a los chicos argentinos se le enseñe Ciencias de la Computación en la escuela, para que vean, descubran y entiendan la magia buena detrás de la tecnología; para que transformen la limitación de no saber en el poder de conocer y así puedan disfrutar de un montón de ideas que les pertenecen, aunque aún no lo sepan.

 

Thomas H. Cormen, Charles E. Leiserson, Ronald L. Rivest, y Clifford Stein. Introduction to Algorithms, segunda edición. MIT Press y McGraw-Hill, 2001. ISBN 0-262-03293-7.
Log-structured merge-tree
SSTable and Log Structured Storage




Hay 56 comentarios

Añadir más
  1. Joaquín Robles

    Buen artículo aunque me parece sumamente ambicioso llamarlo “Destripando Google” ya que no deja de ser una explicación muy simplificada sobre árboles de búsqueda. Personalmente creo que el diferenciador de Google como motor de búsqueda, además de la simpleza de su interfaz es el PageRank o “cómo decidimos que el primer resultado a mostrarte es el que estás buscando” y casualmente es un activo privado de la empresa.

      • Joaquín Robles

        Por favor sarcasmo=off, la elección del título implica expectativas y sumario por eso creo que el artículo no está a la altura. Más allá de eso no dejo de pensar que es un buen artículo (lo cual ya mencioné anteriormente) y una primera aproximación didáctica a los árboles de búsqueda.

        • Eluá

          Me parece que a veces es muy difícil titular algunas publicaciones. Yo sugeriría que le cambien el título a “Destripando Google I”, y que continúen con la serie. Explicando PageRank y algoritmos similares, estadística bayesiana (que tengo entendido que usan bastante), etc.

        • Dan

          Tené en cuenta que Joaquín, que la idea de este sitio es bajar a tierra ideas científicas para que los lea cualquiera que no tenga conocimientos previos sobre el tema. Sin un título que haga referencia a “algo que sepamos todos” , es prácticamente imposible captar la atención sin generar al menos un poco de expectativa.
          No creo que sea posible que un artículo de divulgación ciéntifica para todos pueda “estar a la altura” de un título atractivo.
          Coincidio con ELUÁ en que este podría ser una primera parte de una serie de artículos.

      • Nicolas

        Ademas, el titulo es técnicamente incorrecto ya que google no se puede destripar, básicamente porque no tiene tripas (jua).

        Seria interesante un articulo elaborado por alguno de los tantos neurocientíficos del gato, en el que nos cuenten a los normales, por que la gran mayoría de los nerds no-copados tienen la innata necesidad de exponer sus conocimientos, pero no para compartir e iluminar a otros, sino para demostrar que saben. Este articulo dejo bocha de evidencia al respecto.

        Sera un freno evolutivo para que fracasen en el proceso de cortejo y mantener un numero sostenible de humanos sobre la tierra? En fin…

    • Francisco

      No es un activo privado de la empresa, es un algoritmo conocido y estudiado hasta el hartazgo:

      Paper Original
      http://infolab.stanford.edu/~backrub/google.html

      Mejoras en la convergencia:
      http://ilpubs.stanford.edu:8090/865/1/2003-16.pdf

      El autovector de 25 mil millones de dolares:
      https://www.rose-hulman.edu/~bryan/googleFinalVersionFixed.pdf

      Cabe decir que PageRank fue el algoritmo inicial de Google. Con el tiempo fue mutando y modificandose, hoy es muy distinto (si es que queda algo) de la idea inicial. Sin embargo “PageRank” propiamente dicho, es este.

      • Joaquín Robles

        Tal cual Francisco, desconozco si actualmente se llama PageRank pero el algoritmo o procedimiento con el cual hoy Google rankea a cada web es privado y en eso radica el éxito de la indexación

        • Julián

          Buenas Joaquin, se llama Panda, según tengo entendido. No creo que ellos ganen porque el algoritmo sea privado, sino mas bien por que se la pasan innovando, modificandolo y tienen herramientas para testearlo coherentemente, contando millones de busquedas diarias

  2. Enriqueta Prommel

    Me gustan todos los posts del gato, pero tengo un ranking en preferencias. Desde que sigo la página este postre es para mi, el mas claro y explica cosas que deseaba saber pero dichas en palabras sencillas al alcance de mi comprensión. Además el tema de la web (world wibe web) , no se si esta bien escrito, me resulta fascinante. Será que por mi edad hasta la radio es una maravilla? (tengo 77 años) si y no. Asistí asombrada al inicio de las computadoras hogareñas y mi primera computadora fue una Comedores 64. Aprendí a usar el dos y fui avanzando hasta hoy (PC escritorio, tablet y teléfono inteligente) pero hasta hoy no comprendí el funcionamiento de Google, pese a usarlo cada día. No digo que entienda todo, claro, porque nadie entiende todo, pero algo mas que antes. Gracias especiales por este postre y todos los gatos que lo hicieron posible.
    Firmado : EL GATO IGNORANTE

  3. Francisco

    ¡Grande Schapa! Una sorpresa y un gran placer leerte por aca, el gato y la caja necesitaba algo de Cs. de la computación.

    No podria estar mas de acuerdo con la importancia de enseñar esta clases de cosas en la escuela. Es esencial entender que no hay magia en como funciona internet, ni un celular, ni absolutamente nada, el mundo esta hecho de buenas ideas y muchisimo esfuerzo.

    Lo mas lindo, lo mas importante, y lo mas revolucionario de la computación, es que no se necesita más que el acceso a una PC para poder mejorar el mundo, para hacer algo trascendente. Es la herramienta más poderosa a la que alguna vez tuvimos acceso, y justamente por eso no deberia quedar fuera del conocimiento de nadie.

    Igualmente, dado que la nota se llama “Destripando Google” me gustaria agregar algo. Si bien BFS y AVL son ideas excepcionales (en general, y no solo para un buscador web), no son lo que hicieron que Google sea Google. Su competencia (Altavista, Yahoo!, etc) seguramente tambien los usaban y son ideas que existen hace 30 años mas que Google. Lo realmente novedoso que aporto Google, lo que lo hizo el monstruo que es, es el algoritmo de Pagerank (http://en.wikipedia.org/wiki/PageRank) que al igual que las anteriores, es una idea tan sencilla como poderosa (y merece su propio post en la caja :) ).

    • Francisco

      BFS resuelve el problema de recorrer toda la internet.

      AVL resuelve el problema de encontrar, en los resultados del primero, todas las páginas que contienen las palabras buscadas.

      PageRank resuelve el problema de decidir dentro de las páginas con las palabras buscadas, cuales son las mas relevantes (por eso el resultado que queres siempre esta en la primer página :) )

  4. Ismael

    Me parece a mi o te faltó explicar como Google ordena los resultados de búsqueda usando PageRank? (lo que agrega todavía un pasito más a lo que ya parece magia para muchos). Excelente nota.

  5. Rodrigo

    “Destripando Google”?

    Teóricamente, es correcto lo que se menciona en la nota sobre el uso del AVL, pero me parece una falta de respeto a todos los programadores que invirtieron miles de horas de desarrollo en crear un sistema de búsqueda tan complejo como el de Google, como para reducirlo a un simple árbol de palabras relacionadas, dejando de lado los Algoritmos e Indexaciones, manejo balanceado de bases de datos (sin tener en cuenta el poderío de sus servidores, que se menciona como si fuese un dato accesorio) y otros tantos factores que no son de “dominio publico” e inventados por rusos matemáticos

    Incluso, si tuviésemos la posibilidad de acceder a la base de datos en crudo – una base de datos que estimando al aire, debe pesar no menos de miles de TB – realmente crees que solo por estar organizado en base a un indexación de árbol podemos obtener resultados de entre millones de palabras claves para encontrar ESO que buscamos, eso que google te pone en los primeros 5 o 10 resultados? así de simple? en tan solo 0.025 segundos?

    Google no solo se encarga de proveer resultados en base a palabras clave, los algoritmos de indexación, filtros de spam, reducción de datos y otros detalles que solo conocen las personas que trabajan para la empresa conocen es lo que realmente “genera la magia”. Hummingbird es la tercera version del algoritmo de búsqueda, existiendo antes Panda y Penguin, y son tan complejos de explicar a nivel teórico y arquitectónico que llevaría meses entenderlo, y quizás años poder modificarlo.

    Yo entiendo que explicar como funciona el buscador de Google o cualquier otro sistema (Como Facebook, Twitter o Tu vieja) en detalle o al menos el mas mínimo de ellos, llevaría tiempo y paginas de texto, pero reducirlo a una nota de un par de párrafos, me parece un pifie grave.

    Donde se esta “Destripando Google”?

    • Joaquín Robles

      Es que según comenta Pablo A. González estaban por ponerle de título ‘Empezando a aclarar algunas nociones algorítmicas básicas sobre los procesos de optimización de acceso a la información’ pero les resultaba largo..

      • Rodrigo

        Debería reírme?
        En base a eso, voy a escribir una nota sobre La teoría de las cuerdas, miro un poco de The Big Bang Theory, googleo algunas pavadas y ya. Total los detalles no importan.

        • Francisco

          Tampoco para tanto… Ojo, la omisión de PageRank me parece gravisima, es por lejos el algoritmo mas importante, al menos dentro de lo publicamente conocido, pero el único problema realmente grave de la nota es el titulo. Me parece que la idea es trasmitir que no necesitar se un ruso enfermito para entender como funciona un monstruo como Google, y podremos hacer mil observaciónes, pero ese mensaje al menos creo que esta claro y es correcto.

          • Joaquín Robles

            Estoy totalmente de acuerdo sobre el PageRank, casualmente mi primer comentario fue con esa observación.. Además el título genera expectativas y las reacciones negativas se deben a la incapacidad del artículo de hacerles frente.

          • Pablo A. González

            La verdad, hablo como lego absoluto de la computación. La intención de la nota es ser un comienzo muy básico sobre un área del conocimiento difícil y ajena, y para nosotros eso está re saldado. Me gusta que reclamen PageRank, porque la nota original tenía ese contenido pero se hacía inabarcable, así que preferimos partirla en dos. Lamento que el título no responda a tus inquietudes, solemos jugar mucho con eso y nunca había sido grave. Normalmente las notas salen en redes sociales con pedacitos que ayudan ahondar en el tema para evitar ese tipo de problemas. Creemos firmemente que ir de cero a uno es indispensable, y cuando nosotros la leímos nos enseñó algo que no sabíamos, y eso fue genial. Esperamos tener algo piola sobre PageRank pronto para completar lo que quedó inconcluso.

        • Juliám

          Sí!, deberías reirte. Yo soy docente de lengua y literatura y lo que hacen es hacer entendible para mí cosas que de otro modo no las endendería (a no ser que me ponga a estudiar eso, pero con lo mío ya tengo bastante)

    • mauro

      Lo que para Uds parece horroroso se llama divulgacion, la divulgación justamente intenta reducir la complejidad de algo para que sea entendible, la divulgación esquiva los detalles para sacarle el misterio a las cosas y que la persona que lo lee se anime a profundizar el tema tratado, lo mismo cuando se habla de mecánica cuántica o lo que sea, bajarlo a algo conceptual que sea entendiste, eso no te hará experto en física cuántica y evidentemente intentar ahondar en las ecuaciones matemáticas harán perder a más de uno, pero comprender a nivel conceptual es posible. Lamento este tipo de críticas aunque rescató que faltó lo de pagerank, pero lo demás es un lujo.

      • Rodrigo

        Mauro, te doy toda la razón, lo que yo critique es mas que nada el titulo de la nota, y como hace falsa publicidad a su contenido.
        El contenido de la nota perse esta perfecto, solo tiene falsas premisas y en ningún momento aclara que lo que se esta hablando es solo parte de un todo.
        Si yo leyera una nota sobre física cuántica, y claramente no tengo ni idea al respecto del tema, esperaría que la nota aclare que esta hablando sobre una parte de la misma, y no haciendo alusión a que todo funciona gracias a 1 solo principio básico.
        También me parece mas que correcto el comentario de Pablo, creo que con solo cambiarle el titulo a la nota a “Destripando a Google – Principios Básicos” o “Destripando a Google – Parte 1”, ninguno de los comentarios que acá se proponen hubieran existido. Incluso seria una excelente propuesta para armar un buen set de explicaciones sobre un tema tan profundo.

  6. Sergio R.

    Ya ni se cómo celebrar la existencia de este blog, rejunte de manijeros formadísimos, finísimos pedagogos, movimiento cultural, o como diantres quieran llamarse.
    Fernando, esta nota es genialidad!
    Enseñar programación a los pequeños es urgente, ahora lo entiendo desde un punto de vista más certero.
    Saludos!

  7. Ves

    Le comenté a mi hermano que estudia informática en la fiuba y habló de arbol + que vendría a combinar ese tipo de ‘estructura’ con la de listas… y de los distintos tipos que hay
    Me gusta pensar en esa coalición que se potencia con distintas maneras de hacer…

    Muy buen disparador!
    Acercando un poco los conceptos que nos dejan como burros en los comentarios… burros más fascinados —bien— con la magia.

    Sigan así GYC!

    Saludos

  8. Laueyss

    Me copa el artículo.
    Los que atacan el título, me parece que están necesitando demostrar que saben ¿más? que el que escribe el artículo…chicos, escriban algo copado y capaz se los publican, relajen.
    No ataquen, colaboren.

    Besos gatos, los quiero.

    • Francisco

      Criticar tambien es colaborar, no me parece que ninguno de los comentarios haya sido un “ataque”.

      No puedo hablar por el resto, pero en mi caso personal, Fernando fue profesor mio, lo admiro en varios aspectos, no solo academico, y si estoy en condiciones de criticar como lo hice antes es en buena parte gracias a él.

      Más alla de eso, el laburo que hacen todos los chicos de El Gato y la Caja es excepcional, admirable, es sin duda uno de mis blogs favoritos y me encanta leerlos.

      Y si, ojala algun dia sea yo tambien un Gato invitado :)

      • Laueyss

        Las críticas son geniales y me parece que siempre son importantes, sumen o no. Me parece, también, que hay maneras y maneras de decir.
        Leí gente con una indignación, que a mi modo de ver, era exagerada…a lo mejor también exageré yo con lo de “ataque”, pero esa sensación me dejó.

  9. Marucco

    Me parece excelente la nota, como siempre, hace un tiempo empece a seguir las publicaciones y siempre logran que te den ganas de aprender un poco más acerca de todo, replantearte formas de encarar problemas, etc. En cuanto al “problema” del titulo, entiendo que quienes realmente entiendan como funciona un monstruo como Google les haga ruido, porque ustedes se dedican a esto y les resulta importante en niveles prioritarios. Ahora, para nosotros, los simples mortales que a veces pensamos que el resto dejo de ser simples mortales una vez que aprendieron que carajo era un logaritmo, el AVL y el PageRank (Que ya me interno en wikipedia a ver que carajos es), nos sirve para replantearnos todo lo que implica un motor de busqueda desde el vamos. Porque no creo que ninguno de los lectores llegue a pensar que Google puede simplificarse como un arbol de busqueda común… Aún así y todo, felicitaciones muchachos! Sigan así que esperamos la proxima nota con ganas!

  10. Josefina

    “En definitiva, nos da poder. Si no la conocemos, volvemos a la magia, pero no a la magia copada, sino a la magia mala, la magia de no saberEsa noche oscura del pensamiento en la que el poder para hacer cosas lo tienen otros, y nosotros no sólo no podemos, sino que tampoco entendemos.”

    Esa frase capta la esencia completa de este blog. Todo el conocimiento, por más inútil que parezca, nos hace un poquito más aptos que el que no lo sabe.
    Gracias por darnos a todos, tan humildemente, el poder de salir de la noche cada día un poquito más.

  11. Fernando Schapachnik

    Bueno, si me presionan lo confieso. Dos de las cosas que menos me importan en la vida:
    -Google.
    -Las tripas.

    Pero lo que sí me importa es hablar del conocimiento público que no tenemos. Me encantan las ganas de saber más y de explicar más, sobre PageRank o sobre lo que sea. Pero más me gusta el fervor porque todos tengan acceso a los conocimientos de computación que explican el mundo en el que vivimos.

    Saben qué? Tienen razón. Con la divulgación no alcanza. La divulgación está muy bien, pero es siempre parcial, siempre resumida, siempre te va a faltar algo. Es una primera aproximación, despierta la curiosidad. Pero no alcanza: por eso creo que nos debemos Ciencias de la Computación en la escuela, para todos y todas. Fervorosos, los esperamos: http://program.ar https://www.facebook.com/Programar2020

  12. Julián

    Eso de los arbolitos me hizo acordar a la indexacón lexical de la gramática generativa chomskyana y cómo el sujeto accede al léxico para formar las oraciones en su operación lógica…

    • Pablo A. González

      Sabés que es un re flash, pero yo cuando lo ví pensé en cómo el cerebro integra información usando arbolitos, y el lenguaje es mega válido como ejemplo. Hoy salió una nota re linda en Exactas, deberías verla: http://nexciencia.exactas.uba.ar/lenguaje-gramatica-generativa-evolucion-noam-chomsky
      Lo mejor que nos dio este proyecto fue la posibilidad de salir de nuestras areas chiquitas del conocimiento y empezar a leer absolutamente todo el día sobre cosas que nos desafían y se nos escapan. Hacer eso te da la posibilidad de conectar dos puntos aparentemente re lejanos que resultan ser parte de algo único y genial.
      Se está poniendo todo re extraño y hermoso.

    • Fernando Schapachnik

      Y los puntos de contacto no se acaban ahí. Las gramáticas de los lenguajes formales, tema con el que Chomsky tiene mucho que ver, también tienen forma de árbol (no esos de mentira de la sombra, los de verdad, como el AVL).

  13. Livi

    ¿Alguien más que sepa de esto, POR FAVOR? ¿Todos critican, todos entendieron toooodo, todos creen que fue demasiado elemental y que hasta un chico lo tiene resabido desde el jardín de infantes? Los odio.

  14. Luis Barrera

    Indudablemente una humanidad ávida por conocimiento, y, por ultimo, cuando esta lo alcanza, le otorga poder. Y algunos poderes están a la mano de todos. Como Googlear. Mucha razón tiene una canción de Cuarteto de nos cuando dice que “el mundo esta hecho por los insatisfechos”. La comparación de la tecnología, desde una perspectiva de ignorancia fantástica, a la magia, me recuerda como en la saga La Fundación de Isaac Asimov es ignorado el funcionamiento de los instrumentos altamente tecnológicos, y los que apenas pueden hacer uso de los instrumentos son sacerdotes adeptos a una religión, pero hasta estos mismos ignoran el funcionamiento de las maquinas. De acuerdo con que se enseñe en las escuelas ciencias computacionales o al menos una introducción a tema tan interesante

  15. Ana

    Excelente!!! Y se armó la discusión…. Para los que, como yo, somos totalmente neófitos en la materia (casi analfabeta tecnológica), toda esta información me nutre, me entusiasma para seguir leyendo sobre el tema y hasta me convence de que no es tan difícil poder acceder a este conocimiento.
    Entiendo la crítica de los que saben y esperan más, pero sugiero menos agresividad en algunos comentarios.
    Por mi parte, más allá de lo dicho, agrego que el párrafo final:
    “Aprender se trata de tomar ese capital humano que ya nos pertenecía aunque no lo supiéramos. Somos varios los que queremos que a los chicos argentinos se le enseñe Ciencias de la Computación en la escuela, para que vean, descubran y entiendan la magia buena detrás de la tecnología; para que transformen la limitación de no saber en el poder de conocer y así puedan disfrutar de un montón de ideas que les pertenecen, aunque aún no lo sepan.”, vale la pena todo el artículo.
    Muy buena la ilustración. Felicitaciones gatos, siguen eligiendo muy bien a los gatos invitados.

  16. Liber

    Me encantó el artículo!!! Si alguien me hubiera explicado AVL de esta manera en la facu, quizá no me hubiera aburrido tanto estudiándolo.
    Apoyo el comentario de Ana en cuanto a la agresividad de las críticas. Bajen cuatro cambios y subanse al tren de escribir para otro tipo de público, quizás así podamos lograr que sean más los “poderosos del saber”.
    Gracias por recordarme porqué estudié esto y porqué me fascina cada día mas.

    • MaríaC

      Totalmente de acuerdo con Liber, los gatos críticos son necesarios pero les hace falta relajarse y no tomársela tan en serio. Disfruté mucho la lectura de este blog que no es académico sino de divulgación, lo cual lo hace altamente accesible y entretenido para quienes no somos (ni queremos ser) expertos en el tema sino simplemente gatos consumidores de conocimiento interesante y novedoso. Felicitaciones a Fernando por compartir su expertise, lo del título es irrelevante (creo), y ya estamos esperando la segunda parte de este “destripamiento”.

  17. PapaSmurf

    Quiubo, ey felicidades antes que nada por el articulo; magnifica forma de volver didáctica y sencilla la comprensión de algo tan importante (aunque tal vez lo necesario sería que la juventud desarrollara un interés por temas críticos como el cyber, geopolítica internacional, etc. sin necesidad de presentarsela de manera divertida o simplificada, pero bueno eso es en definitiva otro tema y por lo mientras ensayos como el tuyo hacen la diferencia). Comparto muchisimo la idea de que debería arraigarse la informática en la educación básica, y felicidades de nuevo. Es solo una pregunta que me gustaría hacerte: Que opinas/sabes sobre los intentos recientes por parte de la legislación estadounidense por modificar los search engines para que en lugar de mostrar los resultados en orden de popularidad, los muestren a partir de una arbitrariamente sancionada “truthfulness”?

    • Fernando Schapachnik

      La verdad es que no conozco del tema, pero obviamente suena muy difícil. Se me ocurre que lo más parecido a la veracidad que se puede determinar online es la verosimilitud (es decir, que parezca cierto), que dista mucho de la veracidad. Existen formas de determinar “consenso”: es decir, si muchas páginas dicen algo, se determina que hay consenso sobre el tema. En temas de actualidad eso es problemático porque las noticias se replican las unas a otras sin ningún chequeo, como pasó hace unos meses con una noticia falsa de intento de asesinato a Obama que causó sacudones en las bolsas.

  18. Claudio

    Sigo aplaudiendo la idea de divulgación científica apta para todo público que viene llevando adelante. No me caen muy simpáticos los comentarios cuestionadores de aquellos que, (sospecho yo) sabiendo mucho más que lo lectores promedio pero bastante menos (sigo sospechando) que el autor de la nota, se vuelven cuestionadores y exigentes porque el título no satisface la expectativa generada por el título del post.
    Digo: si alguien es capaz de creer que se puede destripar Google con sólo 1.668 caractéres, tal vez crea también en lo que dice el Ing. Francisco Guitérrez aquí: https://www.youtube.com/watch?v=ws7OBiUgCro

  19. Juan Domandl

    ¡Genial! Muy interesante. Este año no sabía si estudiar Ing. en computación o derecho, me metí en la segunda: craso error. El que viene me voy intentar de meter en ciencias de la computación del FAMAF, este artículo me dio aún más ganas.

  20. Cristián Rizzi

    Me encantó el artículo!! Y el título también me pareció muy bueno. Leyendo los posts, para encantar a todos capaz se lo podría rebautizar “Comenzando a destripar a Google” y todos felices. Me encantaría leer la segunda parte (sobre PageRank) porque siempre me pareció interesante transparentar a la gente que las páginas que aparecen primero son las que la gente visita más. ¿Sería como una especie de reinvindicación de Palito Ortega de que millones de moscas no pueden estar equivocadas si comen caca?
    Excelente el laburo de Pablo, Fabricio y equipo del Gato, un placer leerlos. Y también es un gran trabajo el que viene desarrollando Fernando desde Fundación Sadosky por el tema programación en la escuela sobre el cual tengo mucha inquietud y algo de trabajo realizado. Un saludo para todos los lectores.

  21. Helena

    Si ya no era suficientemente copada la nota, el cierre me encantó. Coincido plenamente, no se si es miedo, comodidad o confusión, pero existe algo que bloquea a las personas y evita que sepan más, que le saquen lo turbio a eso que parece mágico, porque al conocimiento lo tenemos todos al alcance de un par de clicks.
    Memociono.


Publicar un nuevo comentario