Analisis-conicet

Jugada preparada

Siempre decimos que la ciencia es una linterna que ilumina la realidad. Eso implica pensar que apuntarle a un proceso y tratar de desentramarlo nos permite intentar entender lo subyacente, y esta es una de esas veces donde recoger, ordenar y presentar información puede contarnos una historia.

Esta es la historia de cómo Twitter se expresó respecto del recorte en CONICET, con lo bueno, lo malo y lo feo.

La posta de hacer visible este evento la tomaron Analia Celeste Luis (@Analiacl) y Yamila Abbas (@abbasyami), recogiendo los tweets que contenían referencias al CONICET, entre el 10 y el 21 de diciembre de 2016.

NOTA agregada 27/12 (13:17): Es importante remarcar que todo el análisis es válido para el evento particular, y que cualquier otro evento va a requerir un análisis particular (y tal vez hasta cruzarlo con otros eventos para encontrar patrones más grandes).

Para esto, usaron un script de Python sobre la api de Twitter que ellas mismas desarrollaron, bajaron un total de 156.000 interacciones de 29.000 usuarios, y después se coparon en compartir no sólo su análisis sino también los datos crudos (de la parte de redes, la parte de lenguaje natural nos escapa técnicamente), para que nosotros pudiéramos aportar en esa instancia.

El ‘52% de los usuarios se expresaron a favor’ viene de analizar lenguaje natural, con las limitaciones que eso tiene; pero dado que las limitaciones a priori son para ambos lados y que no tenemos forma automática de analizar esa cantidad de datos sin asumir un margen de error, lo vamos a tomar como ‘el mejor dato que tenemos al momento, que está sujeto a mejora, pero que está bueno’.

Vamos de lo general a lo particular

Puchito metodológico: Para determinar la postura de los usuarios en torno a los reclamos de la comunidad científica de CONICET, se utilizaron dos métodos principales: como primer paso o criterio tomamos una muestra del 50% de la base total de tweets y analizamos el texto con el programa SPSS Text, esto nos permite clasificar los términos más significativos de acuerdo a su tendencia: favorable o desfavorable en relación al reclamo. Cada contenido, tweet o retweet puede estar clasificado en más de una postura, definiéndose la predominante a partir de la suma de concurrencias. Como segundo criterio o método de clasificación, analizamos los usuarios más retweeteados y centrales asignándoles una postura. Esta categorización es manual, ya que no lleva mucho esfuerzo y permite tener un control más acabado de los contenidos cargados de ironía. Por ejemplo, podríamos presumir que un tweet que contiene el término “ñoqui” o “militantes” se encuentra más cerca de estar a favor del recorte en materia de ciencia y tecnología. Sin embargo, ese criterio no es suficiente, ya que  en gran parte de la conversación política predomina el sarcasmo.

Que una conversación de esa magnitud exista no es poco, porque por lo menos nos dice que decenas de miles de usuarios querían expresarse respecto del evento. No es menor ver que el 84% del peso de contenido vino de retweets y no de tweets escritos originalmente. Este dato por ahora parece irrelevante, pero tengámoslo en mente porque nos va a contar un poco de historia sobre la estructura y comportamiento de la red.

Pero recién estamos entrando en calor, porque hay data para hacer dulce de data.

Una de las cosas que más nos interesaba era entender cómo se organizaban las cuentas que empujaban esta conversación, así que lo primero fue descomponer la red de interacción en clusters (grupitos que dependen de la cantidad de menciones y retweets que relacionan a los usuarios entre ellos, y que nos terminan definiendo una especie de agrupación por afinidad). Cada nodo, entonces, es un usuario, y cada arco es un vínculo entre dos usuarios.

Puchito metodológico: Para analizar la existencia de clusters corrimos un análisis de modularidad en Gephi con distinta restrictividad, o sea que analizamos condiciones distintas donde los grupos se construyen de formas más o menos estrictas, lo que genera grupos más grandes o los subdivide en sus grupos internos.

Gracias a esa descomposición, pueden verse dos clusters bien definidos: por un lado, un cluster que en su mayoría se refiere negativamente a CONICET; por el otro, un grupo que en su mayoría se expresa en su defensa, y que critica el recorte en ciencia y técnica.

Los unos y los otros

Pero estas poblaciones no son idénticas en tamaño ni en estructura: una tiene usuarios clave bien definidos y de alto peso (lo que quiere decir que un puñado chico de cuentas se constituía como nodos centrales, o sea que mostraba gran potencia de amplificación), y la otra es una red más descentralizada, donde la distribución del peso en la conversación es más uniforme entre los usuarios.

Imagen detallada del cluster que se expresaba en promedio positivamente respecto de CONICET y sus usuarios clave, donde el tamaño del @ es proporcional al peso dentro de la red (la escala es válida para ambos gráficos).

 

Imagen más detallada del cluster que se expresaba en promedio negativamente respecto de CONICET y sus usuarios clave, donde el tamaño del @ es proporcional al peso dentro de la red (la escala es válida para ambos gráficos).

Esta diferencia de naturaleza en los dos grupos se ve mucho más clara cuando la ordenás en un gráfico con la distribución de los grados de entrada en las distintas comunidades.

Metodología: El grado de entrada sirve para entender cómo es la dinámica de interacción de los usuarios de cada comunidad; básicamente son las menciones y retuits entrantes que tienen los nodos de cada cluster.

En el eje de coordenadas podemos ver cómo los usuarios en favor de la comunidad científica se encuentran más cercanos al eje Y. Esto significa que hubo muchos más usuarios que no fueron retweeteados o no tuvieron menciones entrantes (recordemos el punto anterior sobre cómo la conversación fue dominada por los retweets y no por los tweets novedosos). Para ejemplificar un poco más en base al gráfico, hubo al menos 14 mil usuarios que tuvieron grado de entrada 0. Esto significa que expresaron su opinión activamente, sin aglutinarse en torno a un usuario central.

Por otro lado, en el cluster que se manifestó en favor del recorte se ven 7 burbujas que se alejan del eje Y superando el grado de entrada 1000. Esto significa que podemos ver que al menos 7 usuarios aglutinaron más de 1000 menciones o retuits, dando lugar a pensar que se trata de una comunidad jerarquizada, organizada a partir de líderes de opinión en su red. Qué cosa hermosa cuando los datos cuentan una historia.

No es menor notar también que los principales agentes del cluster neg-CONICET se muestran a sí mismos como oficialistas y anti-kirchneristas. Dentro del cluster contrario al recorte hay algunas cuentas fácilmente identificables como kirchneristas, pero estas cuentas no dominan el cluster entero, y esto no es menor. Si nos ponemos más finos con el agrupamiento (o sea, más restrictivos, y en vez de armar dos grupos grandes, armamos más), adentro de ese mismo grupo de expresión positiva respecto del CONICET (pero que, recordemos, se agrupó por su nivel de interacción interno, no por su forma de expresarse respecto del conflicto) hay varias poblaciones separadas: la recién mencionada, y una dominada por usuarios como @frazadadecactus@breogan66, @danyscht y @diegotajer, a la que no se la puede caracterizar políticamente de forma tan sencilla o unívoca (en el eje kirchnerista/antikirchnerista) [paréntesis agregado 28/12].

La misma, misma imagen detallada del cluster que se expresaba positivamente respecto del CONICET y sus usuarios clave, donde el @ es proporcional al peso dentro de la red, pero esta vez con un criterio de agrupamiento más restringido para poder ver comunidades dentro de la comunidad (la escala es válida para con los gráficos anteriores). Dentro del cluster de apoyo, identificamos dos poblaciones, cada una con sus referentes (verde y celeste).

Entonces, tenemos dos (o tres) poblaciones claras. Nuestro interés llegado ese punto fue evaluar el funcionamiento interno de cada una de las dos grandes poblaciones originales (neg/pos CONICET).

Para eso, empezamos por tratar de entender de qué habla cada grupo. Cuando el análisis se da sobre el cluster que se expresa negativamente respecto de CONICET, aparece esto:

Montonero Mufasa, RENUNCIE

Así se hacen claros los memes dominantes del cluster negativo, con mucha presencia de Mufasa, la NASA y Perón;  con las palabras ‘militantes’ y ‘ñoquis’ como calificativos preferidos y con un principal interés en atacar Sociales, principalmente Sociología de la Cultura, incluso a pesar de que el área de Sociales representa sólo un 20% del total de investigadores.

En la otra esquina, con un peso similar en llegada pero un perfil distinto en términos de forma de presentar la información, el cluster que en su mayoría se expresó a favor del CONICET (o en contra del recorte, como querramos decirle):

Este cluster se caracterizó además por replicar contenido informativo sobre el estado e intenciones de la toma e informes y cifras sobre CONICET y sus investigadores, contestando a los memes presentes en el primer grupo. Otro dato interesante fue, de nuevo, ver énfasis en componentes ideológicos más generales que el recorte en ciencia.

Pero todavía podemos hacer más para tratar de entender las diferencias y similitudes entre las poblaciones. Cuando visualizás la cinética de esta conversación en el tiempo, aparecen algunos patrones de lo más interesantes, como uno de actividad semanal, y un mínimo de proporción de tweets neg-CONICET durante los fines de semana. (emoji pensativo)

Los fines de semana, que labure otro

Dado que la conversación muestran este comportamiento tan diferente durante la semana, podemos empezar a pensar que ese patrón esconde algún tipo de característica distintiva entre las poblaciones (aunque bien podría ser simplemente simplemente que es fin de semana). Tercera idea a sostener, junto con el porcentaje de retweets y la estructura distintiva de ambas redes.

Algo que nos llamó mucho la atención es que muchos de los usuarios inmediatamente adyacentes a los centrales del cluster negativo tienden a no tener ningún tipo de identificación, estética o estilo personal discursivo que nos haga pensar que son personas expresando su opinión en redes. Exceptuando el caso del conocido ex periodista de Clarín @Bracesco, en la red de usuarios neg-CONICET abundan las cuentas con estética despersonalizada: caricaturas, fotos de bancos de datos y portadas en baja resolución(*). Podrán pensar “OK, yo tampoco tengo una estética que sea fácilmente identificable”, pero esto contrastó fuertemente con los usuarios de mayor centralidad en la red (NOTA sobre un comentario: este patrón también apareció en los adyacentes, no solamente en los centrales, pero está pendiente un análisis mucho mejor sobre esta comparación) que se manifestó en apoyo a la comunidad científica de CONICET. Los usuarios con mayor volumen de menciones y retweets en esta red fueron referentes académicos, investigadores y algunos portales digitales. El punto es que la opinión del cluster que apoya al CONICET suele estar más referenciada: sabemos quién nos habla y desde dónde.

(*)

Quiero ser un niño de verdad! NOTA 27/12, 13:25 @pablotorres es un mal ejemplo acá porque sí es un usuario real y bancamos que diga LO QUE QUIERA. Esto no quiere decir que no se encuentre (quiera o no) en una estructura que contiene cuentas que podrían no ser de personas reales).

De nuevo, esto no es análisis, es dato. Y es correlación, no causalidad. Porque correlación no implica causalidad. Correlación sí implica correlación. Muy tautológico todo.

Y esto ya sería un montón, pero hay otra posibilidad de amasar los datos y tratar de atacar una historia más. Muchos acusan la existencia de una estructura organizada de operadores, y otros consideran que eso es un mito, así que veamos si hay razones o no para pensar que esa idea de manipular la opinión pública usando cuentas que no responden a personas reales se sostiene o se debilita con datos. A lo que ya sabemos sobre la distribución jerárquica y centralizada de usuarios del cluster neg-CONICET y sobre su alta tasa de retweets sobre tweets originales, podemos sumarle el dato de que el clúster negativo tenía alto peso relativo de lunes a viernes y muy bajo los fines de semana, y podemos agregar un dato más: la fecha en la que esas cuentas fueron creadas.

Me viá abrir una cuenta en el Tuiter

Bueno.

Si bien esto no es una confirmación de que exista una actividad organizada para generar la amplificación de determinada información (en este caso en particular, opinión en contra de CONICET), sí es interesante y sí está bueno que tengamos en mente y a la vista este comportamiento y nos preguntemos qué modelos explican mejor esta acumulación de evidencia (y hasta qué medir para descartar hipótesis alternativas). Un gran paso siguiente podría ser ahondar minuciosamente en el comportamiento de cada una de estas cuentas (patrones como la tasa de tweets originales contra los retweets, un ejercicio divertido para cuentas como @gabrielluna007, @azulinamorena o @esthermdq, protagonistas del cluster neg-CONICET, que son básicamente cuentas de retweets sin generación de contenido propio pero al mismo tiempo con decenas de RTs diarios, lo que nos hace pensar en un sistema organizado de amplificación de contenido, o en usuarios reales muy entusiasmados con retweetear, pero nunca expresarse personalmente).

Nota 27/11: Hay un par de comentarios excelentes sobre explicaciones alternativas a estas conductas. Desde la idea de que es más fácil oponerse a las cosas en general desde lo anónimo y a favor desde lo personal a la ‘hipótesis oficinista’ de que los retuiteadores lo hacen durante su horario de trabajo normal y no lo hacen durante los fines de semana. Otra idea interesante es suprimir cualquier tipo de intuición de intención organizada y suponer que los comportamientos que asumimos automatizados no son parte de una estructura (formal o semi formal), sino de una población de usuarios reales que se expresan en tasas de decenas o centenas de RTs por día. Tal vez esta sea la hipótesis más desesperanzadora, pero no por eso menos válida o menos atendible de confirmar. Tendremos que buscar los métodos para abordarla.

Esto no significa que tengamos certezas. Desde ya que hay explicaciones alternativas al escenario organizado para la generación de opinión concertada. Hay escenarios de entusiasmados retweeteadores a los que no les copa poner su foto, que encima no opinan los fines de semana y que justo se dio que el día que abrieron la cuenta había habido un evento político relevante. Pero, al que le quepa el Bayes, que se lo ponga.

Toda esta información (y su análisis) debe ser vista con la cautela de quien presenta un preliminar y asumiendo buena voluntad y capacidad de refinar cada una de las estimaciones, pero al mismo tiempo como una señal extremadamente clara de cómo Twitter como soporte y medio no es ajeno a la posibilidad de ser analizado, entendido, expuesto y tal vez hasta manipulado para tomar ventaja de algunos de los sesgos más íntimos del humano: nuestra capacidad de acordar y dar por válida información que se solapa con lo que creemos (aun sin chequearla, ni a ella ni a sus emisores), nuestra tendencia a expedirnos con seguridad sobre áreas de las que no tenemos idea (sobreestimando nuestra capacidad de análisis y el ámbito en el que somos idóneos), y nuestra reticencia a admitir como válida evidencia que pueda ir en contra de las posturas que ya decidimos tomar.

Entonces, hablemos abiertamente de todos los temas que entendamos importantes. Hablemos del recorte. Hablemos del papel de la ciencia en la industria, la salud y la educación, de lo imprescindible de la ciencia básica, de lo igual de necesaria que es la aplicada, de cómo hacer ciencia para la sociedad plena, de cómo evaluar a nuestros científicos profesionales. Nada es perfecto ni sagrado, CONICET tampoco. Discutamos qué hace y cómo lo hace. Discutamos si necesita modificaciones y cuáles. Sobre todo y más allá de esa institución, hablemos de si existe una dirección pensada, estudiada y expresada abiertamente que muestre una visión sostenida y a largo plazo para el desarrollo de la ciencia, la tecnología y la educación. Pero no por discutir todo esto dejemos de hablar de cómo priorizamos la ciencia en el gran arco argumental de un plan país. Porque la charla de fondo a tener es esa: ciencia sí o no, y cuánto.

Precisamente por eso es que todas esas conversaciones tenemos que poder tenerlas hablando claro y hablando cada uno. Sabiendo que los que opinan son otros como nosotros, ciudadanos comunes, que fuimos habitando un medio que supuso en algún momento la posibilidad de democratizar el acceso a decir lo que pensamos; hasta que alguien se dió cuenta de que Twitter es un medio como cualquier otro, y que hecho el medio, hecha la rosca.

Aprendimos a leer los diarios como de quien vienen, a tratar de entender las intenciones por detrás. Quizás les toca ahora a las redes sociales ser observadas de manera de descubrir si hay piolines que hacen que las marionetas bailen, griten y retweeteen. Puede ser la única forma que tengamos de reclamar la posibilidad de discutir temas importantes sin que nadie sarpe la conversación gritando o usando humo y espejos para hacer que lo que piensa suene como rugido de masa, cuando en realidad es solamente eco.

 

NOTA 28/12: Cambiamos las nomenclaturas de los clústers a neg-CONICET y pos-CONICET para reflejar lo más unívocamente posible que la categorización se dió por ‘este grupo se expresó en promedio negativamente respecto de CONICET’ y ‘este grupo se expresó en promedio positivamente respecto de CONICET’.




Hay 261 comentarios

Añadir más
  1. Javier Martínez

    Los re banco y apoyo en muchas cosas. Hay un solo punto que no estoy muy a favor sobre este análisis. El tema de los usuarios de tweeter con actividad durante la semana. La mayoría de mis conocidos que utilizan es reducir social (aqui me incluyo a mi), son casi en su totalidad activos durante la semana y no por eso debo pensar que pueden ser bots. Y otra cosa, la mayoría no tweetea o lo hace escasamente. Habría que analizar en todo caso que la mayoría de las pequeñas cuentas no generan contenido en esta red. Que tengan un buen año locos lindos.

      • Javier Martínez

        Si, es real eso, pero supongo que los tweet stars, necesitan tweetear todo el tiempo. Bah, simplemente es lo que veo al utilizar esa red. Igualmente, muy buen análisis. Felicito a las involucradas

      • Agustin

        Podría tener que ver con la trascendencia que le den unos y otros a este tema en particular (CONICET)? Digo, que unos lo consideren realmente importante por lo que decidan dar su opinión personal; en cambio los otros, no le den tanta importancia así que “bah, solo voy a retwittear esto que dice alguien más”…
        Sólo por decir algo.

      • Julio Silvero

        Sorprende la actividad diferencial, pero también la hay los días 20 y 21 respecto a las opiniones positivas (baja a casi un tercio).

        • Pablo A. González

          Absolutamente, pero uno hace lo mejor que puede con los datos que tiene. Igual, re banco que busquemos la forma de hacer un mejor análisis.

        • Roca

          EL 19 empezó la toma del Ministerio de Ciencia y Tecnología, y con los días se fueron incorporando la toma de las distintas sedes de CONICET. Esto pudo haber generado menor actividad en los pro-conicet o mayor actividad en los pro-ajuste, pero no quiero pecar de confundir correlación con causalidad. Creo que estaría bueno comparar los valores absolutos como sugiere Julian en un comentario más abajo.

      • Tomás

        Un pequeño aporte que estaría bueno sería mostrar el número de tweets relevados en cada día para tener una idea como se producen las variaciones en valores absolutos también. Digo, para dejar en claro si es que se reduce tanto el número de tweets en contra y no es que los tweets a favor crecen considerablemente mientras que los negativos se mantienen “constantes”.
        Es solo una inquietud ya que cuando vi que ambos sumaban 100% (total de tweets muestreados en el día) me pregunté cuantos tweets fueron relevados cada día como para hacer una mejor comparación.
        Salvando eso me encantó el análisis.

        • Pablo A. González

          Es porque son % de sentiment positivo y negativo. Estamos ya mirando cómo ampliar y mejorar el análisis, así que sigan dando ideas que les estamos re dando pelota.

      • Mariano

        Capaz sea porque muchos de los que opinen sean gente vinculada de alguna forma (potencial o actual) al conicet, y opinen en contra del supuesto recorte desde el interes de su bolsillo, mientras que el resto de la gente que tiene que trabajar, en momentos de recreo en su trabajo, no tiene tanto tiempo como para revisar personalmente todas las propuestas de investigacion presentadas en el conicet para descubrir esas fantochadas sobre peliculas de disney y demas.

  2. Bruno Bianchi

    Excelente análisis…me da un poco de celos que venga de dos sociólogas y no de nuestro lado, gran laburo!!

    Una sóla cosa me queda picando…. Habría que comprar la cantidad de cuentas creadas en esas fechas (muerte de Kirchner y Debate) de una muestra al azar de usuarios… capaz es producto de un efecto interesante:la gente se crea cuentas para ciertos eventos.

    • Yamila

      Hola! Primero, gracias! Con respecto a la cantidad de fechas creadas es un patrón que pudimos ver que se repite en la mayor parte de los análisis en este tipo de operaciones. Lo mismo pasó cuando analizamos el ataque a Tinelli. (te dejo el link por aquí: https://twitter.com/Analiacl/status/758109261394223104)

      Efectivamente se crean cuentas por contexto e interés de de participar en la conversación de estos eventos, pero es llamativo como siempre estos paquetes de cuentas están tan activos y generan tanto contenido.

      Con respecto a la cantidad de cuentas creadas y la muestra al azar lo podemos hacer! Todo es mejorable y en cuanto tenga un rato lo podemos probar. Mil gracias por el aporte.

    • Elvio

      Un amigo le puso “me gusta” a un post en Facebook de un (para mi) desconocido, que copiaba a su vez el tweet de otro desconocido (lo que generó que se vea todo en mi muro), que decía algo asÍ: “El CONICET tiene 25000 empleados, la NASA 15000 y lo máximo que llegamos a lanzar es a Bergoglio al Vaticano.”. Eso generó una respuesta espontánea mía por lo mentiroso, tendencioso, malicioso y errado de la afirmación: compara instituciones de diferente carácter, el CONICET tiene 13000+ empleados (de los que 9000+ son investigadores, ver su sitio web), la NASA 17000+ más otros miles de contratados, somos uno de los únicos 7 países -más Europa- que lanzaron satélites, y la ofensa a Bergoglio es improcedente, etc, etc. Los descerebrados del que hizo el tweet, del que lo publicó en FB y de otros que aparecieron defendiendo lo indefendible, hizo que yo decidiera borrar mis respuestas, que con referencias y links bien fundados, derrumbaban sus argumentos. Luego decidí que no iba a seguir recibiendo insultos de fanáticos descerebrados, por lo cual borré todos mis comentarios. Además de los trolls rentados (con nuestro dinero) que han puesto para generar apoyo a medidas de gobierno criticables, hay un ejército de gente que repite y pone “likes” a cualquier cosa que suene divertida aunque sea funcional a las atrocidades del gobierno de turno.

      • Yamila

        Elvio, así es como funcionan las operaciones, no todos los “trolls” son rentados y lo más preocupante no es el troll en sí sino el impacto y la desinformación que generan.

        • Alcides Acevedo

          Decime Elvio ¿cuál es el presupuesto de la NASA y cuál el del CONICET (durante la gloriosa era K)?
          Ahí queda al denudo la mentira de la ciencia y técnica en Argentina.

          • Rodrigo Quiroga

            Deberías buscar esos datos y aportarlos vos si estás argumentando ” la mentira de la ciencia y técnica en Argentina”. Saludos!

          • Elvio

            La comparación es equivocada, mezcla “peras con bananas”. La NASA, National Aeronautics and Space Administration, se dedica justamente a eso, perteneciendo a la mayor potencia militar y tecnológica mundial. El CONICET, Consejo Nacional de Investigaciones Científicas y Técnicas, abarca todas las iniciativas de un estado “periférico” y en permanente crisis económica, y promueve con lo poco que tiene temas de ciencias duras pero también sociales. Y bastante que hacía con eso, generando un semillero de científicos reconocidos a nivel mundial.

          • Pablo

            El presupuesto de la NASA es 3500% más que el CONICET, contando lo que se paga a empresas terceras satélite (que suman otros 25.000 o más empleados). Sin contar que el CONICET supera ampliamente en publicaciones científicas (ya que la NASA no se dedica a eso, sino las universidades). Es comparar peras con manzanas. Pero para el cabeza de tacho es todo lo mismo.

          • Alcides Acevedo

            Claro Elvio ¿peras con manzanas? nada que ver. dólares con dólares o pesos si querés.

            Te explico: hacer ciencia en Argentina cuesta MAS CARO que en Estados Unidos, digo que cualquier equipamiento o insumo cuesta mucho más, compará el presupuesto del CONICET con el de cualquier institución de verdad en el primer mundo, veamos, el año 2016 el presupuesto del CONICET no llegó a los 600 millones de dólares, el presupuesto del MIT fue de casi 1400 millones en R&D:
            http://web.mit.edu/facts/financial.html

            ¿Cómo lo explicás?

          • Milton

            Hacer investigación en Argentina es, por supuesto, más barato que en MIT y las razones son muchas, en particular el hecho de que la mano de obra en los países centrales es mucho más cara. Pensá que la mano de obra es gasto fijo de cualquier trabajo (el equipo a veces es más barato en USA –hay veces en que no se cobran impuestos para importar ciertos equipamientos–, pero una vez que lo compraste ya está; el sueldo es mes a mes).
            Y no sólo eso, en USA también hay mucha más reglamentación y certificación, que demora bastante los procesos. No digo que sea malo, pero digo que encarece.
            De hecho, para bien o para mal, estos países mandan a hacer muchos estudios a países periféricos sólo por el tema de costos. (Y de que, en farmacología, la experimentación con humanos está menos legislada… hdp…)
            Igual, te lo digo por estar en MIT, todo parece mucho más brillante a lo lejos: incluso ahí hay problemas básicos con giladas como ascensores, Internet, etc.
            De cualquier modo no entiendo el comentario: parecieras decir que la “gloriosa era K” no lo fue, porque no se invirtió lo suficiente y en Argentina es más caro todo. O sea que lo que pedís es que se incremente la plata en CyT y no que se reduzca a la mitad como quiere el señor Presidente, ¿me equivoco?

      • Se que no te importa, pero...

        Lanzamos satèlites…???
        1) En Argentina no se lanzan satèlites, en una època se diseñaron y se envian a Guayana para el lanzamiento.
        2) El primer satèlite argentino fue el LUSAT 1 que se lanzo al espacio en 1990.
        3) El LUSAT 1 fue desarrollado integramente en Argentina, incluso su baliza y los equipos de transmisiòn y recepciòn.
        4) Los Arsat son estructuras que contienen transponders fabricados fuera del paìs.

        Dejen de sacar datos de wikipedia, donde tambien dicen que en Argentina se fabrican chip, confundiendo a las personas que no tienen idea o poco saben de electrònica.
        Un chip es un conjunto de semiconductores en un “chip” de silicio, y acà no se fabrican.

        • Elvio

          Se que no te..: 1- es correcto. Rusia y la UE lanzan desde Guayana (Francesa). Pero no invalida que ARSAT sea argentino. 2- En la década del 90 se desmanteló el proyecto de fabricar vectores por imposición de EEUU (temitas con Irán y relaciones carnales…). 3- Es impensable que todas las piezas y componentes se fabriquen localmente (al igual que para los autos). Lo que vale es quien tiene el manejo, funcionalidad y propiedad del satélite, y en eso en el mundo solo hay (o había) 7 países + la UE. Nada para despreciar.

  3. Julian

    Impresionante laburo y nota, felicitaciones.
    Me sigue haciendo ruido la figura “me tomo el finde”. ¿Existe alguna posibilidad de ver esa misma figura pero sin normalizar?
    Mi duda es si el nivel de “pro-ajuste” no es similar al de días anteriores en valor absoluto y lo que se ve ahi es en realidad que el nivel de actividad dispara antes para los pro-conicet que para los pro-ajuste.
    ¿Podemos mirarlo?

  4. Francisco

    Lisa y llana guerra de bots, en el blog de Fabio hace rato que viene hablando de este comportamiento en las redes.
    Gran analisis!

  5. Santiago

    La nota es muy buena y la visualización de datos es belleza.

    Dicho esto, creo que hay dos cosas: En el cluster “en-contra-de-todo” se menciona la cantidad de retweets vs contenido original. De ahí infiero: el oficinista es de retwittear, y el enojado más aún. El “comprometido” (con cualquier causa) es más de expresarse y en cualquier momento. Esto quizás se puede ver si el ratio rt/tw original varía los fines de semana.

    Por otro lado, el hater suele ser anónimo. Es más fácil romper todo si no ponés la cara. Y es más probable que quieras hacerte cargo de un mérito si estás argumentando bien. Ergo, creo que independientemente del hecho en discusión acá, siempre en el equipo de “Hype & Rage FC” juegan los anónimos y en “Deportivo Argumentativo” juegan los nombres con cara.

    No creo en los bots, pero que los hay los hay.

    • Cel

      Coincido, en parte.
      Cuando uno está en contra de algo, pero sin mucho argumento retuitea a lo loco, total “dice lo mismo que quiero decir, pero con más ironia” en cambio, cuando defendes una postura, con argumento, con convicción, podes retuitear, pero más que nada, querés expresarte.
      Lo de los usuarios es cierto. Se ponen nombres de fantasía e imágenes varias para poder bardear bajo el anonimato del @cosmefulanito. Pero no descarto a un grupo (en el que me incluyo) donde ponemos una foto cualquiera, el apodo (real, pero apodo al fin) por joder, pero haciendo un uso responsable

      Eso sólo

      Besos y muy buen post

      • Mario

        Argumentar en tuiter? A menos que hagas una ametralladora de tuits, y ni así. Habrá metralletas entre la data analizada? No veo otra manera seria de argumentar en tuiter que poner un título y un link donde se profundice.

  6. Franco

    Excelente! La verdad que está impecable e inmaculado. Si me pongo en el rol de ese referee pelotudo que no tiene nada para criticar pero por eso quiere inventar algo, me gustaría ver el gráfico del grado de entrada hecho como histograma. Si el tamaño de las barras para usuarios cerca de 0 grado de entrada ‘tapa’ esos 6 o 7 ‘outliers’ que se quiere destacar, quizás se podría intentar una escala logarítmica? Sólo ideas de hinchapelotas, como digo. Y por último, los datos crudos son abiertos y están disponibles? Saludos!

    • Pablo A. González

      Nosotros tuvimos acceso a los crudos, y las pibas son unas copadas y muy Open Data oriented, así que asumo que tarde o temprano lo van a ser, no estoy seguro de si quieren antes publicar, pero están leyendo los comentarios, así que tarde o temprano, te cuentan.

      • Pablo A. González

        De nuevo, es re buena idea. Cuando termine la avalancha de hoy vamos a agarrar todos los comentarios (que de hecho son extremadamente buenos en su gran mayoría) y ver cómo encaramos un análisis 2.0 sobre estos mismos datos.

        Gracias!

  7. Pablo Cardone

    Excelente trabajo, si la manipulación de datos con intencionalidad política no fuera una constante en nuestro país hasta sería de gran utilidad

    • Martin Casatti

      La manipulación de datos “con cualquier intencionalidad” es una constante “en cualquier país”. Y aún a pesar de eso, el acceso a los datos crudos es de gran utilidad porque permite saber cómo, quiénes y en qué dirección, se está manipulando.

  8. Alcides Acevedo

    Todo bien… pero cuando les ofrecieron empleos públicos remunerados (no se sabe bien haciendo qué) a los becarios que no consiguieron entrar a la carrera de “investigador” movían la cola como un caniche… analizar ese fenómeno me parece más interesante que el de las redes sociales.

    • Rodrigo Quiroga

      Es una broma? La votación fué 360 a 280 en la asamblea del MINCyT, y las asambleas del interior a excepción de La Plata rechazaron de manera unánime el “acuerdo”. Llegaron los trolls a elgatoylacaja también… :(

    • Juan

      Mucho troll. Nunca hablan ni de los datos ni de las verdades.
      Siempre se supo bien lo que harían. Desde las primeras propuestas que se acercaron. Investigar en las mismas áreas donde estaba su entrada del conicet. Obviamente, con el nivel de destrozo de la ciencia no es claro si lo van a poder hacer….

    • Marcelo

      Si te parece mejor hacer otro análisis sos más que bienvenido a hacerlo. Pero tu comentario es irrelevante al tema en cuestión y una apreciación personal que no le importa a nadie más que a vos. Entonces, si deseas una investigación que mantenga tu propio sesgo personal, realizala con datos reales. Este es un ámbito científico, no un tupper de ignorantes.

  9. Dieg@

    además de lo bueno de la nota, x el análisis, la data, la metodologia, etc. etc…. viendo que más leer, veo que metió primer puesto en lo más leído del MES… debut y top mes, vaya que movilizó la nota

  10. Sebastián

    Me parece raro ver a @danielcatalano_ entre los principales referentes del cluster que se expresó a favor del recorte en CyT… claramente está ubicado en la vereda opuesta.

    El resto del análisis me parece muy interesante.

  11. Christian

    Ahora sería interesante mezclar esto con otras “guerras binarias” (a favor/en contra) y ver si el cluster anti también forma parte de otros clusters de noticias, más si ideologicamente son clusters del mismo lado. Ejemplo: si el cluster anti-Conicet también pertenece (en porción significativa) al cluster anti-Tinelli, o pro-ajuste, o etc etc.

    Excelente nota, análisis, y también estética. Todo muy bien conjugado, felicitaciones!!

  12. Cel

    Los Banco! Mi Twitter tiene una cara de un Banco de datos (aguante ALF) y mi postura política es básicamente en contra de todo lo que polarice (de un lado y otro). Aún así, jamás estaría a favor del recorte. He leído cosas tremendas de un lado u otro, haciendo opinión política, sin saber de que hablaban. Pero a la hora de analizar, no encontré ninguno pro recorte con un argumento lógico. Hablan de ñoquis, de vagos, de militantes y no tienen ni puta idea de lo que es investigar. Piden mejor educación, pero sacar investigación…
    Aguante la Ciencia argentina. Sigamos investigando que no nos para nadie

  13. Mauro

    Espectacular nota! No sólo por el tema de análisis, sino por las explicaciones metodológicas y las reflexiones epistemológicas.

    Además me parece un claro ejemplo de modernidad (en sentido coloquial, no filosófico) en las ciencias sociales. Lograr que un retweeteador olímpico lea esta nota (providing he ain’t a troll) podría generar un doble efecto.

  14. Noe

    Que les puedo decir… “Son lo todo! Los amo!” [Desde mi ciudad y mi instituto no bajamos los brazos… no entró ninguno pero acá estamos con las patas en el barro!— No me van a robar el amor y la dedicación así me toque atender un super y ser investigadora los fines de semana… Pero vamos por lo justo!! y lo que nos merecemos!!—-]

  15. Facundo Landívar

    Excelente el análisis, súper completo. No coincido en muchas cosas, pero eso no implica la gran altura con la que está hecho. Sí, si me permiten, me parece que no está exactamente igual valorizado el tema de las identidades difusas, o como dicen, “Exceptuando el caso del conocido ex periodista de Clarín @Bracesco, en la red de usuarios anti-CONICET abundan las cuentas con estética despersonalizada: caricaturas, fotos de bancos de datos y portadas en baja resolución”. Del lado pro-Conicet, para simplificar categorías, hay cuentas como frazadadecactus y varias así de pesos también importante. Pero, de nuevo, es apenas un dato, todo lo demás impecable. Gracias.

    • Rodrigo Quiroga

      frazadadecactus es despersonalizada, pero genera contenido propio constantemente, cosa que no ocurre con las cuentas anti-CONICET. Saludos

    • Sol Minoldo

      Facundo, “predominan” habla del caso mas frecuente, que marca una tendencia, no significa que explique el total de los casos. Eso, en el caso del lado pro-conicet, significará que la mayor parte (no el total) de los usuarios identificados allí corresponderán a cuentas no despersonalizadas. por tanto mencionar un caso puntual que no condice la tendencia no prueba nada. Es anecdótico. Lo importante es el análisis masivo. Saludos

    • Facundo

      Acabás de decir una burrada, Mr. bugman o Macoco generan todo el tiempo contenido propio. Si vas a opinar lee antes y que no te ciegue la ideología. No sirve usar una vara para un grupo y otra para el otro. Gracias.

      • no traje dni

        Que parte de la palabra “predominan” no entendes facundo? (no digo que seas el primer facundo, pero es claro que no entendiste la respuesta de sol minoldo). Un caso no hace al universo. El tomar la parte por el todo se le dice sinécdoque.

  16. Julieta

    Excelente nota, súper clara. Los gráficos de los términos más usados por cada cluster son sensacionales (#Montonero Mufasa, renuncie ♥♥♥)
    1. Los quiero un montón.
    2. Un comentario: en el gráfico de “las comunidades dentro de la comunidad a favor del CONICET”, utilizan el verde para los kirchneristas (me parece, no estoy 100% segura) y azul para los “no fácilmente identificables”. Me parece que, dado que el resto de los colores elegidos tiene clara asociación política (amarillo -> PRO), estaría bueno que los kirchneristas sean identificados con el azul, ¿no? Me pasó que, sin leer los usuarios dentro de cada grupo, asocié el azul con los K y el verde con los “no fácilmente identificables”.
    Un saludo, la radio está buenísima.

      • Julieta

        Mi problema no es que alineen o no, la verdad eso me da igual. Pero me parece que si algunos colores están alineados, entonces deberían estarlo en todos los gráficos. Y si no, todos colores arbitrarios y listo.

  17. Christian

    Excelente nota, como siempre, estúpidos y sensuales Gatos encajetados.
    Además gane algunas cuentas a las que seguir y algunas otras a las que trollear, de troll, ojo.

  18. Nando

    Seria interesante laburar con los datos para ver si es posible crear categorías de usuarios mas generalizables a otros mensajes… Incluso, usando términos sociales, se podría ver si los usuarios haters opinan siempre igual en cuanto a lineamiento político o si solo quieren ver arder el mundo

  19. BlogueroConnor

    hay alguna manera de entrando con el user de twitter pueda ver donde estoy en los graficos estos?
    Por otro lado, los que cuestionamos ñoquis y las investigaciones de Arjona y Billiken no estamos necesariamente contra de la ciencia, sino contra el malgasto de recursos. No tengo objeciones en q se investiguen transgenicos, enfermedades, ciencia básica, etc, pero no encuentro la utilidad de investigar letras de Arjona, quizas la tenga y no la sé.

    • Rodrigo Quiroga

      Entender que las letras de cantantes populares estén escondiendo mensajes constantes de misoginia y machismo me parece importantísimo. Podés disentir, pero hay que tener en claro que todo pasa por las comisiones evaluadoras correspondientes con expertos en el campo correspondiente, si algo se investigó es porque se aprobó en comisiones.

      • Rodrigo Quiroga

        Lo mismo para lo del Rey León. Lo leíste al artículo completo o sólo el título? A mi me parece fundamental que se investiguen estas cosas, después nuestras hijas juegan a ser princesas, a ser superiores, frívolas y superficiales, y no sabemos porqué!

        Más allá de eso, hay que darse cuenta que acá el tema no era criticar a esos investigadores en particular sino a difamar a CONICET y todo lo que conlleva, preparando el terreno para un ajuste aún mayor el año que viene.

        • BlogueroConnor

          Hola, gracias por la aclaración. No estoy a favor de ajustar en CyT habiendo tantas otras areas donde se podria ajustar.
          Tambien aclaro que en algunos casos no me quedé con los titulos y lei el paper de por ej el de la musica villera y las clases (se llamaba “Las manos de todos los negros, arriba”: Género, etnia y clase en la cumbia argentina”) y sinceramente no pude ver que aportaba a los que financiamos ese trabajo.
          Creo que esto ha servido para que la sociedad sepa que se hace con su dinero y creo que todos deben dar mas explicaciones que los papers que están bien, pero están escrito para pares, falta mas difusión del tipo masivo (para no especialistas)

          • Rodrigo Quiroga

            Yo no creo que la sociedad sepa ni mas ni mejor que antes que se investiga en CONICET. Son ejemplos puntuales de los miles y miles de trabajos generados en CONICET. Adicionalmente, una minoría de los que mencionas son publicaciones (papers). La mayoría son artículos y ponencias. Coincido en que los científicos deben hacer más extensión y divulgación de su trabajo. Justamente en la Facultad de Ciencias Quimicas de la UNC estamos preparando un proyecto de charlas en secundarios. Creo que eso es lo único para que sirvió todo esto, para demostrarnos que necesitamos divulgar más, y para eso esta elgato! Saludos!

          • viriviri

            Ciencia pedorra se hace en todos lados. Alguna incluso se publica en revistas de high impact factor.

    • Marquitos Peña

      Pensa que por ejemplo analizar Billiken (una revista que leyeron generaciones y generaciones de chicos argentinos) te permite tener informacion para intentar ver si hay una relación entre el grupo de “lectores de billiken” y el grupo “compro todo lo que dice la revista Para Ti”, dado que es inferible que al responder a una linea editorial madre, se empiecen a lavar cerebros desde chiquito para que consumas y votes de acuerdo a un interes privado particular. Uno nunca sabe adonde terminan las cosas. Lo de Arjona no lo sé, ni tampoco sé que grado de veracidad tiene, pero seguramente el que esté trabajando en eso te lo pueda explicar muchisimo mejor.

      Saludos

      • Manuel

        Hola, en primer lugar el desconocimiento es tan grande que leí en varios lugares lo de Spataro descrito como “estudia letras de Arjona” cosa que, de llegar a hacerse, sería un análisis estético y le correspondería a Filosofía y Letras, no a Sociales. Segundo punto, no analiza “las canciones de Arjona” sino las comunidades de mujeres en torno a clubes de fans, páginas de Facebook, foros virtuales, y los lazos solidarios que existen entre las consumidoras de este tipo de música, cómo viven distintas situaciones de subalternidad y qué tipo de representaciones construyen sobre sí mismas. Es un trabajo extenso porque la autora es doctora en Cs Sociales y no es a lo único que se dedicó. Decir que Spataro “estudia las letras de Arjona” es el colmo de la sinécdoque, además de ser un disparate. Y si alguien le objeta la necesidad de su análisis o piensa que no es útil, o que no va a servir para nada, pregunto ¿cómo generamos conocimiento por ejemplo sobre las mujeres víctimas de la violencia de género -la cuestión de género es un punto importantísimo en toda la obra de Spataro- cómo diseñamos e implementamos estrategias para ayudar a las mujeres golpeadas, cómo juzgamos y analizamos si lo que se está haciendo desde los organismos públicos está dando resultados o no?
        Como muestra basta un botón: muchas investigaciones en el campo afirman que las mujeres víctimas de violencia doméstica no acuden a la policía ni hacen la denuncia. Pero hay otros lugares donde sí hablan. En Estados Unidos por ejemplo se relevó que las peluquerías y los salones de belleza eran considerados “safe place” o lugares seguros donde las mujeres golpeadas por sus maridos buscaban confidentes para su problema; y se inició un programa con la Asociación de Peluqueros para capacitar a los estilistas sobre cómo aconsejar correctamente a una clienta que sea víctima de la violencia doméstica. Tuvo éxito y ahora lo van a implementar en Inglaterra también. A lo que voy con esto es que el conocimiento en ciencias sociales es necesario!! Si sos un Estado sin conocimiento alguno sobre el objeto de tus políticas públicas, no podés pensar en acciones que resulten eficaces. Y las políticas sociales igualitarias, democráticas y eficaces son importantísimas para mejorar la calidad de vida de miles de ciudadanos. Sin conocimiento sobre la sociedad en que vivimos, “las políticas públicas” se reducen a cartelitos bien intencionados colgados en el corcho de un edificio público.

      • Rodrigo Quiroga

        Hola Marquitos! Decir que Spataro estudia las letras de Arjona es como decir que Newton estudiaba la caída de manzanas de los árboles. Saludos!

    • Martin Casatti

      Coincido en parte con lo que te contesta Rodrigo, más abajo. A mi no me molesta que se investigue Billiken o Arjona siempre que en el contexto de todas las investigaciones en curso tenga un proporción razonable. Si vos me decís que un país con crisis de infraestructura física, edilicia y energética, le dedica el 20% de los recursos de investigación a las letras de Arjona te puedo decir que tu intensión quizá sea buena pero tus prioridades evidentemente no están alineadas con las necesidades de la gente.

    • Ana

      ¿Alguna propuesta para las ciencias Sociales, Artes, Humanidades, Educación? ¿O eso también sería, en tu opinión, un malgasto de recursos?

      • Martin Casatti

        Algún estudio de Conicet que busque establecer las proporciones de investigadores en cada categoría de acuerdo a los planes estratégicos a 50 años elaborados por los últimos tres gobiernos electos ? Digo. Estoy tirando una idea nomás.
        Si te fijás en los últimos datos tenes, por ejemplo, un 22.1% en Ciencias Sociales y Humanidades y un 3.2% en Tecnología. Yo trabajo en el segundo ámbito desde hace 20 años. A que no sabés qué es lo que empresas, organismos públicos, universidades, ONG vienen chillando desde hace al menos 10 que no hay? Sip. Investigadores en el área Tecnológica. Obviamente hay una necesidad que no está reflejada en la estructura actual.
        Repito. Nuevamente. No digo que NO HAYA QUE INVESTIGAR ESOS TEMAS, sino que hay proporciones que están evidentemente desactualizadas.

        • Rodrigo Quiroga

          Martín tené en cuenta que las Cs sociales apuntan a resolver de manera directa y pronta los problemas más acuciantes de nuestra sociedad. Desde pobreza, desmontes, adicción, etc. No menosprecio a la Tecnología como campo, digo que es muy difícil argumentar “estudiamos demasiado las cs sociales”. Por otro lado, el 22% es muy similar a lo que hay en otros países. En Noruega (país más desarrollado del mundo según el Índice de Desarrollo Humano), tal cifra es del 25% y en España del 26%, por debajo de México (por encima del 30%) y por encima de países de altísima industrialización como Japón (en torno al 10%)

        • Sol Minoldo

          Martín:

          – Te sorprendería la cantidad de otros temas relevantes socialmente que estudia el área de sociales, ademas de los estudios de sociología de la cultura. En ese 22% de personal de Conicet (no olvidemos que el sistema cientifico público excede a Conicet) tenemos científicos de Derecho, Cs. Políticas y Relaciones Internacionales; Filología, Lingüística y Literatura; Filosofía, Psicología y Ciencias de la Educación; Historia, Antropología y Geografía; Sociología y Demografía; Economía, Cs. de la Gestión y de la Administración Pública.

          – El porcentaje que observas para sociales es el resultado de un sistema orientado a dar, a todas las grandes áreas temáticas, una participación similar. En cambio, el porcentaje que observás para tecnología es el resultado de un déficit en la oferta, es decir, es el máximo nivel que se ha podido dedicar a esa área, por falta de interesados calificados. No se debe, en definitiva, a que otras áreas (y para nada el área de sociales en particular) acaparen la participación.
          A qué me refiero? En las convocatorias de becas e ingresos a carrera, la cantidad de postulantes en esa área son pocos, y aplicando mínimos requerimientos de excelencia para ingresar al sistema, apenas llega a cubrirse ese porcentaje. Basta observar la relación entre postulantes e ingresos del área de tecnología ara detectar que hay un problema allí.

        • Paola

          Martín, hay que tener en cuenta también en esa estadística que muchas de las investigaciones en tecnología terminan bajo otra área (Ciencias Agrarias, Ciencias de la Salud, etc.) y se pierden en el análisis de proporciones.

    • Agustín

      “Por otro lado, los que cuestionamos ñoquis y las investigaciones de Arjona y Billiken no estamos necesariamente contra de la ciencia, sino contra el malgasto de recursos. No tengo objeciones en q se investiguen transgenicos, enfermedades, ciencia básica, etc, pero no encuentro la utilidad de investigar letras de Arjona, quizas la tenga y no la sé”.

      Iba a comentar algo similar pero me ahorraste el trabajo, por lo que “retweeteo”, ja!
      PD: no somos bots.

      • Roca

        Agustín, ya que no sos un bot te pregunto, leíste la catarata de respuestas al comentario que estás “retweeteando”? Leíste el resto de los comentarios? Sos el claro ejemplo de los usuarios de redes sociales que critica el artículo y muchos de los comentarios, loro repetidor sin contenido (ni crítica, ni pensamiento) propio.

  20. JAVIER

    Excelente! Eso pasa cuando te pones a criticar a un par ñoños del Conicet y te hacen un pseudo-paper al respecto.

    Igualmente lo que más me preocupa no son las cuentas retwitteadoras, sino aquellas personas que uno conoce y repiten lo que dicen esas cuentas “son todos ladris”, “son ñoquis”, “son de la campora”.. como si un ñoqui K pudiera hacer un doctorado, un post-doc, y luego ser aprobado por un comité de expertos para entrar a carrera. Y si es así que haya más ñoquis K que transformen la vida a través de la Ciencia.

    Habría que analizar porque gente común y pensante llega al punto de sesgamiento de repetir lo que dice un troll.

  21. Lucas Ramirez Giribaldi

    Desde hace tiempo la verdad, como algo sólido, sustentado sobre la base de pruebas fehacientes y argumentos razonables dejo de ser algo de valor, hoy en día se busca el “golpe de efecto”, arrojar una mentira al mar de la opinión pública y que eso genere olas de desinformación para confundir al ciudadano promedio. Me recuerda a los reglas de la comunicación planteadas por Goebbels, muy buen trabajo, los felicito.

  22. juliocesar

    A mi juicio, si no se comprende el proceso de construcción de conocimiento institucional la crítica a los temas y problemas de investigación es apresurada. Luego, es posible hasta criticar la propia construcción del conocimiento institucional en la Argentina, e incluso analizar cuánto de la lejanía o rechazo que sienten muchos sobre algunos temas de investigación son responsabilidad del CONICET y demás organismos de CyT. Incluso, con ese criterio incompleto, nos podríamos preguntar a quién le puede interesar lo que la gente intercambia en Twitter, y quedarnos sin admirar este atractivo trabajo.

  23. derfaq

    mmm, correlación no es causalidad ya lo dicen en el informe, no veo como llegan al titulo. La dinámica del retwit es muy común en twitter.
    Otra tema que no me parece bien que en el informe pongan los usuarios originales, lo primero que hice fue entrar a una cuenta de un usuario pro, se están muriendo de risa, es como confirmar su teoría.
    Y usar amarillo y azul, como negativo y positivo… nada, el gráfico quedó lindo igual.

  24. Matias

    No creo haber leído críticas al CONICET en sí, sino usuarios que criticaron que se destinen fondos a algún tipo de investigación en particular (rey león, rock chabon, etc).
    Referir como “usuarios contra el CONICET” (tal la expresión usada en los gráficos) a aquellas cuentas que criticaron becas para investigaciones que creyeron innecesarias, es una conclusión falsa.
    Me parece que en este sentido el estudio es sesgado y tendiente a desacreditar sin fundamentos de fondo las expresiones de algunos usuarios al respecto.

    • Sol Minoldo

      Decir que en el Conicet hay ñoquis, ladrones, chantas y militantes es atacar a Conicet, desacreditarlo. No hay sesgo ahi: decir que esos twits son contra Conicet no es una interpretación sino una descripción. Sumemos que esos ataques se realizaron precisamente en el contexto de la discusión por un ajuste en la institución, y ya no quedan dudas de cuál es el objeto de ataque.
      Que menciones al rey Leon o las letras de Arjona, es solo el arma que usas, pero el ataque no se reduce a eso. Habiendo ataques a decenas de investigaciones, en un mismo momento y contexto, y de manera simultánea por parte de los mismos usuarios, es evidente que esos ataques no están aislados entre sí. y ¿Qué es lo que une a todos ellos? La institución que los enmarca, es decir, el Conicet. La crítica a todos ellos es el “despilfarro de recursos” y de manera para nada casual, eso alude directamente al debate sobre el ajuste, que es justamente sobre la asignación de recursos a Conicet.

      • Fabio

        eso es absolutamente falso

        si yo digo “Gallardo es un desastre” no estoy hablando en contra de River (uso un ejemplo por el absurdo, aguante Gallardo, ejem)
        Uno puede tranquilamente atacar UNA cosa en particular de un sistema enorme, el concepto de “si atacan a la institución atacan a todos” es típico de la militarización, o la iglesia y hasta la mafia, no del CONICET, un ente que debería estar alejado de ese criterio y ser más abierto.

        Uno puede tranquilamente criticar una falla, o lo que interpreta como tal, sin por eso estar en contra de todo el CONICET, interpretar lo contrario es FORZAR una interpretación para así invalidar al interlocutor “si llegás a opinar que algo de las mil cosas que hago está mal, estás en mi contra”, falta terminarlo con un grito propio de una religión y detonar dinamita. No.

        • Sol Minoldo

          Como te expliqué, no atacaron a uno, atacaron a un conjunto que en común tenia al Conicet. Y se hizo en un contexto determinado. Y se hablaba puntualmente de Conicet. Quienes atacaban a todos desde la acrítica a algunos eran los protagonistas del ataque.

        • MARIA

          Claro. Pero acá se está hablando de formar opinión pública. El que arrancó buscando ejemplos de investigaciones supuestamente “desacreditables” no lo hizo de re buena onda diciendo: “CONICET es genial, que cagada el recorte, yo solo estoy en contra de estas investigaciones puntuales”. No. Se hizo en el contexto de lucha contra el recorte y fue dirigido a desacreditar al conjunto de investigadores que defendían la entrada de 500 investigadores. Dentro de los cuales estaban incluidos esas personas particulares.
          Así que, siguiendo tu ejemplo, es como si alguien desacreditara a Gallardo y aprovechara esta situación de vulnerabilidad frente a la opinión pública de un sujeto particular para pegarle a River en su conjunto.
          El análisis VALE. Y mucho. Obvio que es preliminar y ellos mismo te están diciendo que le falta bocha de laburo. Pero evidencia mecanimos sutiles (y no tanto) que hasta el momento podían haber sido un mito urbano….

      • Martin Casatti

        Decir que en el Conicet hay ñoquis, ladrones, chantas y militantes no es atacar al Conicet. En tus propias palabras es describir un hecho. En la iglesia de mi pueblo también hay estos ejemplares. Al igual que en cualquier institución humana.
        Si no podemos establecer la diferencia entre criticar ciertos aspectos de una realidad y criticar la totalidad de la misma, entonces nuestra capacidad de discernimiento está renga. Si hay que aceptar un todo, para no correr el riesgo de criticar una parte, estamos fomentando el mismo pensamiento dicotómico que se ve en las gráficas.
        De esta manera nos convertimos en arquitectos y analistas de la misma dicotomía que luego nos sorprende y que tan sesudamente analizamos.

        • Diego

          Si lo decís en un contexto en el que se discute un recorte al Conicet y que claramente fortalece la postura pro-ajuste al tomar muchos de sus argumentos justificatorios, ¿no es ir en contra del Conicet?

        • Matias

          No te gastes. No hay intención de llegar a una conclusión verdadera. Solo es un de los lados de la grieta usando argumentos falaces (al igual que los del otro lado) en apoyatura a su postura política.
          Nadie tiene intención de alcanzar un verdad, solo tirar agua para su molino.

        • Tomás

          Yo creo que el objetivo aquí es determinar los procesos a través de los cuales determinadas informaciones circulan y se reproducen.
          Por otro lado, del mismo modo que durante el kirchnerismo muchos optaban por no pegarle por izquierda, hoy no parece buena estrategia señalar problemáticas particulares (Billiken, Arjona, aún ñoquis ladrones chantas y militantes) ante semejante recorte si no es la intención apoyarlo…
          No digo que la discusión sobre esos tópicos no deba darse de todos modos. Pero atendiendo a la dinámica de los procesos aquí expuestos, quizás tendría que darse más seriamente y en otro lado que no sea Twitter.

  25. Agustín

    genial el trabajo muchachxs. tremenda relevancia política y un gran trabajo analítico. encima de todo lo hacen entretenido. unos genixs.
    cómo antropólogo les digo que al leerlo, por un momento (solo por un momento) me dieron ganas de dejar la entongrafia y agarrar el spss.
    por suerte ya se me pasó. :p
    felicitaciones!

  26. Gonzalo

    Excelente trabajo, lo que me permito marcar es que existe un sesgo desde la construcción del relato donde se pretende evidenciar que los usuarios más activos son los de color celeste, quizás pretendiendo que fuera observado como Argentina, cuando implícitamente es el color asociado al FPV; mientras que el en otro extremo se encuentran los usuarios PRO (en vez de pro recorte) Recorte. Respecto de que la actividad de cluster pro CONICET (cuando nunca estuvo en discusión la existencia del mismo) y la del PRO recorte al CONICET (es decir becas destinadas a quienes desearan ser parte del mismo), puede tomarse de dos maneras (o más si quieren); durante la semana laboral el cluster PRO Recorte ocupa su tiempo en otras cosas además de tuitear a favor o en contra, por lo que durante el fin de semana tienen menor actividad en Twitter y a la inversa.
    La existencia o no de un centro de difusión de contenidos (mal denominado call center (dado que no se trata de un centro de atención telefónica) es equivalente a la existencia o no de la propaladora en la Casa Rosada durante el kirchnerato.
    Insisto, me parece un excelente trabajo el realizado, el cual sería excelente de haber pretendido la búsqueda de la verdad en vez de pretender demostrar quién la tiene.
    Saludos
    @gbases

    • Pablo A. González

      Ojo, Gonzalo. Los colores devinieron de la forma en la que los usuarios de ese grupo se definen a sí mismos regularmente.

      La existencia de cualquier cosa es equivalente a la de cualquier otra cosa, y a ese cualquier cosa se le aporta evidencia que justifica o no la hipótesis original de existencia, en eso estamos de acuerdo.

    • marina

      No creo que demuestre quién tiene la verdad, o la búsqueda de la verdad,sino más bien, es una aproximación para analizar cómo , en base a un hecho como el recorte del Conicet, dos bandos se perfilan como “influencers” , y los demás forman una red alrededor de ellos. Mucha gente de twitter que,como vos, se dedica al marketing,mataría por tener éstos análisis o comprender cómo es la dinámica para hacer que la gente crea en algo y los publicite sin hacer demasidao anáisis de porqué lo hace :).

  27. Gonzalo

    Fe de erratas: Donde dice: “Insisto, me parece un excelente trabajo el realizado, el cual sería excelente de haber … ” léase “Insisto, me parece un gran trabajo el realizado, el cual sería excelente de haber…”
    Saludos,
    @gbases

  28. Troll del Litoral

    Genial todo como siempre, gracias!!! Una duda ¿Cómo se que las cuentas no se crearon todas el mismo día porque son gente interesada en la política y Twitter les pareció un buen lugar para opinar? Ya se que puede ser medio obvio que son call centers de trolls creados esos días, peeero ya saben lo detestable que resulta el sentido común en ciencia.

    • Pablo A. González

      Primero, ya pasó en otros eventos. Igual, ya estamos avanzando sobre datos normalizados. Es un comentario super válido y lo vamos a estar atendiendo.

      • Santiago

        Creo que para notar algo raro debería testearse otras polarizaciones. Es normal que un troll se desarrolle durante un “evento trolleable”. Quiero decir, cuentas curtiendo a Central por perder la tercer final consecutiva aparecieron después de la final. Y otras cuentas que trollearon ahí deben haber aparecido cuando perdieron la semifinal de libertadores, o el último clásico. Ese comportamiento es el esperado en un meme (en el sentido de memética, no de Bad Luck Brian), se replica entre usuarios sin mucha racionalidad (no se enojen los de Central, que tuvieron bastante para bardear a Newell’s). Las respuestas a tal meme no son meméticas.

        En el contexto de este caso, sería interesante medir qué sucedió durante “Panamá Papers” y no creo que los resultados difieran mucho de esto: Los defensores siendo más constantes en su defensa, los “atacantes” explotando y retwitteando sin “agregar” mucho al debate.

        Las cuentas truchas, que seguro que hay, para mí se compensan entre “bandos”, sobre todo bandos tan parejos. Pero creo que sirven para catalizar ataques, no defensas, por lo que no se exponen simultáneamente

  29. Maxi

    Excelente trabajo y el detalle de como llegaron a los resultados, ¡felicitaciones!.
    Estaría bueno que alguien haga un resumen de dos párrafos empleando solo las palabras que la gente usa en charlas de café, así esto lo puede entender las personas que están en contra del Conicet… aunque capaz sea más fácil convencer a los bots.

  30. Fabio

    Tengo un par de problemas con las conclusiones, no se me mal interprete, vivo haciendo análisis de bots y scripts para detectarlos hace rato y las características comunes de éstos varían año tras año en base a los métodos utilizados para ofuscar su existencia (sobran).
    El usuario con avatar “nada que ver” y que tuitea poco salvo un tema específico no es necesariamente ni bot ni “troll pago”, muchas veces es gente descerebrada, natural, real, con pocas luces, pero que existe.
    Este problema de detección lo tuve en cada informe que tuve que armar, es difícil porque mucha gente es tan… limitada, que tuitea como un bot, hasta a veces más mecánicamente (ej: el universo fandom es un gran ejemplo).

    Por otra parte el hecho de que esten encolumnados detrás de una cantidad limitada de “referentes” tampoco implica automatización, en tal caso puede diferenciar a ambos grupos en cómo es su composición, pero no puede interpretarse directamente como automatización. Podríamos suponer que quienes le dan RT a un “acusador” (véase el caso de Bracesco) no saben un cuerno del tema en cuestión y aplican más a público limitado que quiere gritar que a un bot. El mejor ejemplo es la enorme difusión de las fake news en Facebook. No generan contenido, no generan opinión, replican lo que vieron, replicadores de “titulares”.

    Otra cosa que no me cierra es interpretar que un usuario con avatar falso es necesariamente un usuario falso. Es una falacia verlo así, en tal caso podemos asumir que cuanto mayor es la percepción de anonimato más barbaridades se dicen, sobran estudios al respecto, ni hace falta ponerse a citarlos, pero me explico, no?

    Por otra parte, y esto por ahí es porque no entiendo del todo del tema metodológico, es la falta de matices. Se divide a la población en dos grupos mutuamente excluyentes, A favor, en Contra. En mi timeline vi poco de esos absolutos, vi una opinión matizada entre “todo esto me gusta, todo esto me parece una mierda, todo esto no tengo idea”, y sí puedo hablar (mi información es meramente anecdótica pero sirve para encontrar este punto intermedio) de una gran opinión en contra de los estudios “sociales” como los de alguna banda de rock o arjona partiendo del prejuicio que muchas veces comparto de no considerar esos estudios “ciencia”, pero insisto, es prejuicio. Ese 23% (no es 20, en la web del conicet llega al 23) es suficiente cantidad como para que la masa que no se molesta en leer más allá del título considere que un cuarto del dinero se tira en boludeces.

    Pero ¿y el 75%? Bueno, analizar a los pro como “acepto todo, no critico nada” y los contra como “contradigo todo, no me gusta nada” es un error desde la base, excluye las opiniones (masivas) en el medio.

    Sumo también mis dudas sobre el análisis del lenguaje positivo-negativo de las expresiones en twitter ya que no conozco uno que la pegue cuando se usan ironías o bolubromas, siempre falla todo :P

    • Pablo A. González

      Ojo a una cosa principal de tu argumento. No hablamos necesariamente ni de bot ni de troll pago, hablamos de las diferentes estructuras que se generan en dos sbpoblaciones con comportamientos distintos. Es más, hasta te preguntaría cómo atacarías ese dataset para tratar de extraer todavía más información sobre usuarios automatizados, etc.

      Igual, amamos los comentarios porque nos muestran para dónde seguir adelante.

      • Fabio

        No es fácil identificar el boteo, en la charla que di en Campusparty ejemplifiqué usando chatbots para simular “comportamiento vagamente humano” y funciona. Y eso que ni me puse a implementar un chatbot cognitivo como el de IBM o el de Google (no tenía tiempo, implementé uno basado en YAML)

        No tenés forma, por el tipo de red social que es, de filtrar correctamente un buen boteo, sí uno burdo, pero no uno bien hecho, suena terrible pero no es que sean bots que superen un test de Turing, es que hay gente que no supera un test de Turing :D

        • BlogueroConnor

          Quiero agregar a la última frase de Fabio, que los tuits de adolescentes son indistinguibles de bots. No lo digo por esa nota del 2014 que decia eso, sino porque he visto hashtags de temas de adolescentes y efectivamente el contenido de estos tuits parecen generados por monos.

  31. Agustin B.

    Muy buena la data, muy bueno el analisis y concuerdo con muchas de las mejoras propuestas en estos comments. Otros comportamientos interesantes que podrian llegar a analizarse serian:
    1. La relacion followers/posts. Se supone que deberia haber cierta relacion directa entre la ambos factores: si uno no postea nada, seguramente tendra pocos followers, si postea mas quizas tenga mas (no digo que sea lineal porque la viralidad y la fama seguramente hagan la curva de followers mas exponencial en algun momento) o visto al reves… si a uno lo siguen muchos, posteara mas que si no lo sigue nadie. Esto no quita que hayan losers (va con onda) que posteen muchiiiisimo a pesar que nadie los lea, o famosos vagos que tengan muchos followers y no posteen nada… pero son outliers. Estaria bueno comparar cuantos hay del bando pro y anti corte de presupuesto y ver si existe algun patron… si vemos de un lado que hay un ratio followers/posts en esa semana demasiado cerca a 0 da para la duda. (Digo posts en esa semana o diarios o por hora porque si tomamos el total de la cuenta podria compensarse con largos periodos de no posteos – ver punto siguiente)

    2. La dispersion de los posts. Si una cuenta esta hace 5 años y el 90% de los posts fueron en 2 o 3 ocasiones y eso se repite en varias cuentas del mismo bando… tambien da para la duda.

  32. Juan Martín

    Muy buen laburo y gran aplicación de ARS, felicitaciones!!
    Para todos los giles que preguntaban para que sirven las ciencias sociales

  33. Fede

    Agrego más data: el gobierno creó este año la Subsecretaría de Vínculo Ciudadano (http://www.saij.gob.ar/68-nacional-designacion-subsecretario-vinculo-ciudadano-dn20160000068-2016-01-08/123456789-0abc-860-0000-6102soterced). Es decir, institucionalizó el call center que el PRO utilizaba para la campaña (http://tiempoar.com.ar/index.php?rt=articulo/view/58517/ para una descripción somera).

    En teoría se dedica a (http://servicios.infoleg.gob.ar/infolegInternet/anexos/255000-259999/257018/norma.htm):
    OBJETIVOS

    1. Establecer metodologías de diálogo con los habitantes de la República Argentina, con el fin de entender las problemáticas individuales y darles curso para su solución.

    2. Detectar problemáticas sociales comunes a través del uso de herramientas tecnológicas.

    3. Mantener informada a la población a través de redes sociales y otros medios de comunicación electrónicos que permitan el contacto individual.

    4. Adoptar acciones que permitan un contacto y un vínculo personalizado.

    5. Promover la participación de la ciudadanía, mediante herramientas tecnológicas.

    Pero la verdad, esta nota aporta evidencia que respalda el “rumor” de que eso es una fachada para justificar los gastos que hacen y en realidad se dedican a otra cosa.

    El que los coordina es Julián Gallo (https://twitter.com/gallo1?lang=es), pero su verdad y el responsable es Carlos Souto (que a su vez es el capanga de http://laese.com/).

    Es decir, en lugar de usar la plata para el CONICET la usan para difamar. Recomiendo leer el manual de campaña de Durán Barba (“El Arte de Ganar”) donde explica este tipo de estrategias. El presupuesto de este año fue $163 millones (http://www.lanacion.com.ar/1945639-especialistas-caja-y-tecnologia-claves-de-la-imagen-de-macri-en-las-redes-sociales).

  34. Joaquín Serna

    Ya los quería de antes y ahora los quiero más. Este articulo es bancar el CONICET a fondo. El análisis que hicieron es excelente (amor al machine learning, NLP y todo) y hay datos que son hasta graciosos pensarlos, aunque correlación sí implica correlación…

  35. Hansen

    Son gente de ciencia che.. No pueden manipular los datos de esa forma. Un análisis un poco más neutral tendría algo de sentido, pero eso es una falta de respeto a ustedes mismos.

    • Pablo A. González

      Te puedo pedir precisión sobre dónde sentís que están manipulados? La nota la revisaron 3 expertos independientes en grafos, filo y socio para saber que estaba sólida.

      • Hansen

        Perdón, me refería a cómo se manipula el análisis de los datos para orientar a la gente a que opine de la misma forma que el autor. No digo que esté en contra, pero se crean suposiciones basadas en nada, con la clara intención de atacar un sector de los usuarios “analizados”.

      • Hansen

        Te nombro algunas
        En la portada, sin ir más lejos, los datos “Positivos” apoyan su opinión, “Negativos” la opinión contraria. No es tan grave, teniendo en cuenta que la única opción alternativa (por el modelo de análisis) sería nomenclar su opinión como “Negativa” y llegando al mismo problema. Lo interesante es que al principio de la nota aclara que se va a hacer un análisis sobre “el recorte en CONICET”.
        Cito: “Esta es la historia de cómo Twitter se expresó respecto del recorte en CONICET, con lo bueno, lo malo y lo feo.”
        Por lo tanto, debería ser “Positivo” = A favor del recorte, “Negativo” = En contra
        Pero por lo visto se olvidaron cuál era el objetivo del análisis porque unos párrafos más abajo se lee “El 52% de los usuarios se expresaron a favor” y en el siguiente gráfico se asocia ese 52% a opiniones a favor del CONICET (representada con un hermoso color verde) y el 48% restante a opiniones en contra del CONICET (me pareció un poco obscuro ese rojo). ¿No existen opiniones neutras o inválidas? ¿En qué momento apoyar el recorte es sinónimo de estar en contra del CONICET?
        El comienzo del informe ya tiene muchas falacias y “manipulaciones”, por lo tanto no tiene sentido seguir analizando, aunque confieso que me gustó el trabajo realizado para la extracción de datos. Felicitaciones a Analia y Yamila por el laburo.

        • Joaquín Serna

          Hansen, creo que a lo que vos haces referencia es algo más semítico o morfológico que metodológico. O sea es una cuestión de percepción lingüística del artículo que de lo metodológico, que es donde manipular sería ‘hacer trampa’. Por lo menos es como yo lo entiendo por lo que vos mencionas.

        • danoglam

          Hansen: Usted confunde manipular datos con tener una cierta interpretacion de los resultados.

          Luego, de verdad cree que el tamanyo de la sub-poblacion de gente que manda tuits de caracter neutrales sea considerable? Cuantos van a escribir o retuitear acerca de un tema sobre el cual se tiene una opinion neutral? Luego, lo de los colores no tiene sustento. Cambiele los colores, el resultado sera el mismo: la dinamica es diferente para los 2 grupos.

          Antes de desacreditar el trabajo ajeno, piense si tiene buenos argumentos para hacerlo. Sino el que queda en evidencia es usted mismo.

  36. Pablo Morgenstern

    Excelente el análisis de tráfico, “clusteres” twets y re-twets… Más allá de lo ideológico (¿es posible ir más allá de lo ideológico?), me resulta muy útil para la materia que dicto en CAECE “Gestión de la comunicación en Crisis” para que los alumnos reflexionen sobre el poder/manejo/función de las Redes Sociales y descarten la casualidad como origen de una crisis de comunicación.

  37. Leandro Casiraghi

    Sumo otra errata: La cuenta @Silvia_Molina aparenta ser real, la foto es la misma que la que sale en esa página de internet pero con la cara cambiada. Hay muchas fotos en su cuenta de la misma persona. El tema es que con la baja resolución de los avatares no se nota.

    • Rodrigo Quiroga

      He visto varias cuentas de Facebook sospechosamente activas en comentar en diarios a favor de Cambiemos, y que tienen 30 o 40 fotos, todas de baja resolución donde no se notan las caras, y aparece diferente gente. A su vez, tienen contactos con el mismo apellido, pero cuando consulté a 4 de ellos ( lo sé un N muy bajo pero no tenía mucho tiempo para dedicar a eso) no eran parientes del susodicho.

  38. Ceci

    Che, soy yo que entendí mal o este pedacito:
    “En el eje de coordenadas podemos ver cómo los usuarios en favor de la comunidad científica se encuentran más cercanos al eje X”
    debería decir “eje Y”?

  39. Fede

    Una pregunta más: si no hay un troll-center, podemos ir de visita un día a la “Subsecretaría de Vínculo Ciudadano” de Gallo? Podemos poner una cámara ahí para ver en vivo a qué se dedican con fondos públicos?

  40. Maskot

    Muy bueno el informe.
    Creo que lo más grave de todo acá, más allá de mostrar si se utilizan o no bots para “manipular” el pensamiento de la gente (esto se ha hecho de todas las formas posibles desde el principio de los tiempos, no es ningún descubrimiento), es darse cuenta de la involución constante del ser humano. Cada vez existen más medios y maneras de obtener un razonamiento propio (incluso las redes sociales pueden servir para tal fin), pero sin embargo la inmensa mayoría sigue prefiriendo/eligiendo subirse a un barco ya en navegación aun desconociendo a sus capitanes, que construir de cero su propia balsa.

    “La culpa no es del chancho sino de quien le da de comer”. Si no hubiera gente que asuma lo masivo/convocante como lo verdadero, como lo legítimo, sería mucho más difícil para los que nos gobiernan imponer una ideología determinada. Crear bots para instalar un pensamiento sería inútil si no existieran millones de errantes atrás que se coman el verso de que lo popular es lo correcto.

  41. Erwin

    Espectacular la forma de presentar los datos, clarísima la explicación. Además despertaron mi sed por las librerías usadas, aunque es seguro me voy a quedar corto de teoría. Me gustaría poder analizar de esta misma forma muchas otras noticias, hasta podría hacerse un sitio que se dedique a mostrar exclivamente este tipo de análisis. Si 678 mostraba las jugadas de las corporaciones mediáticas en la tele, esto podría ser algo parecido aplicado a las redes sociales.

  42. Sole

    Buena nota chicos! Pero como excelentes divulgadores que son, esperaba más un acercamiento a las investigaciones realizadas por integrantes del instituto y su importancia para la sociedad, los resultados de las mismas y cómo pueden ayudarnos a mejorar en las distintas áreas de aplicación.
    Estaría bueno llegar a la gente por lo que CONICET aporta, en lugar de por quienes están en contra.

    • Pablo A. González

      Claro, pero esta nota no es sobre CONICET. Es sobre Tuiter. Ojo ahí.

      Hagamos una sobre CONICET, pero que la escriba alguien que sepa. Yo sé más de Tuiter que de CONICET.

  43. Fidel

    Muy buena la nota! Me encantó ver los datos crudos, me parece muy importante, sobre todo para mostrar a gente que no es del ámbito. Lo único que les criticaría es la elección de los colores, me parece muy tendenciosa y hasta un poco prejuiciosa, tengo muchos compañeros oficialistas que bancan al Conicet y son Anti ajuste y familiares k que lo viven criticando. No me parece que sea tan dicotomica la cosa, no hay que caer en simplismos, colores neutros me parecería mejor.

  44. Raúl Gómez

    Hola. Excelente aporte. Sólo una sugerencia. Un abstract con la principales conclusiones podría facilitar la divulgación a sectores no tan especializados o legos.

  45. Esteban

    Una cosa que se podria hacer para reforzar aun mas la tesis de que algo raro hubo, es analizar el subset de usuarios reales que se presume que tienen una autentica opinion en negativa del CONICET y ver que comportamiento tienen en cuanto a dias de posteo o relacion con otras cuentas.
    Deberia tener claras diferencias con las otras cuentas que se presumen fake.

  46. Facundo Calcagno

    Lei el artículo y siento que todo el mismo se basa en la buena o mala detección de comentarios positivos o negativos. ¿Qué técnica utilizaron para la detección? Pregunto esto porque la utilización de palabras positivas o negativas (duos o trios de palabras) demostró que no es suficiente para detectar la positividad o negatividad de un twit. Ya pasé por esto en varios análisis y uno termina “apostando” a que ciertas palabras (la cantidad que sean) van a hacer positivo o negativo al twit, y no es así. La pérdida del doble sentido, la ironía, etc, se hace presente en esta clasificación. Lamentablemente este problema no está resuelto en español (IBM Watson hace un gran esfuerzo en inglés, pero no lo termina de cerrar). Igualmente me parece super interesante y es para seguir trabajándolo con más detalle. Los felicito.

    • Martin Casatti

      Justo pensaba lo mismo Facundo. El análisis está muy bueno pero descansa en una piedra floja que es el análisis de “positividad” o “negatividad” que se puede extraer de posts redactados en lenguaje natural. Reniego con eso todos los días. El lenguaje que nosotros consideramos “natural” no lo es en absoluto para hacer análisis automatizado y es un escollo enorme a la hora de interpretar el “sentido” y no el “contenido” de lo que está escrito.
      Me gustó tu comentario sobre que, en última instancia, uno termina “apostando” sobre el valor de los comentarios y como son influenciados. Y esa apuesta no es sino nuestro sesgo personal que altera la medición.
      Igual, para que no sean todas pálidas, me parece un paso interesante en la dirección correcta. Me gustaría que publicara, sino la DB con los datos en crudo, al menos una descripción de cómo se hizo el análisis de lenguaje natural y qué pesos terminaron asignandoles a los términos. El sumum sería qué algoritmo usaron para detectar y descartar sarcasmos, doble sentidos, información no textual (emoticonos, imagenes) y ese tipo de pavadas que nos complican la vida.

    • Esteban

      Yo tambien trabajo con lo mismo y es verdad todo lo que decis. Pero varias cosas:
      1) Las ironias y sarcamos va en ambas direcciones. Es dificil de detectar en la positiva y en la negativa. Seria muy extraño que las ironias sean estadisticamente distorcionantes solo en una de las posiciones.
      2) El % de ironias sobre un subset grande no suele ser suficientemente grande como para que las conclusiones sean alteradas.

      El analisis de sentiment automatizado si esta bien hecho el diccionario y se usaron buenas librerias, sirve. No es 100% exacto, pero si muy concluyente.

  47. Elio Campitelli

    Muy buen laburo. Me encantaría tener los datos y la experiencia en NLP para hacer este tipo de cosas. Más de una vez se me ocurrió algo así pero nunca supe por donde empezar. Estaría bueno ver específicamente cómo hicieron la división entre azules y amarillos, porque a mí no se me ocurre ninguna forma confiable (de nuevo, mi falta de experiencia con este tipo de datos).

    Más allá de eso, igual, creo que hay que tener muuuucho cuidado con la interpretación de un análisis de datos “open ended”; especialmente cuando confirma tus prejuicios. Hay mucho que es básicamente “cazar anomalías”: buscar patrones “raros” q

  48. Elio Campitelli

    Muy buen laburo. Me encantaría tener los datos y la experiencia en NLP para hacer este tipo de cosas. Más de una vez se me ocurrió algo así pero nunca supe por donde empezar. Estaría bueno ver específicamente cómo hicieron la división entre azules y amarillos, porque a mí no se me ocurre ninguna forma confiable (de nuevo, mi falta de experiencia con este tipo de datos).

    Más allá de eso, igual, creo que hay que tener muuuucho cuidado con la interpretación de un análisis de datos “open ended”; especialmente cuando confirma tus prejuicios. Hay mucho que es básicamente “cazar anomalías”: buscar patrones “raros” y luego inventar una narrativa que los explique. Algo así como un ghosthunter de la tele encontrando puntos fríos en una casa y concluyendo que son fantasmas (salvando las distancias epistemológicas, obviamente). Especialmente en un caso como este que sus conclusiones más o menos mesuradas terminan siendo totalmente distorsionadas como se puede ver en los pingbacks (que hablan de “la investigación que desenmascara la estrategia macrista” o en los compartidos por facebook y demás.

    Hay algunas críticas específicas que voy a poner en otro comentario (para que no se haga largo), pero me parece una forma muy buena y prometedora de análisis.

    • Pablo A. González

      Estoy re, re cansado. Fue un día largo y dificilísimo, y me alegró mucho leer el comentario. Más que nada, me gustó mucho que lo separaras y lo encararastan propositivamente. Amamos cuando pasa eso. Meintras escribía esto pispeé el otro. Es largo, abrumador y metodológico (cosa que me encanta), así que prometo leerlo fresco mañana.

      Ja, mentira. No me pude aguantar y leí prácticamente todo.

      1) Primero, problemas de visualización: Queremos armar algún tipo de itneractivo. Ningún grafo que haga puede representar bien tantos puntos sin que, entre otro montón de cosas, lo que esté es literalmente esa visualizacion (onda, arcos superpuestos).

      2) AMARÍAMOS cuantificar con un ideologómetro (?) las dos poblaciones pro CONICET. Si se te ocurre una forma, chiflá, posta.

      3) Estamos rearmando el gráfico del finde para atender esa pregunta que surgió varias veces.

      4) Estamos todavía tratando de cuantificar bien las cuentas ‘sospechosas’ y buscando actívamente forma de automatizarlo. Hay mucho que las chicas hicieron a mano mirando uno por uno.

      5) RE hay que normalizar lo del historial de creación de cuentas.

      Hay bocha para mejorar, pero nos pareció que era una buena intención y le pegamos para adelante. Las chicas hicieron gran trabajo generando un dataset interesantísimo, y un analisis preliminar más que interesante. Tenemos muchas cosas para charlar mejor, unificar y detallar bien metodología, y es algo que queremos hacer para poder compartir el análisis lo más completo posible, pero ya llegar hasta acá ha sido un sprint fuerte. Re si gamos y re refinemos.

  49. Elio Campitelli

    Dicho lo de arriba, estas son algunas críticas puntuales:

    “En el eje de coordenadas podemos ver cómo los usuarios en favor de la comunidad científica se encuentran más cercanos al eje Y”

    Yo no veo eso, al menos no en ese gráfico. Sería bueno ver una función de distribución, un histograma o algo así, pero a ojo yo veo que hay muchísimos amarillos recontra cerca del eje y (hay mucho overplotting en ese gráfico, así que puedo estar equivocado).
    Dice que hay 14.130 azules y 9.956 amarillos con cero entrada. Eso significa que entre los que tienen cero entrada, el 58% es azul, lo cual es sólo un poco más que el 52% que son el total de usuarios azules. En cualquier caso, salvo el caso de los outliers que señalan en el texto, el gráfico no deja en claro que los azules tengan mucha menos entrada que los amarillos.

    “No es menor notar también que los principales agentes del cluster anti CONICET se muestran a sí mismos como oficialistas y anti-kirchneristas. Dentro del cluster contrario al recorte hay algunas cuentas fácilmente identificables como kirchneristas, pero estas cuentas no dominan el cluster entero…”

    A mí esto sí me parece relativamente menor y menos sorprendente que a ustedes. Me parece bastante obvio que en la separación entre “defensores del gobierno” y “no defensores del gobierno”, el segundo grupo va a ser más heterogéneo, simplemente porque hay muchas ideologías, posturas y partidos que son “no gobierno” mientras que muchas menos son “gobierno”.
    También esto estaría bueno cuantificarlo de alguna manera.

    “Algo que nos llamó mucho la atención es que muchos de los usuarios inmediatamente adyacentes a los centrales del cluster negativo no tienen ningún tipo de identificación, estética o estilo personal discursivo que nos haga pensar que son personas expresando su opinión en redes. (…) [E]sto contrastó fuertemente con los usuarios de mayor centralidad en la red que se manifestó en apoyo a la comunidad científica de CONICET”

    Acá no entiendo la comparación. ¿Se está comparando usuarios adyacentes a los centrales del lado amarillo con los centrales del lado azul? Eso es lo que entiendo del texto y si es así, no me parece que sea una buena comparación. Una comparación válida sería entre usuarios con los mismos niveles de centralidad. Si es esa la comparación, o yo soy medio bobo o no queda claro en el texto.
    (Y, de nuevo, sería genial cuantificar esto)

    “…un mínimo claro de presencia de tweets anti CONICET durante los fines de semana…”
    “…el clúster negativo tenía alta actividad de lunes a viernes y muy baja los fines de semana…”

    ¿Éstas afirmaciones se basan en el gráfico de “Me tomo el finde” o en otros datos? Porque el gráfico no sirve para sostenerlas, ya que se trata de porcentajes, no de números absolutos (no muestra menos actividad en el fin de semana sino menor actividad relativa). No me queda claro eso. Tampoco me queda claro si la comparación es la actividad total de cada cuenta o de la cantidad de twits específicos sobre el CONICET.
    Ahí también entra un poco el tema del “anomaly hunting” que hablaba arriba. Si yo le pagara a una red de usuarios falsos, ¿por qué sólo les pagaría para twittear durante la semana, especialmente en una situación aguda como esta? No me queda para nada claro que aún si el patrón es real, sea un indicador de que están pagados.

    (De paso, esa quizás podría ser una medida interesante actividad total / actividad CONICET)

    “…y podemos agregar un dato más: la fecha en la que esas cuentas fueron creadas.”

    El gráfico no parece particularmente convincente, especialmente si no se compara con las fechas de creación de las cuentas azules. Por otro lado, no me queda claro la importancia de esos dos picos. ¿Qué proporción de las cuentas implican esos 160 usuarios? A ojo parecería que, contando sólo entre los dos picos, hay unas 14.600 cuentas creadas (~10 cuentas por día, durante 4 años). Al principio del artículo se mencionan 29.000 usuarios en total. Esas 160 cuentas, entonces, no parecen particularmente relevantes si son menos del 1% de la red. ¿Son cuentas con mucha centralidad o actividad? En el texto insinúa que sí y señala tres como “protagonistas del cluster anti CONICET”, pero en el grafo de arriba no las veo.

    Espero que no se tome mal. Como dije antes, me parece un gran y valioso laburo que espero que siga y se refine.

  50. Martin Irony

    Los felicito por el análisis. La crítica que se les podría hacer es que es difícil la detección automática de positivo o negativo en un comentario. Sin embargo, con una red tan centralizada los posibles errores de clasificacion tienen poco impacto si uno se toma el trabajo de corroborar los comentarios de los nodos clave (los mas conectados).

    Por lo tanto, y después de leer todo cuidadosamente, concluyo:

    No hace falta ser investigador princpal (ni siquiera becario de PhD) para darse cuenta que ese grupo de opinólogos anti-ciencia se conforma de simpatizantes del gobierno nacional SIN formacion científica y posiblemente empleados en la administración pública.

    Les deseo que reciban financiamiento (del conicet o de quien sea) para poder hacer este tipo de estudios de manera mas sistemática y mas general en los temas centrales de cada “ciclo noticioso”. La sociedad lo merece.

  51. BlogueroConnor

    Están disponibles los datos y el software utilizado? Supongo que mas de uno quisiera hacer una evaluación independiente.

  52. Boris

    Hay una hipótesis alternativa al respecto de la diferencia sobre horario laboral entre ambos grupos y es que los que postean en horario de oficina son empleados escapando de su trabajo en Twitter.
    Que compartan cosas donde mandan a laburar a otros cuando ellos se están haciendo los ñoquis estaría para un análisis cultural de esos que tanto detestan, en caso de que existieran estos ejemplares.

  53. Danimir Lorkovic

    Me costó mucho leerlo, valoro el trabajo que hicieron y me cuestiono algo:

    Socialmente, yo creo que es más fácil o aceptado en general ponerse del bando del “no recorten a nada” que del bando “recorten a algo” y si eso es verdad entonces aumentaría la propensión a opinar por “no recorten” naturalmente.
    No creo que sea lo mismo opinar por uno o por otro, es negativo proponer recortes, nadie quiere sacarle el pan a otro. Por ende, ¿Qué puedo esperar de representatividad en la batalla que muestran? me da sensación que la opinión de Twitter está sesgada por el “mal visto”.

    ¿Hay algún trabajo realizado sobre la propensión a opiniones “mal vistas/connotación negativa”?

    ¿Cual es la hipótesis que a fin de cuenta, mal o bien, apoyan los datos? no entiendo. Gracias!

  54. Edgardo

    Muy interesante el artículo, pero poniéndome en exigente, me genera una serie de dudas:

    1) “como primer paso o criterio tomamos una muestra del 50% de la base total de tweets y analizamos el texto con el programa SPSS Text”

    Acá se hace obligatorio preguntar, dado que casi todo el análisis posterior viene derivado de esta selección, en cómo se hizo la misma. ¿Aleatoria? ¿Alguna variable de tiempo? ¿Eliminación de tweets repetidos?

    2) El análisis de la fecha de creación de las cuentas es interesante, pero debería realizarse la misma medición sobre el resto de los clusters, y no solo sobre el identificado como anti-CONICET. Al hacérselo sobre uno solo puede caerse en un cierto sesgo que parece anteponer la conclusión al análisis, al evitarse realizar una comparación o contraste para ver si es un fenómeno que se repite en el resto de las cuentas.

    Tema aparte es la proporción de estas cuentas sobre el total de las involucradas, que se indica al comienzo serían unas 29.000. Frente a esta cantidad de cuentas, las reflejadas en el gráfico parecerían ser un porcentaje ínfimo como para extrapolar conclusiones sobre el funcionamiento del cluster.

    Idealmente también podría tomarse cualquier otro tema (tal vez no politizado) en un periodo similar de tiempo para usarlo como referencia o control.

    3) Respecto al análisis del contenido en sí de los clusters, es el aspecto que más dudas me genera, y en el cual la verdad me gustaría ver el data set original, para chequear:

    a) Respecto a las nubes de palabras, me llama la atención que Rey & León tengan diferencia de peso, porque ambas palabras deberían ir juntas siempre en este contexto (también que diga pagamo, pero bueno, es twitter).

    b) También que se indique como conclusión que “militantes” y “ñoquis” sean los calificativos preferidos, dado que ñoquis no aparecen en la nube de palabras incorporada, y no se provee ninguna referencia que refleje esta preponderancia, o su presencia en relación a “militante”, que si aparece en la nube.

    c) De manera similar, no puedo observar el uso o no de “memes” en lo presentado, al igual que “la replica de contenido informativo” indicada en el comportamiento del otro cluster.

    Me surgen dudas sobre que se esta considerando como “meme”. Si se toma como evidencia las menciones de Mufasa y peronismo como indicadores de la presencia de los mismos, en el otro cluster la presencia de los términos trolls, center, campaña + miedo, etc, no debieran indicar un grado similar de uso de “memes”? Siempre dependiendo sobre que se este entendiendo por “meme”.

    (PD: ¿Mufasa tampoco aparece en la nube de palabras?)

    Debería incluirse algún dato duro que demuestren estas situaciones (sea cant. de tweets con imágenes “meme” en ambos clusters, inclusión o no de links a sitios o publicaciones científicas o periodísticas, porcentaje de aparición de los términos indicados como reflejo de la presencia de “memes”, etc.)

    d) Me llama la atención que “Investigadores” no aparezca en la segunda nube de palabras, siendo superada por curas, ganancias, retenciones, obispos, etc.

    e) También que figure “center”, pero no “call” en la nube de palabras del cluster identificado como Pro-CONICET, pues parecería estar presente en alusión al “call center” del PRO.

  55. SEbastián

    Es sabido que twitter es dominado por los famosos “Call Center” no es novedad. Los del anterior gobierno (K) y los de este (que tiene vertientes de Carrió, Marcos Peña, Durán Barba). La gente no come vidrio y se da cuenta, obvio que trabajos como el de “Disney” son todo lo que la gente necesita leer para apoyar que dinamiten el Conicet, gente que apoya o apoyó este gob pero coincide en hacer limpieza de ñoquis, chantas y acomodados. Saludos

  56. SEbastián

    El rol de las redes sociales fue usado con errores fatales por la Sra Hillary Clinton y su “primavera árabe”, cuando falla en Siria ellos dicen “En Siria no usan internet o redes sociales” (Falso, Siria usa mucho internet y redes sociales, sobredimensionaron el rol de ellas). También Rusia se encargó de desarmar el agitprop de twitter con su propio motor (hizo bien). Es solo un ejemplo de como no se cumple lo de Watzlawick de construir el acontecimiento con redes sociales solamente.

  57. Gustavo Saenz

    1- Las 2 autoras son kirchneristas o filo-k (pueden haber sesgo)

    2- Que muchas cuentas anti-conicet sea anónimas no implica que sean trolls, de hecho me parece lógico que sea así, ya que es la postura “políticamente incorrecta”. Usar el nombre real y criticar al Conicet, al feminismo, a la educación pública, etc te puede provocar un escarnio público que muchos quieren evitar.

    3- yo estoy completamente en contra del Conicet, al que quiera le doy mis argumentos.

    • Pablo Goloboff

      OK, Gustavo… tras 5 días sin respuesta, parece que no era verdad que “al que quiera, le das tus argumentos”. Asumo que no hay tales argumentos y que estabas sanateando. Seguramente sólo otro troll, que ni siquiera leyó la discusión de cómo parece poco probable que los posibles errores del estudio (e.g. la asignación automática de un post a “pro” o “anti”) no deberían favorecer más a una que otra conclusión (haciendo muy poco probable el “sesgo”). Saludos gatos!

  58. Esteban Fernandez

    Supongo que para tener datos mas precisos sobre estos clusters, podrían cruzar por diferentes temas en diferentes períodos de tiempo tratando de entender que opinan en cada momento. Hacer solo minería de datos con un tema en un momento único del tiempo y en una sola red social deja el panorama incompleto. Estoy seguro que usuarios como Navarro (ElDestapeWeb) han opinado durante los últimos 4 años muy diferente de lo que a temas similares (bonos, aumentos, indec, conicet) opinan ahora.

  59. Julián

    Muy buen análisis y muy buena nota!
    Los re banco gatos! Algo que me queda colgado de este temita: me suena pura estadística descriptiva, no hicieron tests de hipótesis de medias y desvíos? Algo de inferencia estadística? Onda, podemos decir que con un 95% de confianza que no se puede rechazar la hipótesis nula (los anti conicet Twitteros son tipos que buscan manejar la opinión pública). O algo así. Me encanta lo que hacen, siempre los leo.

  60. Santiago

    Muy buena la nota, y un placer leer los comentarios que hay acá después de haber leído muchas de las respuestas que hay en Twitter (al respecto de eso, y por favor muchachos, no se olviden: do not feed the troll, especialmente después de haber sacado una nota agitándolos).

    1. Me quedó picando el tema de “cuentas abiertas el mismo día” y coincidiendo exactamente con un evento como el debate presidencial. De tener un operativo preparado, esperaría un poco más de preparación y antelación sinceramente. Así que me puse a buscar un poco noticias del 15/11/2015 con referencias a Twitter, y no costó mucho encontrar referencias a comunicaciones de Macri y de Scioli pidiendo “Hoy retwitteame”. Ej, mail de Macri, enfasis mio:

    > “Acordate que *hoy domingo* a las 21 horas voy a participar en el debate presidencial y que desde mi cuenta de twitter @mauriciocmacri estaremos tuiteando ideas, proyectos y esperanzas que traerá el cambio a la Argentina.
    >
    > Por favor, no te olvides de compartirlas en tus redes sociales. Postealas en Facebook y retuitealas usando el hashtag #MacriPresidente y #ArgentinaDebate”

    Me imagino que algo así fácilmente pudo haber disparado la creación de muchas cuentas de twitter, y todas con un perfil mayormente “repetidor”; especialmente siendo que fueron creadas ante un pedido de “retuiteame, porfi”. Y esperaría que ese grupo de gente mantenga esa actitud en la red social, y además que lo haga en la comodidad de su oficina.

    2. Dicho esto, y suponiendo que sí haya un subgrupo de gente paga con cuentas falsas, me intriga cómo “despegan” esas cuentas efectivamente. Un análisis interesante podría ser analizar cuál es el primer círculo de followers que logran. La API de Twitter, si bien no devuelve la fecha de follow, sí devuelve los resultados ordenados por ese valor, con lo que bastaría con tomar las cuentas más polémicas, extraer sus primeros N followers, y mirar la intersección entre los grupos si la hay (es decir, quiénes son los primeros que “empujan” esas cuentas).

    3. Otro detalle más, no relacionado con el punto anterior: el hecho de que una cuenta mande tweets que pasen un captcha cada tanto no quita que la cuenta también sea un bot. Perfectamente puede tener parte del comportamiento (el retwitteo) automatizado, y aún así tener un humano (a veces siendo generoso con el término “humano”) atrás escribiendo cuando tiene ganas.

    4. La última y no jodo más: en el agregado “NOTA 27/12, 13:25”, al final de todo cierra un paréntesis que no abre, y sí, eso logra ponerme nervioso. Te dejo adivinar a qué me dedico en base a ese comentario.

    • Sol Minoldo

      Hola Santiago. Muchas gracias por tu valiosa intervención.
      1. Ciertamente el hallazgo de las cuentas abiertas el mismo día, en momentos políticamente sensibles, no necesariamente aporta a la hipótesis de que tales cuentas correspondan a (trol)empleados o bots. Lo que planteás es otra de las explicaciones alternativas que habría que explorar.
      2. Tu propuesta es muy interesante. Creo que efectivamente puede ser útil analizar la red de follows que se establecen entre las cuentas, para explorar la hipótesis de movida “operada”
      4. No veo el paréntesis de la nota. Lo deben haber arreglado, para tu tranquilidad ;-) Es difícil adivinar tu profesión: Podrías ser corrector, editor y demases, o simplemente tener un TOC como nos pasa a muchos ;-)

  61. no traje dni

    Excelente nota! Por algunos comentarios que vi en las redes y acá, llegaron los trolls al gato… no soy k (tampoco anti k), una letra no me define, si apoyo muchas de las políticas del anterior gobierno (o el anterior a Pinedo ja). Si uno se pone a bucear un poco en las redes, me da la sensacion que hay trolls pagos y “trolls” que repiten como loro (en general porque coinciden con eso que repiten). Ultimamente cuando sale alguien a decir algo en contra del gobierno o de su política busco en ciertos lugares el “contraataque” y en general aparece (casos conocidos tinelli, Paenza, el sindicalista de docentes en provincia de BA), no es muy cientifico lo que digo, entra mas en “mepareceami” o “paramiqueesasi” (mi “director de tesis hasta no se cuando” se debe estar revolcando en sus papers).
    La manipulacion de la opinion publica existe desde tiempos remotos (la que siempre se me viene a la cabeza es con el fallecimiento de gardel y los contratos de la carne). Hoy el tema se hace más rápido, siempre (antes, ahora y mañana) es triste que no pensemos y no podamos tener caminos cognitivos propios.
    Abrazos desde la rueda de algúna jaulita de algún laboratorio, de un “cientifico” que no está investigando la cura de ninguna enfermedad

  62. Lorenzo

    Pecaron de tener razón….

    Teniendo en cuenta que a la altura de ‘muchos de los usuarios inmediatamente adyacentes a los centrales del cluster negativo no tienen ningún tipo de identificación, estética o estilo personal discursivo’ ya había una baranda a bot que no se podía estar, realmente se podrían haber tomado una porción de la nota para cachetear un poco el hecho al que todos los datos apuntan (que hay bots), seguro algo piola salía, y las conclusiones, si bien no rigurosamente probadas, hubiesen cargado un poco mas de sustancia. Ustedes lo sabe, la existencia de bots en las redes está más que probada. Había ahí una oportunidad para introducir observaciones que otros han hecho, como el efecto de interés compuesto, . Ojalá me equivoque, pero sospecho pocos serán los que se queden en ‘hay bots’, la conclusión cristalina de esta nota, y no den varios pasos más hacia ‘existe una asociación Macri Magnetto para la manipulación sistemática de la opinión pública en las redes sociales’, y aún más allá. Pero, en vez de evitar esto, se quedaron con la sugerencia irónica
    ‘Desde ya que hay explicaciones alternativas al escenario organizado para la generación de opinión concertada. Hay escenarios de entusiasmados retweeteadores a los que no les copa poner su foto, que encima no opinan los fines de semana y que justo se dio que el día que abrieron la cuenta había habido un evento político relevante.’
    que sin duda me hizo reír. Más constructivo me hubiese parecido lo que sugerí más arriba.

    • BlogueroConnor

      Si la nota hubiese dicho “existe una asociación Macri Magnetto para la manipulación sistemática de la opinión pública en las redes sociales” se autodescalificaría porque de estos datos no se puede sacar esa conclusión (o si se puede, no fue lo que hicieron) y ademas quedaría en evidencia que esto está hecho para avalar un juicio previo.

  63. Javier

    Buenisimo gato, primera y probable única consecuencia de la investigación: ejercito de trolls haciendo horas extras de noche y fin de semana y escribiendo sus propios mensajes!

  64. Seba Bortnik

    Amigos,

    Como les adelantaba por Twitter, el artículo me generó sensaciones encontradas. En primer lugar, me encantó, porque se hace un laburo con los datos que no muchos medios hacen y eso es genial, hay un laburo detrás del post que es extraordinario, y que tiene que ver con el uso de datos para sacar conclusiones y me encanta que se fomente eso y entiendo está super alineado a su misión. Pero hubo algunas cosas que no me gustaron y que quiero compartir con ustedes, justamente porque tengo una excelente imagen del laburo que hacen…

    1. Lo que menos me gustó, es que se nota claramente detrás del artículo la condición ideológica de quién lo escribe y que eso no está mal, si fuera escrito con sinceridad y no detrás de una supuesta “verdad arrojada por los datos (queda alguna duda que está en contra del recorte en el Conicet?). El mismo post dice “esto no es análisis, es dato.”, cuando gran parte del post es justamente análisis… Y NO ESTÁ MAL QUE LO SEA! Me encanta, pero sería mucho mejor si lo presentan como lo que es: un análisis de datos.

    Como apoyo a este punto, en los mismos comentarios se termina indicando que muchas de esas conclusiones podrían no ser reales (como tomar a usuarios como “bots” cuando la gente los conoce y sabe que son personas con convicciones o como confundir usuarios claves de qué “lado estaban” por una mención del otro lado).

    Después se arrojan con “Qué cosa hermosa cuando los datos cuentan una historia”, cuando como científicos deberían saber mejor que nadie que somos las personas las que contamos historias.

    Solo un ejemplo en los comentarios (hay varios más): https://elgatoylacaja.com.ar/jugada-preparada/#comment-54007

    2. El título. Se que todos queremos atraer gente a nuestros sitios, difundir nuestras ideas, etc.; pero un post que se titula “Jugada Preparada” no puede tener como inicio de su conclusión que “esto no es una confirmación de que exista una actividad organizada”. O sea, la conclusión contradice DIRECTAMENTE el título del post, y hubiera sido genial que ya desde el título arranquen con la claridad y/o humildad de la conclusión: que son datos, que muestran tendencias, sobre las que ustedes hacen un análisis que por diversos motivos no pueden ser concluyentes. El título no solo no muestra nada de eso, sino que sugiere todo lo contrario.

    Insisto, entiendo la tentación de poner títulos atractivos, se que funciona, trabajé como editor de sitios de contenidos; pero si su misión es de divulgación científica, yo los voy a leer mucho más si titulan como científicos que como periodistas. Al menos, esa es mi opinión.

    3. El post omite un tema humano que también es ciencia: es mucho más fácil escribir un post “apoyando la ciencia” o “criticando el ajuste” que diciendo lo contrario. Si el recorte que se hizo en el Conicet se resume solo a “estás a favor o en contra de la ciencia”, es muy muy muy lógico que haya más gente escribiendo “a favor de la ciencia”.

    La realidad es mucho más compleja, no hace falta ser un genio para saber que podríamos tener grandes avances en ciencia con 500 personas menos en el Conicet o menos avances con 500 personas más (es decir, hay al menos 4 escenarios en lugar de 2, la realidad es compleja, no simple).

    En fin, estoy viendo que en una nota al pie del post terminan aclarando muchas de mis críticas, jejeje, pero leí el post antes de que lo pongan, jaja.

    Un abrazo y que las críticas sirvan para que sigan creciendo!

  65. Fede

    Estaría bueno si fuese verdad. Muestran los datos que apoyan sus hipótesis sesgadas y omiten el resto. Hacen una investigación acientífica. Se les nota la agenda, muchachos.

    • Marcos

      Por favor FEDE, decile a los muchachos y al resto de los lectores como yo, que datos omitieron en el análisis. Si uno toma una porción del 50% de “algo” para analizar creo que se puede obtener una o varias tendencias en el análisis y podemos obtrener resultados que como se aclara en el articulo no son %100 concluyentes, pero SÍ podemos ver hacia donde apuntan esas tendencias y que nos muestran, sobre todo cuando nos referimos a como las redes sociales pueden operar

  66. Maryan

    Me parece un excelente analisis! Nos abre mucho la cabeza para entender como funciona actualmente la politica y la manipulacion que se hace a la gente que no tiene tiempo o ganas para investigar un poco mas alla.

    Sugiero solo una cosa:
    Estaria bueno tambien que se agregue un link para las personas que queremos profundizar sobre el tema de CONICET.
    Si bien entiendo que es grabe la situacion de los cientificos y como son menospreciados, negreados durante tantos años y despues posiblemente abandonados, me gustaria si pueden hacer o conseguir algun analisis objetivo sobre el tema y agregarlo al articulo en un link para que la gente que quiera interiorizarse, sepa que estos problemas no son de ahora sino que vienen de hace muchos años y que no es la primera vez que dejan afuera a tanta gente pero si es la primera vez que los medios (ya sea redes sociales o periodisticos) lo dan a conocer.

    Los numeros son importantes, nos dan una idea del contexto actual pero tambien pensemos mas alla de los numeros, busquemos en la historia si nos interesa un tema antes de ponernos de un lado o del otro y volvernos partidarios.

  67. SGP

    Me parece que deberíamos hacer un análisis de cuanto pesa realmente en la decisión de una persona las opiniones de Twitter. Tengo la sospecha que es absolutamente irrelevante en cuanto al pensamiento general respecto de un tema en particular.
    Cada vez creo mas que es una burbuja que tiene poca representatividad en el total de la gente de un país. Cada vez estoy mas convencido que esta burbuja alimenta los medios y asi se va deformando la realidad o al menos verdades objetivadas con datos pero que termina siendo irrelevante en el total de la población (Trump, Brexit, etc).

    En definitiva lo segundo mas importante de toda esta discusión es el resultado de lo que la mayoría de la gente que vota o ejerce influencia en la votación creen: Está bien ajustar el Conicet o NO está bien ajustar?
    Lo 1ro es que haya un buen desarrollo de la ciencia argentina.

  68. Alan Schamber

    Separemos las cosas: el grafo por un lado, parece ser correcto. Pero el análisis de datos, es realmente pobre, y es de alguien que no comprende cómo funciona esa red social.
    Que alguien haga un RT no significa que no tenga opinión propia, sino que coinciden con lo que dice en la mayoría de los casos. Vos podés tener 100 mil personas que opinan lo mismo, compartiendo solamente mil twits, porque han resumido de forma correcta lo que las personas piensan. Los corazones de twitter, lo mismo. Lamentablemente, veo demasiado sesgo de quienes hicieron el análisis, sin importar que me encuentre del otro lado: para mi, interpretaron como se les dio la gana, o como les convenía. Saludos.

  69. Gabo Lato

    muy buena la nota, muy bueno el análisis. Me gustaría que haya una versión “resumida” para los vagos que opinan sin leer nada y que cuando se las mande no le van a dar ni bola cuando vean todo lo que hay que scrollear, pero qué se le va a hacer?

  70. Diego Fernández

    Hubiera sido interesante saber si los supuestos tweets anti CONICET eran contra todos, o contra cierto tipo de investigación, es decir iba contra todos los investigadores, contra los de sociales, contra los biológicos, etc. Y que temas de investigación criticaban y cuales no

  71. AoD

    Hay un solo párrafo de la nota con el que estoy 100% de acuerdo: “Entonces, hablemos abiertamente… … ciencia sí o no, y cuánto.”. Después, como a muchos de los que hicieron comentarios, hay muchas partes del análisis que no me convencen pero igualmente agradezco que tanto los autores como la mayoría de quienes comentan lo hacen con fundamentos y respeto, a diferencia de lo que pasa en la mayoría de las redes sociales. Lamento los pocos comentarios ridículos ya sea de un lado como del otro que lo único que apuntan es a desacreditar personas y no a criticar con fundamentos lo escrito. Igualmente, tanto para los que hacen esos últimos comentarios como para los autores, recuerden que el país no es binario y no está bien que lo sea.

  72. CONICET y la posverdad: una respuesta del Siglo XX a problemas del siglo XXI | Puchero

    […] Todo esto fue amplificado por una red muy aceitada en reproducir este tipo de mensajes y atacar a quienes piensan distinto. Cualquiera que trabaje administrando redes sociales de una persona u organización que no coincida con las políticas oficiales lo ha vivido en carne propia, antes con el kirchnerismo y ahora con la nueva administración. En esa red, hay periodistas, funcionarios, personas comunes, militancia y también bots automatizados como lo analizó Pablo A. González para El gato y la caja. […]

  73. Alvaro E. Pedraza

    Excelente análisis de datos. Hace falta mucho más análisis de este tipo. Para pensar y pensarnos. Mis respetos desde Tucumán, de parte de un ingeniero en computación que le gusta el data mining y el análisis

  74. ZTF

    Che pero es de pelotudo tu analisis, te vas por el camino de cuentas fakes, sabes cuantas miles de fakes hay a favor de conicet? sabes cuantos perfiles de facebook con fotos robadas hay?

  75. Hugo

    Una sola¿Milstein Cesar investigaba en el conicet?Ok bajemos el prsupuesto.Ah, sociologia no sirve dijeron algunos por ahi,este trabajo fue realizado por sociologas.Gracias mil

  76. Laura

    Me parece que ésta es una de las encrucijadas que plantea al concepto mismo de ‘verdad’ a la forma social ‘democracia’ donde hay representación por mayoría y minorias proporcionales relativas a cantidades de votos directos o electores.
    Una discusión que se da en cualquier mesa bien intencionada ante cualquier tema del que se pretenda encontrar una salida alternativa que conduzca a otro ‘estado’. Y tomando en cuenta, en la medida de mis posibilidades, los varios planos semánticos de ese término: Reducir el estado de cosas, el estado del arte, el estado social, confrontado el individuo al colectivo.
    Creo que la singularidad de este momento sociopoliticocultural, coyuntural o histórico es ese: El Uno/El Todo.
    La radicalización del individuo sobre el ambiente, siendo esta radicalidad caprichosa y no racional. La parte individuo, sea uno o grupo, imponiendo, dominando, sometiendo al ambiente, social o natural.
    Ambiente entrampado ante el número abrumador de la mayoría obtenida a cómo de. Aún a costa de la misma mayoría que lo sustenta.
    Creo que también se alteran las representaciones mismas de lo espacial y temporal. Coordenadas en las que un sujeto se sustenta e instituye.
    ¿A qué temporalidad remite el denodado afán de manipulación y concentración del poder si conduce a la desintegración y la destitución del fundamento mismo de lo social humano?
    ¿A que espacialidad remite la explotación, exfoliación, expropiación de la tierra y la diversidad?
    …me fui =(

  77. Mariano Roger

    Muy interesante analisis! Tengo un par de dudas (aclaro que no soy experto en este tema):

    1. como se define la distancia entre 2 nodos particulares del cluster?
    2. El “%de postura” en funcion de los dias esta normalizado por el numero de tuits? Mas aun, si agarras los mismos usuarios y miras el numero de tuits 10 dias antes del intervalo considerado, se ve la misma dinamica? Creo que haciendo algun tipo de normalizacion con dichos datos podrias responder la pregunta de si ese grafico refleja la expresion de una postura de un grupo y no simplemente el uso de twitter…

    Concluir que estos datos reflejan una operacion organizada en contra de Conicet, mas que una conclusion es una posible (simple) interpretacion. Y lo digo, porque: no hay que subestimar al enemigo ;)

    Saludos!

  78. Gigi

    El tema es que no sabes como funciona twitter hermano, por eso esta barbaridad de hipótesis tendensiosas.
    Es un lindo papper, llevarlo al CONICET, capaz debamos pagar esta inutilidad entre todos.

  79. Leandro

    Disculpen la molestia, quisiera saber (si alguien sabe) que paso con los recortes que querían hacer sobre la ciencia y tecnología en el conicet. Muchas gracias!


Publicar un nuevo comentario