Saltar al contenido
Noticias de tecnologia

Evolución de una revolución: visualización de millones de tuits de Irán

Estimado CNN, consulte Twitter para ver noticias sobre Irán

En su apogeo, una búsqueda de “Irán” en Twitter generó más de 100,000 tweets por día y más de 8,000 tweets por hora. El gráfico que se muestra a continuación muestra el crecimiento en volumen de información en el número de tweets por hora.

¿Cómo puede un adicto a Internet, una organización de noticias o un agente político monitorear los eventos en tiempo real que evolucionan rápidamente, desde los detalles cruciales hasta el panorama general? Más importante aún, ¿cómo se puede convertir un flujo de datos en acción en tiempo real, llegando a las personas que lo necesitan, cuando lo necesitan y en una forma que puedan digerir fácilmente?

Visión general

La proliferación de motores de búsqueda en tiempo real y monitores de tendencias (a veces denominados “plataformas de escucha”) hasta ahora ha hecho poco para abordar problemas de esta escala e importancia. Esto se debe a que no proporcionan contexto, es decir, muestran cómo una nueva información es relevante para lo que hemos visto antes y dónde encaja en el espacio de posibilidades y relaciones.

Por ejemplo, si usted es un director de programación de CNN y trata de discriminar entre noticias importantes y memes de Internet, el simple hecho de saber que #iranelection es un tema de tendencia no le dice su relación con otros temas o qué comunidades lo están impulsando, ambos factores críticos. .

Un área prometedora son las interfaces de usuario orientadas a datos: análisis de datos y algorítmicos en el back-end y visualización y navegación directas en el front-end. Esta es la siguiente etapa de la información social, rebanar y cortar, mezclar y combinar, interpretar y analizar, completamente a pedido. En este nuevo panorama, los datos es La interfaz.

No se trata solo de sentarse y mirar imágenes bonitas. Se trata de dejar de lado las metáforas obsoletas de la interfaz de usuario y obtener una interfaz humana tan simple como sea posible para la computación. Wolfram-Alpha, lanzado recientemente, aplica este principio a los datos estructurados. (Divulgación: yo era miembro del equipo central de Wolfram-Alpha y puedo continuar consultando con Wolfram Research).

La transmisión de datos en tiempo real ofrece posibilidades y oportunidades similares. En este sentido, describamos algunas ideas y métodos básicos para dar contexto a las corrientes.

La historia computacional de #iranelection

En el nivel más abstracto, la historia y la computación son lo mismo: la evolución de los sistemas a lo largo del tiempo. Twitter tiene varias propiedades notables que nos permiten finalmente aprovechar esta correspondencia de manera tangible. La sencillez de sus datos, la apertura de su sistema y su extrema resolución temporal nos permiten detectar átomos de la historia, esos momentos en los que algo se dispara y la sociedad se reconfigura muy levemente.

Mire las gráficas de ancho de banda a continuación. Representan el volumen relativo de diferentes frases relacionadas con Irán en Twitter a lo largo del tiempo. Su característica más llamativa es lo discretos y puntiagudos que son: un signo revelador de un sistema computacional orgánico.

El primer par de términos compara el ancho de banda de las menciones “Ahmadinejad” y “Khamenei”, respectivamente. La evolución del levantamiento al más alto nivel de abstracción social se muestra con notable claridad: pasando de una disputa sobre el proceso electoral que involucra a Ahmadinejad (en rosa) a una disputa por la autoridad que involucra al líder supremo Khamenei (en rojo).

No solo obtenemos la esencia de la evolución, también vemos sus detalles y relaciones con otras subestructuras sociales. Por ejemplo, mirando la segunda trama, vemos una correlación entre las menciones de la milicia Basij y los informes de muertes; y ese repunte inicial en las menciones de Khamenei corresponde al repunte en las menciones de Basij, presagiando la represión posterior.

Esta idea de la historia computacional se aplica a los eventos que Twitter no solo informó, sino que también moldeó y alojó. Un diagrama más abajo compara la discusión centrada en Twitter de #cnnfail con la distribución de IP de proxy de Twitter que permitieron que la información continuara fluyendo fuera de Irán. ¿Es una coincidencia que estos dos términos se fusionen sin problemas? ¿Y qué pasa con el gran aumento en las menciones de la distribución proxy que coincide con los primeros informes de violencia?

Computación con estructuras sociales

Simplemente rastrear el volumen de varias frases nos da una idea de lo que está sucediendo en la calle, literal y figurativamente. Pero esa señal no es más que una sombra de una realidad mucho más compleja e intrincada, una red entretejida de individuos y acciones.

Twitter permite que estas estructuras sociales se conviertan en estructuras de datos mediante la convención “RT”. Y esto, a su vez, nos permite realizar cálculos extremadamente poderosos sobre las estructuras sociales que subyacen al flujo de información.

Los algoritmos de diseño de red son un ejemplo familiar, poderoso y fascinante. Se autoorganizan en su computadora para revelar la autoorganización en el mundo real. Y ese es exactamente el tipo de herramienta que necesitamos para probar nuestra hipótesis sobre #cnnfail.

El gráfico a continuación muestra la red de personas que volvieron a tuitear menciones de proxies de IP, con aquellos que tuitearon anteriormente sobre #cnnfail resaltados. No solo vemos una superposición significativa entre las personas involucradas, sino también una estructura considerable en las relaciones entre ellas. Hemos capturado una comunidad real en el momento de su nacimiento.

Recuerde esto mientras observa el siguiente diagrama a continuación. Aquí, vemos la red de re-tweets que se formó alrededor de los cinco principales tweets iraníes. Su estructura muestra un fenómeno muy diferente, capturando el surgimiento no de una comunidad sino de una élite. A pesar del interés masivo, o quizás debido a él, la mayoría de la gente no descubrió a más de uno de los principales iraníes. La red simplemente creció más rápido de lo que la información podía propagarse de forma natural. Pero un pequeño círculo interno logró identificar las fuentes centrales de información.

El gráfico final a continuación muestra otra estructura de comunidad, así como una nueva técnica algorítmica. Esta trama no muestra el surgimiento de una nueva comunidad, sino que muestra la apropiación de un nuevo tema por parte de facciones políticas maduras. Esta red de re-tweets se ha formado en torno a tweets iraníes que mencionan a Obama. Usando la teoría de grafos, podemos extraer computacionalmente las sub-comunidades y luego usar esa información para colorear la red. La gran masa azul de la derecha es la conservadora Twittersphere, mientras que las otras estructuras son una colección menos organizada de medios de comunicación convencionales o progresistas.

Algoritmos y cambio social

¿Expresarán los futuros presidentes objetivos estratégicos en términos de la teoría de grafos de Twitter? Eso es casi una certeza.

El propósito de estos cálculos es doble: primero, contextualizar la información de todo el tiempo y el espacio en términos que sean accesibles para los humanos; y en segundo lugar, destilar ideas abstractas en forma procesable.

Twitter es una plataforma para lograr estos dos propósitos en los asuntos humanos: detectar redes de propagación de información y erigir nuevas redes para remodelar los cálculos sociales emergentes. Este es el núcleo del valor social y empresarial de Twitter. Si tuviéramos que jugar ese antiguo juego de “Adivina el modelo de negocio”, miraríamos aquí primero.

Cómo descubrir y desplegar algorítmicamente estructuras sociales novedosas es quizás la cuestión de los mil millones o billones de dólares. Con Twitter, los datos y la API están en su lugar. Y si la historia de la computación sirve de guía, una vez que la programación de un sistema se vuelve posible, pasar de un hack a una aplicación a una plataforma es solo cuestión de tiempo.

Autor invitado: Kovas Boguta es cofundador de Infoharmoni, una startup sigilosa que crea interfaces de conocimiento computables para conjuntos de datos en tiempo real. Acaba de regresar del Foro de Democracia Personal de la semana pasada, donde la discusión sobre el levantamiento iraní ocupó un lugar central.