Saltar al contenido
Noticias de tecnologia

Solo el 66% usa el campo de ubicación del perfil de Twitter según lo previsto, según un estudio de investigación de PARC

La corte refuta la afirmación de que las fotos en Twitter son gratuitas para tomar

El Palo Alto Research Center (PARC) acaba de publicar el primer estudio de investigación en profundidad de usuarios sobre el uso del campo “Ubicación” en los perfiles de Twitter. Con un tamaño de muestra de 32 millones de tweets en inglés en la mano, el becario de verano de PARC, Brent Hecht, seleccionó un grupo de 10,000 usuarios activos para estudiar. Sorprendentemente, descubrió que el 34% de los usuarios de Twitter no proporcionan una ubicación geográfica válida en sus perfiles de usuario de Twitter. En cambio, algunos de estos usuarios optan por el campo para hacer bromas, expresar su amor por una celebridad en particular o gritar en Twitter que su ubicación es “¡NO EMPRESA!” Otros, mientras tanto, no proporcionan ninguna información de ubicación.

Para cualquier servicio relacionado u otro estudio de investigación que aproveche este campo para determinar la ubicación real de los usuarios de Twitter, la implicación es obvia. Sin analizar primero los tweets para eliminar aquellos que no usan el campo de ubicación como se esperaba, los datos de muestra podrían estar corruptos. PARC ya encontró un estudio donde ese fue el caso.

Para realizar su análisis, los investigadores de PARC recopilaron 32 millones de tweets en inglés de la fuente de muestra Spritzer, una fuente del 1-2% de todos los tweets, seleccionados al azar y entregados en tiempo real. Los tweets fueron creados por 5,282,657 usuarios individuales de Twitter. Se seleccionó una muestra aleatoria de 10,000 usuarios activos (aquellos que tienen más de cinco tweets en el conjunto de datos) del feed. Luego, de ese grupo, los investigadores extrajeron y examinaron el campo de ubicación.

66% informa la ubicación, pero eso no significa “ciudad, estado”

Solo el 66% de los usuarios de Twitter habían ingresado algún tipo de información geográfica válida en este campo, y el término válido se utiliza aquí de manera vaga. Por ejemplo, los investigadores incluyeron a alguien que escribió que era de “kcmo – call da po po”, como si hubiera ingresado una ubicación geográfica válida: Kansas City, Missouri. También incluyeron a aquellos que simplemente compartieron de qué continente eran o aquellos que proporcionaron un nombre de ciudad falso (por ejemplo, “Bieberville”) junto con un estado real de EE. UU. (“California”).

En realidad, el porcentaje real de quienes proporcionaron una verdadera combinación de ciudad / estado fue mucho menor, pero PARC no especificó cuánto.

Localización: “El corazón de Justin Bieber:” Bromas y otros sentimientos encontrados en el campo Ubicación

Del 34% que no proporcionó información de ubicación real, se detectaron una serie de tendencias. Una fue que el campo se usaba a menudo para denotar el aprecio por una celebridad en particular. Las celebridades que los investigadores encontraron aquí incluyeron a Britney Spears, los Jonas Brothers, Jedward y, por supuesto, encabezaron las listas con 61 usuarios que lo mencionaron, Justin Bieber.

Otra tendencia común era utilizar el campo de ubicación para expresar el deseo de mantener la privacidad de esa información mediante el uso de frases como “no te lo digo”, “no es de tu incumbencia”, etc. También frecuentaban este campo los insultos (“menospreciarte personas ”), ubicaciones fuera de la Tierra (“ fuera del espacio ”), contenido sexual, bromas e incluso una expresión sobre cuánto alguien odiaba su ubicación actual. (por ejemplo, un usuario dijo que era del “infierno campesino sureño”).

Qué significa esto para los investigadores que analizan datos de Twitter

Sin embargo, ese no fue el final del estudio PARC. Los investigadores también introdujeron la parte de su conjunto de datos (el 16% que no había proporcionado una ubicación válida) en Yahoo! Geocoder, una herramienta que convierte nombres de lugares y direcciones en coordenadas de latitud y longitud. En lugar de devolver errores, Yahoo! El geocodificador proporcionó coordenadas para el 82,1% de los datos. Por ejemplo, se determinó que “la Tierra Media” estaba al norte de Lubbock, Texas, “BieberTwon” está en Missouri, “en algún lugar sobre el arco iris” está en el norte de Maine y “dondequiera que esté tu mamá” está en el suroeste de Siberia.

? Lo que esto significa, por supuesto, es que los estudios de investigación que simplemente ingresan un conjunto de datos de Twitter en un geocodificador tendrán resultados corruptos. Los geocodificadores asumen que toda la información que reciben es geográfica, por lo que intentarán ubicar estas coordenadas. Para determinar con precisión la ubicación a partir de un conjunto de datos de tweets, los datos deben ser procesados ​​previamente por un analizador geográfico para separar la información geográfica de la información no geográfica.

Desafortunadamente, no todos los estudios de usuarios de Twitter han hecho esto. Un conocido estudio de investigación de 2007, “Por qué Twitter: comprensión del uso y las comunidades de microblogging” de Akshay Java, Xiaodan Song, Tim Finin y Belle Tseng, no utilizó un geoparser, encontraron los investigadores de PARC. (Consulte la cobertura en ZDNet, SmartMobs o EdTechTalk para obtener más información sobre ese estudio).

Aunque eso no necesariamente desacredita todos los hallazgos del estudio, también analizó una serie de tendencias, desde el tipo de actualizaciones de Twitter (enlaces, charlas, respuestas) hasta categorías de usuarios de Twitter (fuentes de información, buscadores de información, amigos) también. se debería notar.

Más información sobre la investigación de Twitter de PARC está disponible aquí.