Pages

Monday, January 30, 2017

Análisis de sentimientos en Redes Sociales sobre la conferencia Habitat lll, “Cumbre de ciudades, sobre Vivienda y Desarrollo Sostenible”

Universidad Colegio Mayor de Nuestra Señora del Rosario
Facultad de Ciencia Política y Gobierno y de Relaciones Internacionales
Programa de Gestión y Desarrollo Urbanos
Materia: Investigación en Operaciones Urbanas
Estudiante: Paula Juliana Salazar Becerra
            Laura Ximena Rojas Calderón
Noviembre 22 de 2016


  1. Introducción
El presente trabajo tiene la intención de identificar los usuarios más relevantes e influyentes en la red social twitter durante los 4 días de Hábitat 3 y los principales temas que abordaron en sus tweets. Para identificar a los usuarios participantes durante el evento realizado en Ecuador, se tuvo en cuenta su número de menciones y retweets por medio de un análisis de redes en gephi. Los principales temas abordados por cada usuario se pudieron encontrar utilizando una herramienta para generar nubes de palabras que evidenciaban sus intereses.
Para hacer más clara la investigación, gephi es una herramienta de visualización de redes o una plataforma interactiva de código abierto que permite la visualización y exploración de todo tipo de redes y sistemas complejos por medio de gráficos dinámicos y jerárquicos. Para descargar las bases de datos de los 3 días de Hábitat 3 en twitter, se hizo uso de la herramienta IFTTT, que significa “If This Then That” y es un servicio que permite programar tareas rutinarias y sencillas a partir de las bases de datos de redes sociales conocidas como twitter.
  1. Revisión de literatura

    1. Minería de datos
Para un mejor entendimiento del trabajo, fue pertinente la realización de un estado del arte acerca de los conceptos principales, es decir, minería de datos, social network analysis, y Hábitat 3. Para comenzar, la minería de datos, también conocida por algunos autores como el descubrimiento de conocimiento en bases de datos, implica métodos que buscan nuevas y generalizables relaciones y hallazgos, en lugar de intentar probar hipótesis anteriores (Collins, Schapire y Singer, 2004).
Mientras que algunos estadísticos utilizan el término "minería de datos" de manera peyorativa, para indicar la búsqueda sin premisas de hipótesis y la pretensión de que estas hipótesis fueron investigadas aisladamente, la minería de datos como un área de métodos tiene una historia extendida que se remonta a datos exploratorios (Tukey, 1977) y ha establecido métodos para determinar la validez y la generalización.
Distinto a lo anterior, para Harnett la minería de datos se refiere al análisis sin hipótesis de datos archivados o “big data” con la esperanza de descubrir patrones interesantes dentro de los datos (2016, pág 142) y relacionado con esto, para Peral y otros autores, la minería de “big data” es la capacidad de extraer información útil de unas grandes bases de datos y unas nuevas técnicas de minería de datos son necesarias debido al volumen, variabilidad, y velocidad de dichos datos (Peral et al; 2016; pág. 56).
Dicho concepto ha estado recibiendo bastante atención, en parte debido a la enorme cantidad de datos que se producen como resultado del almacenamiento de información sin costo y a la facilidad con la que dichos datos pueden ser recolectados, navegando en internet o en los teléfonos celulares (Brandeisky, 2015).  
San Tay & Peng Sik mencionan que la minería de datos hace referencia al proceso de utilizar técnicas de software para analizar grandes cantidades de datos con el fin de descubrir información útil. La información suele estar en forma de patrones o relaciones que de otro modo no se observarían si son escaneadas por el ojo humano y por lo tanto es útil para muchas industrias en la predicción de tendencias futuras.
Para éstos autores, la minería de datos implica la reproducción de bases de datos y, en consecuencia, plantea problemas de derechos de autor y además, cuenta con técnicas diferentes ofrecidas por la tecnología y debe haber una etapa de pre-procesamiento que implica una limpieza de datos para eliminar los que sean inconsistentes (Tay, Sik; 2016; 899).
    1. Análisis de Redes Sociales
Ahora bien, respecto al concepto Social Network Analysis, para Sapountzi & Psannis, es un término que abarca un análisis descriptivo y basado en la estructura, similar a un análisis estructural. En tal sentido, para entender la estructura de la red es importante obtener información sobre cómo funciona dicha estructura y tomar decisiones sobre ella examinando sus características de nodos y links/enlaces. La comparación de las redes, el seguimiento de los cambios en una red a lo largo del tiempo, la revelación de comunidades y nodos importantes y la determinación de la posición relativa de individuos y clusters en una red son algunos de sus procedimientos comunes.
Todo lo anterior abarca un análisis estadístico y dinámico. Sapountzi & Psannis mencionan que un análisis estadístico presume que una red social cambia gradualmente con el tiempo, mientras que el análisis dinámico, que es más complejo, abarca datos de transmisión que están evolucionando en el tiempo a una tasa alta.  
Salamati & Soheili, establecen de forma más específica que el Social Network Analysis es un paradigma que analiza los patrones estructurales en las relaciones sociales, que proporciona métodos para explicar y probar el proceso de intercambio de conocimientos e identifica los cuellos de botella en los flujos de información (2015; 264).
Ahora bien, Michael Lieberman menciona que el análisis de redes sociales considera las relaciones sociales en términos de teoría de red, que consiste en nodos (que representan a actores individuales dentro de la red) y vínculos (que representan relaciones entre los individuos, tales como amistades en Facebook, correspondencia por correo electrónico, hipervínculos o respuestas de Twitter) Estas redes se representan a menudo en un diagrama social de la red, donde los nodos se muestran como puntos y los vínculos como líneas.
    1. Habitat lll
La Fundación de las Naciones Unidas para el Hábitat y los Asentamientos Humanos nace el 1º de enero de 1975, siendo el primero órgano oficial de la ONU; en ese entonces su tarea consistía en “ayudar a los programas nacionales sobre asentamientos humanos mediante la provisión de capital y asistencia técnica, en particular en los países en vías en desarrollo.” (UNHabitat, s.f.). La primera conferencia de las Naciones Unidas dónde se reconoció la urbanización como un desafío de la humanidad, se llevó a cabo en 1976 en Vancouver, Canadá. “Esta conferencia, Hábitat I, resultó en la creación, el 19 de diciembre de 1977, de los precursores de ONU-Habitat: la Comisión de las Naciones Unidas de Asentamientos Humanos (un órgano intergubernamental) y el Centro de las Naciones Unidas para los Asentamientos Humanos (comúnmente llamado Hábitat), que funcionó como la secretaría ejecutiva de la Comisión.” (UNHabitat, s.f.). En 1996, se celebró una segunda conferencia sobre las ciudades,” Hábitat II”, en Estambul, Turquía, para evaluar los 20 años de avances desde Hábitat I, y para establecer los nuevos objetivos para el nuevo milenio. En dicha conferencia se firmó el primer documento político “Agenda Hábitat” que fue aprobado por 171 países y tendría una vigencia de 20 años hasta el 2016, fecha en la cual se celebró la tercera Cumbre de Ciudades Sobre Vivienda y Desarrollo Sostenible, Hábitat 3.
En la conferencia Hábitat 3 celebrada en octubre de 2016 se establecieron ciertos acuerdos para superar las principales dificultades que presentan las ciudades hoy en día. Varios de estos retos son: la eliminación de la pobreza en los asentamientos urbanos, la disminución de la brecha de desigualdad urbana, el establecimiento de modelos de gobernanza multinivel y el papel del ciudadano en la construcción de ciudad.
  1. Hallazgos

    1. Primer día de hábitat 3, 17 de Octubre de 2016
Para el primer día de hábitat 3 se encuentra que la red estaba bastante dispersa, si bien habían varios usuarios conectados entre ellos. Se encontraron varios nodos como el que se presenta en la Imagen 1 y su distribución gráfica se puede observar en la Imagen 2.
Algunos de los usuarios más importantes en éste día fueron HabitatIIIQuito, Habitat3UN, y WHO. El primero mencionaba dentro de sus caracteres palabras como Habitat3, Presidente, Exposición, ciudades, recorrido, gabellones, visitantes e histórico (Imagen 3); en Habitat3UN, se encontraron palabras como New Urban Agenda, housing, urban, poverty, tool, development, y H3UrbanTalk (Imagen 4); y en WHO se mencionaban palabras claves como air pollution, Breathelife, middle-income, inequalities, live, people y  climate (Imagen 5), y resulto interesante el encontrar que se ubicaba bastante alejado de la red o el nodo principal.
El análisis de redes descubrió que usuarios como InclusionEc, que representaban a Hábitat III Alternativo, formaba un nodo unido al principal pero aparte de los usuarios partidarios de dicho evento, probablemente por establecer una crítica hacia éste.
    1. Segundo día de Hábitat 3, 18 de Octubre de 2016
La red del segundo día era mucho más compacta y todos los usuarios estaban conectados entre ellos, a diferencia de la red del primer día (Imagen 6). El análisis de redes encontró que los usuarios más influyentes seguían siendo HabitatIIIQuito,y  Habitat3UN. Sin embargo, pareció interesante investigar acerca de usuarios como LA_PAH y Ambiente_Ec. El primero corresponde a una plataforma de afectados por la hipoteca en España y las palabras más repetidas en sus tweets fueron Vivienda, mentira, desmontamos, salimos, y popular (Imagen 7). Ambiente_Ec, el ministerio de ambiente de Ecuador,  tweeteaba acerca de la nueva agenda urbana, sostenibilidad, ciudades, humanidad y vivienda.
    1. Tercer día de Hábitat 3, 19 de Octubre de 2016
La red del tercer día, se caracterizó, al igual que la del segundo día, por ser más compacta y densa. Los usuarios más influyentes en este día fueron @WalterGarciaArq, @Who y @RosarioRobles. Estos 3 usuarios durante este día enviaron tuits sobre temas ambientales. En este día también se logró observar la existencia de varios nodos por fuera de la red principal; es decir, que habían varios usuarios que tuiteaban sobre Hábitat lll, pero no tenían relación alguna con el evento.
    1. Cuarto día de Habitat 3, 20 de Octubre de 2016
El último día fue el de mayor participación, con una base de datos de más de 5.000 usuarios. Ésta red fue la más compacta y compleja de los 4 días (Imagen 10) y alrededor del nodo principal, se formaba un círculo representando la influencia de los usuarios que se encontraban dentro de él.
En éste día se analizaron algunos usuarios como DNP_Colombia, AFE_Colombia, WWFColombia, y savechcolombia. Se encontró que su participación en el día más importante de Hábitat3 fue casi nula, y las palabras más relevantes dentro de sus tweets fueron  sostenibilidad, ambiental, rural y urbano (Imagen 11).
Conclusiones
Luego de un análisis de sentimientos en twitter sobre Habitat 3, se puede decir que con respecto a los temas abordados en la nueva agenda urbana, los usuarios identificados no se encontraron muy interesados en temas de gobernanza, desarrollo económico local y educación. Los temas principales se relacionaban con vivienda, salud, y transporte.
Igualmente, el centro de la red para los 4 días se encontraba siempre en el twitter de instituciones importantes como HabitatIIIQuito, y Habitat3UN. Además, los usuarios con mayor número de retweets eran o instituciones internacionales, o funcionarios públicos. Por ejemplo, uno de los usuarios más activos e influyentes en las redes de cada día, fue Rosario_Robles_, secretaria de desarrollo agrario, territorial y urbano de México.
Finalmente, si bien el análisis redes se hizo por medio de una base de datos generada a partir del Hashtag #Habitat3, fue posible identificar a algunos usuarios partidarios del Hábitat 3 Alternativo. Éstos se encontraban cerca de algún nodo importante, pero aparte del nodo principal de la red.

Por otro lado, este experimento de redes, logró realizar un acercamiento a conocer quiénes son las personas más influyentes en temas urbanos, y, en este caso, cuáles son los temas de mayor interés, según la medición de las redes y la centralidad de los tuits. Si bien, el caso de la conferencia Habitat lll permitió ver diferentes aspectos importantes en los temas urbanos, es válido recalcar que es necesario seguir haciendo este tipo de estudios con casos que complementen el anterior experimento, como la revisión de la red de la Post-Agenda Habitat lll o las conferencias venideras, como el Foro Nacional Urbano, o, El Foro Urbano Mundial 9.







BIBLIOGRAFÍA

Slater,S; Joksimovié, S; Kovanovic, V; Baker, R; Gasevic, D (09/2016) Journal of Educational and Behavioral Statistics: “Tools for Educational Data Mining: A Review”
Collins, M., Schapire, R. E., & Singer, Y. (2004). Logistic regression, Adaboost and Bregman distances. Machine Learning, 48, 253–285.
Tukey, J. W. (1977). Exploratory data analysis. Reading, MA: Addison-Wesley
Hernett, J (2016) Society for the teaching of psychology: “Using Data Mining To Teach Applied Statistics and Correlation”.
Brandeisky, K. (2015, February). Your embarrassing online searches about health problems aren’t private. Time. Retriev
Sapountzi, A; Psannis, K. University of Macedonia, Department of Applied Informatics, Thessaloniki, Greece: “Social networking data analysis tools & challenges”.
Salamati,P; Soheili,F (2015). Chinese Journal of Traumatology: “Social network analysis of Iranian researchers in the field of violence”
Lieberman, Michael. Visualizing Big Data: Social Network Analysis.  
Peral, J; Maté, A; Marco, M (2015). Computer Standars & Interfaces: “Application of Data Mining techniques to identify relevant Key Performance Indicators”







Anexos

Imagen 1                                                                             
                      
Imagen 2










Imagen 3
Imagen 4


Imagen 5

Imagen 6             
Imagen 7
Imagen 8

Imagen 9
Imagen 10
                                      
Imagen 11


No comments:

Post a Comment