lunes, 3 de octubre de 2011

La Red de Subte de la Ciudad de Buenos Aires: Distancia entre Nodos y Betweenness Centrality

Distancia entre nodos
La distancia d(u,v) entre nodos en un grafo finito se mide como la longitud mínima de enlaces necesaria para conectar los nodos u y v. Así, por ejemplo, entre la estación de subte Constitución de la línea C y Humberto 1° de la línea H, la distancia mínima es 8 enlaces. La matriz de distancia de la red del subte contiene todas las distancias mínimas entre los distintos nodos de la red. Esa matriz reúne las 5776 combinaciones posibles con los 76 andenes que posee el subte de la Ciudad de Buenos Aires. El menor trayecto posible es 0; eso ocurre cuando medimos la distancia de una estación respecto de sí misma. El trayecto más largo, en esta red, es entre Plaza de los Virreyes y Congreso de Tucumán. Para unir esas dos estaciones es necesario transitar 30 enlaces. Con la información que nos otorga la matriz de distancia podemos generar la distribución de frecuencia de distancia entre nodos. En el siguiente gráfico se enseña esta misma información. En esta red el promedio de enlaces necesarios para unir dos estaciones cualesquiera es 10,79 y el valor que más se repite es 8.

Betweenness Centrality
La betweenness centrality es un instrumento de medición que permite establecer la importancia de cada nodo de la red. La importancia de los nodos se establece en función de las distancias mínimas y la frecuencia en que aparece cada nodo en cada uno de los senderos más cortos. Cuanto mayor es el valor de betweenness centrality asociado a un nodo, mayor será el poder que tendrá para controlar o modificar el mensaje dentro de la red. En el caso del subte de Buenos Aires las estaciones 9 de Julio, Avenida de Mayo y Diagonal Norte tienen los valores más altos de betweenness centrality. Esas estaciones se encuentran, más que ninguna otra, en mayor cantidad de caminos más cortos. Por ejemplo, para ir de Plaza Italia a Entre Ríos, es necesario pasar por alguna de estas 3 estaciones. En cambio las estaciones de los extremos, como son Retiro, Plaza de Mayo, Alem o Plaza de los Virreyes reciben los valores más pequeños. La capacidad que tienen estas últimas estaciones de interrumpir la transmisión de un mensaje es nula. 

Datos
En la tabla se pueden ver las métricas que obtuvieron respecto de PageRank, Betweenness Centrality y Distancia promedio cada uno de los nodos de la red. El PageRank está calculado con una probabilidad de teleportación igual a 0. La distancia promedio indica el promedio de enlaces mínimos necesarios para conectar ese nodo con el resto de los nodos. Y, por último, el Betweenness Centrality está calculado en su forma original.

1 comentario:

Julián Rodriguez Orihuela dijo...

Acá claramente te conviene hacer un mapa de calor con todas las estaciones mostrando más intensas las más usadas.