lunes, 28 de noviembre de 2011

Usuarios de Internet en Argentina por Provincia a Octubre de 2011


Usuarios de Internet en Argentina
Según Comscore, líder mundial en mediciones del mundo digital, en octubre de 2011 había 13.277.000 usuarios únicos de Internet en la Argentina. Resulta difícil encontrar estadísticas que indiquen cuántos usuarios hay de Internet en la Argentina por cada provincia. En cambio, hay varias mediciones sobre la cantidad total de usuarios de Internet en nuestro país. Por ejemplo, de acuerdo al Banco Mundial, en el 2009 el 30% de la población argentina estaba conectada a Internet (ver gráfico abajo). Esto es cerca de 12 millones de personas. Otras estimaciones establecían que en el 2007 Argentina tenía 16 mlls de usuarios (1). El sitio argentina.ar del Gobierno Nacional recientemente publicó una noticia que establecía en 21 mlls la cantidad de internautas argentinos (2).



De acuerdo a la American Registry for Internet, en la Argentina hay 13,8 mlls de IP´s. La IP es única por cada dispositivo que se conecta a la Web. El número de IP´s podría usarse como aproximado de la cantidad de usuarios de Internet. Sin embargo, hay que tener presente que varias personas pueden usar una misma computadora, por lo tanto habrían más usuarios que cantidad de IP´s. Y, también, hay servidores y otros dispositivos que se conectan a Internet y que no son utilizados por humanos, lo cual nos haría sobreestimar la cantidad de usuarios. Teniendo en cuenta estas salvedades, la cantidad de IP´s puede servir como una variable aproximada a la cantidad de usuarios de Internet.

El problema de determinar la cantidad de usuarios de Internet está en la definición. ¿Quién es un usuario de Internet? ¿El que navegó alguna vez? ¿El que navega todos los días? ¿El que tiene un dispositivo con acceso a Internet? Ese no es el único problema, también está el problema del método. Por ejemplo, la metodología de Comscore para determinar la cantidad de usuarios se basa en una gran cantidad de parámetros. Esos parámetros son analizados con criterios biométricos para identificar los comportamientos humanos de los realizados por máquinas. Por ejemplo, la forma en que realizan los clics, cómo mueven el mouse, etc. De los demás estudios desconozco qué metodología usan. Por esa misma razón es que para determinar la cantidad de usuarios de Internet por provincia me baso en las estimaciones de Comscore.

Cantidad de usuarios de Internet en Argentina por provincia
Más del 90% de los usuarios de Internet en Argentina usan alguna herramienta de Google. En otras palabras, casi todos los navegantes argentinos pasan alguna vez en el mes por el buscador de Google o por Youtube. Cada vez que pasan por alguno de esos sitios una cookie se guarda en la computadora del usuario. Esa cookie permite distinguir al dispositivo que pasó y/o que vuelve al sitio. Dada la gran penetración que tiene Google, la cantidad de dispositivos inseminados con esas cookies permite tener una aproximación muy certera de dispositivos que se conectan desde la Argentina.

El acceso a la información de Google desagregada por provincia me habilitó a aplicar esa distribución al total de 13,2 mlls de usuarios de Internet determinado por Comscore.
Por otra parte, el Indec genera estadísticas cada 3 meses de cantidad de conexiones a Internet por provincia. Los datos incluyen las conexiones desde hogares y desde las empresas. El criterio del Indec es considerar que hay una conexión por cada relación contractual existente entre una persona y un proveedor de servicios de Internet. En junio de 2011 había 6.441.330 conexiones desde hogares y 986.628 desde organizaciones. Lo que hace a un total de 7.397.958 conexiones. (3)

Con la información de Google de cookies por provincia y con los datos del Indec pude realizar tres estimaciones sobre la cantidad de usuarios de Internet por provincia en Argentina. La estimación “Google” consiste en aplicar al dato de Comscore la distribución de las cookies por provincia. Mientras que las estimaciones basadas en los datos del Indec distribuyen los 13,2 mlls de usuarios de acuerdo a 1) la cantidad de conexiones por hogares y 2) la cantidad de conexiones totales (hogares más organizaciones) por provincia. La tabla expuesta a continuación exhibe los datos de las tres estimaciones. (4)

Usuarios de Internet por provincia en Argentina a octubre de 2011:
Según estas estimaciones, entre el 62% y el 69% de los usuarios de Internet se encuentran en la zona Provincia de Buenos Aires más Ciudad de Buenos Aires.

Un problema serio de consistencia de estas tres estimaciones es que la Ciudad de Buenos Aires tiene una penetración de Internet (i.e. Usuarios de Internet / Población Total) superior al 100%. La estimación más baja da una penetración del 139%. Es interesante notar que esta incoherencia también se da con los datos de cookies únicas de Google. Quizás esto esté relacionado a la mala asignación de las IP en la Argentina que no permite saber con exactitud desde qué locación se está conectando el usuario. También es posible que debido a que muchas personas viven en Prov. de Buenos Aires pero trabajan en la Ciudad, se genere un solapamiento en el conteo de cookies.

El resto de las provincias obtienen una penetración consistente con su población (ver mapa inicial). Si dejamos de lado a Ciudad de Buenos Aires, según las estimaciones realizadas con los datos del Indec, Tierra del Fuego (59%), Chubut (34%), Neuquén (33%), Córdoba (33%) y Santa Fé (32%) tienen las mayores tasas de penetración. Mientras que la estimación realizada con los datos de Google ubica en el Top 5 a Santa Fe (44%), Santa Cruz (41%), Córdoba (32%), Neuquén (29%) y Buenos Aires y Mendoza con 25%.


Modelo explicativo de la cantidad de usuarios por provincia
Con el fin de evaluar la coherencia de los datos y a modo explorativo armé un modelo predictivo que relaciona la penetración de Internet en cada provincia con a) el porcentaje de hogares con necesidades básicas insatisfechas (NBI) b) la población total de la provincia y c) una variable de densidad.

Es de esperar que exista una relación negativa entre el porcentaje de hogares con NBI y la cantidad de conexiones a Internet. Una mayor población de bajos ingresos tiene menos posibilidades de adquirir servicios de este tipo.

La población total de la provincia debería correlacionar positivamente con la cantidad de usuarios. Donde hay más población es más factible que haya más consumidores capaces de adquirir el servicio. Además, esta variable está relacionada con la masa crítica necesaria para que las empresas de Internet estén dispuestas a realizar la inversión para proveer el servicio.

La variable de densidad es el cociente entre el departamento que más viviendas tiene, dentro de cada provincia, respecto del total de viviendas censadas en toda la provincia. Debido a que los costos de distribuir el tendido de fibra óptica aumentan cuanto más disperso están los potenciales usuarios, es esperable que a mayor concentración de viviendas, más conexiones de Internet.

En la estimación del modelo no tuve en cuenta los datos de Prov. de Buenos Aires y de Ciudad de Buenos Aires. En el caso de Prov. de Buenos Aires la exclusión se basa en que la medida de densidad no es adecuada. La Matanza es el departamento con mayor proporción de las viviendas de la provincia. Sin embargo, hay otros departamentos que también están muy densamente poblados. Ciudad de Buenos Aires no ingresa en el modelo porque la penetración de Internet excede el 100%.

La tabla expuesta a continuación exhibe los resultados de las tres estimaciones.


En gris se encuentran descatadas las variables que son significativas al 5%. Como se puede apreciar, las dos variables que son significativas en los tres modelos son la medida de densidad (Centralidad) y la medida de pobreza (NBI).

El porcentaje de la población con necesidades básicas insatisfechas resulta ser la variable explicativa más fuerte. En efecto, por cada 1% más de población con NBI, la penetración de Internet se reduce en un 1%. Mientras que por cada 1% más de densidad de viviendas, la penetración de Internet aumenta un 0,5%.
En la estimación de Google la variable población es significativa. La lectura en este caso es: por cada 1.000.000 de habitantes, la penetración aumenta un 9%.

Las tres estimaciones tienen un alto poder explicativo, las variables son significativas y tienen signos coherentes. En función de los resultados de las estimaciones, la distribución de usuarios de Internet por provincia con los datos de Google parece ser la que mejor se puede explicar con las variables seleccionadas. La segunda mejor es la distribución que tiene en cuenta el total de conexiones (residenciales + organizaciones) censadas por el Indec.

Links y Notas:
Todos los datos se pueden bajar haciendo clic aquí: https://docs.google.com/spreadsheet/ccc?key=0Ah_ZMWRG754hdFdaUmhXSVBxZC14Z1piSTNTOUpBdlE

(1) http://www.lanacion.com.ar/970128-en-la-argentina-hay-16-millones-de-usuarios-de-internet

(2) http://www.argentina.ar/_es/pais/C4719-mas-del-50-por-ciento-de-los-argentinos-ya-son-usuarios-de-internet.php

(3) El Indec cometió un error en el informe de Septiembre 2011. La suma de conexiones desde organizaciones por provincia no coincide con el total. Asumo que el total es el que está equivocado.

(4) Usuarios de Internet en Argentina por Provincia a Octubre de 2011: https://docs.google.com/spreadsheet/ccc?key=0Ah_ZMWRG754hdENCRHplVXlkcEpHVnZzVTVBc2Ffb1E

Gracias a Julián Rodriguez Orihuela por la ayuda con el mapa.

10 comentarios:

Anónimo dijo...

Buenísimo. Qué raro que hayas usado los colores "al revés", en general rojo es más (caliente) y azul es menos (frío). Pero la data está buenísima.

Esteban dijo...

Sería interesante hacer una comparativa de la progresión de diferentes países de la región. Creo recordar que ComScore sacó algún análisis a mediados de año.

Alejandro Gregori dijo...

Anónimo: Gracias! Lo voy a tener en cuenta para la próxima.

Esteban: Interesante. ¿Tenés más detalles de esa comparativa?

Anónimo dijo...

Te faltaron las Malvinas, tienen que tener el mismo color que tierra del fuego.

Datos de conectividad en las islas:
http://en.mercopress.com/2011/10/06/falklands-have-the-highest-rate-of-network-use-in-the-world-says-imi

Anónimo dijo...

donde puedo encontrar los datos de cookies de google por provincia que hace referencia el articulo ?

Medir el uso de IPs por provincia es muy dificil, ya que usualmente el NIC los asigna a paises y los ISP no informan su uso geografico. Ademas con la escasez de bloques IPv4 hay gran cantidad de usuarios que usan pocos IPs, ya que los conectan detras de NATs: por ejemplo casi todo los usuarios de mobiles 3G y todo el wifi publico de la provincia de san luis.

Anónimo dijo...

estaria bueno publicar los datos en http://www.google.com/fusiontables/Home/

Alejandro Gregori dijo...

En link debajo del post puse la tabla: https://docs.google.com/spreadsheet/ccc?key=0Ah_ZMWRG754hdFdaUmhXSVBxZC14Z1piSTNTOUpBdlE

Ahí podés consultarla.

Danbat dijo...

Un detalle a considerar. Vivo en Bariloche, provincia de Río Negro, pero Google interpreta que me conecto desde la ciudad de Neuquén, por donde pasa el enlace de fibra óptica. Si esto es generalizado para los usuarios de Speedy entonces la mitad de los usuarios de Bariloche estarían asignados a Neuquén.

Anónimo dijo...

Buenísimo tu blog. Llegué a él, intrigada por un dato que me llamó la atención. Según Roxana Murduchowicz, el 95% de adolescentes argentinos acceden a internet.

Fabián Fucci dijo...

Interesantes resultados y clara la explicación. Quizá quieras enviarlo a visualizing.org.