Cada día, a través de nuestras acciones cotidianas vamos dejando un rastro digital. Hay veces que lo hacemos de manera voluntaria, como cuando publicamos un tuit o usamos whatssap, pero otros muchos caso no somos conscientes de que lo estamos haciendo. Cada vez que sacamos dinero del cajero, consultamos Google Maps, leemos una u otra noticia estamos generando datos sobre nuestros gustos, aficiones y costumbres y estos datos son una fuente muy valiosa para poder estudiar el comportamiento humano ya que con ellos es posible analizar pautas y procesos que con otros métodos sociológicos más convencionales no se podrían estudiar o, por lo menos, sería más difícil. El Big Data nos facilita poder estudiar fenómenos que antes sabíamos que existían pero no podíamos medir y estudiar.
Esta nueva fuente de datos de estudio tienen sus propias características que la diferencian de otras fuentes que aportan datos de estudio tradicionales. Si nos basamos en la taxonomía de las 5vs que utilizan por ejemplo Kaisler (Kaisler et al.,2013) o Kitchin (Kitchin, 2013) podríamos clasificar los datos por 5 características:
- Volumen: El Big Data es masivo. Se usan cantidades de medidas como los terabytes (1 billón de bytes), los petabytes (1.000 billones de bytes) o los exabytes (1 millón de billones de bytes).
- Velocidad: se generan datos continuamente. No hay que esperar a procesar cuestionarios, los datos son síncronos al proceso que queremos estudiar.
- Variedad: Hay diversos tipos de formatos en los que aparecen los datos, más o menos estructurados.
- Veracidad: Son datos masivos y muy exhaustivos. La gente puede mentir en las encuestas pero sus datos no mienten.
- Valor: Los datos por sí solos no tienen valor, pero los datos explotados y estudiados, convertidos en información útil tienen un valor tremendo para las empresas y administraciones públicas porque pueden ayudar a tomar decisiones.
Javier Gutiérrez Puebla, de la Universidad Complutense de Madrid publicó en 2018 un artículo en la revista Documents D'Anàlisi Geogràfica sobre la huella digital de las actividades humanas y su uso en los estudios geográficos. En este artículo describe las características de estos datos masivos y habla de la importancia que puede tener a partir de ahora para los estudios de ciencias y cualquier otro que se base en la actividad humana. para Gutiérrez Puebla, la geolocalización que aportan estos datos puede permitir un adelanto para el estudio de patrones espacio-temporales de actividades humanas. Es cierto que también describe los riesgos que puede tener basarse solo en este tipo de datos para realizar los estudios ya que son datos que pueden resultar sesgados. Por ejemplo, si solamente se estudiaran los aportados por Twitter, en España en 2018 solo un 5% de la población era usuaria de esta red social y son sobre todo hombres (54%) con estudios universitarios (61%) y menores de 54 años (94%). Por este sesgo, el autor cree necesario que se creen equipos interdisciplinarios que combinen conocimientos técnicos y temáticos para poder interpretar bien los datos.
En el artículo se presentan varios casos prácticos de la utilización de Big Data para estudiar pautas espaciales y proceso espacio-temporales de los que vamos a destacar dos. El primer trabajo es un mapa que presenta la distribución espacial de las fotografías tomadas por turistas y residentes en Barcelona en Panoramio. En este mapa se muestran que los puntos más fotografiados coinciden con los puntos turísticos principales de la ciudad. Estos mapas se pueden realizar según comenta con relativa facilidad usando los datos geolocalizados y un sistema SIG. El autor considera que esta metodología tiene un problema y es que se puede sobreestimar a los autores más activos (los que envían muchos tuits o fotografías en poco tiempo) de aquellos menos activos cuando en realidad lo que interesa es la presencia de la persona en un sitio y hora pero este sesgo también es fácilmente solventable utilizando el identificador de usuario y convirtiendo los datos en usuarios únicos. Otros de los ejemplos que aparecen en el artículo tratan sobre la huella digital de los visitantes en el parque nacional de Aigüestortes; también presenta un estudio de movilidad a través de los datos aportados por los tracks de ciclistas.
Gutiérrez es de la opinión de que el uso de Big Data en geografía va a ayudar a abordar los problemas antiguos de otra manera y a permitir estudiar otros que no eran visibles para los investigadores.
Comentarios
Publicar un comentario