Technology

He descargado todo lo que Amazon sabe de mí y esto es lo que me he encontrado

By Adriana P

March 15, 2023

Google es el Gran Hermano definitivo. Facebook no anda muy lejos: con lo que sabe de mí podría reconstruir mi vida cuando quisiera. Ahora bien: ¿cuánto sabe Amazon de mí?

Eso es lo que hemos querido averiguar ahora que la empresa da la opción de descargar todos los datos que recopila al usar sus servicios o productos como sus altavoces inteligentes. Hay buenas y malas noticias. Vamos con ellas.

Primero, las malas noticias

Amazon recolecta un buen montón de datos. Esa es la realidad que uno puede confirmar al descargar todo lo que tiene sobre nosotros. El proceso para conseguir esos datos es sencillo: basta con hacer la solicitud siguiendo los pasos indicados en la documentación de Amazon.

De hecho para solicitar los datos tendremos que ir a este enlace indicado en esa documentación, lo que nos llevar´a a una página con un menú desplegable en el cual podemos elegir qué datos recolectados queremos descargar. Podéis elegir cualquiera de las opciones mostradas en la imagen por si solo queréis esos datos en concreto. Por ejemplo, solo los de los dispositivos Alexa y Echo, solo los del Kindle o solo los de Publicidad.

Yo quise descargar todos, así que elegí la opción “Solicitar todos tus datos” que se muestra en la parte inferior de ese menú desplegable.

A partir de ahí toca esperar. Y esperar mucho, porque esas peticiones tardan semanas en procesarse. En mi caso el correo electrónico que me avisaba de que los datos ya se podían descargar tardó 22 días en llegar desde que hice la petición.

Amazon además no hace especialmente rápida o cómoda la descarga de esos datos: en esa página web aparece una lista enorme de pequeños ficheros .ZIP que podemos descargar de forma individual: en ningún lado aparece una opción que permita descargarlos todos de una vez. Tendremos que ir haciendo clic en cada botón de “Descargar” para ir guardándolos en nuestro equipo.

Ahora, las buenas noticias: la recolección de datos es razonable y poco invasiva

Una vez descargados esos ficheros —en mi caso, cerca de 130— comencé a descomprimirlos. La mayoría de los cuales eran muy pequeños y estaban por debajo de los 10 KB, y al descomprimirlos se puede observar rápidamente como la inmensa mayoría son ficheros de texto en formato .CSV, preparados para ser importados en hojas de cálculo y que van mostrando información tabulada sobre nuestro uso de los productos y servicios de Amazon.

Ahora viene lo importante. ¿Qué datos recolecta Amazon? Tras analizar esos ficheros, pudimos comprobar cómo salvo en casos muy específicos la información que guarda de nosotros es justo la que se utiliza para su tienda online.

Así, Amazon guarda información sobre nuestras direcciones de envío —esto lo hace en uno de los pocos PDFs que aparecen en la colección de datos recolectados—, datos parciales sobre las tarjetas de crédito o débito que usamos para pagar los artículos (últimos cuatro dígitos, caducidad, banco asociado), y por supuesto tablas relacionadas con nuestra operativa en la web de Amazon: compras realizadas, devoluciones, lista de deseos, etc.

Que Amazon recolecte y almacene esos datos parece lógico teniendo en cuenta que los usamos al comprar artículos y usar la tienda online de Amazon. No hay aquí nada alarmante, o al menos no si efectivamente la información descargada en este segmento es toda la que Amazon almacena.

El resto de ficheros son en su mayoría también bastante inocuos. Tenemos un listado con los “mercados” (“marketplaces”) en los que hemos entrado con alguno de nuestros dispositivos —por ejemplo, cuando descargamos juegos—, listados con entradas que indican si hemos aprovechado alguna promoción, o tablas con información sobre las notificaciones que Amazon nos ha mandado por correo electrónico.

Hay también una tabla —la derivada del fichero registration.csv— en la que se muestran los dispositivos en los que hemos usado la cuenta de Amazon, pero sin identificarlos claramente: aparecen sus números de serie y luego el nombre genérico que Amazon genera —por ejemplo, “Javier’s 14th Android Device”— así como las fechas en las que se activó y desactivó la cuenta de Amazon en el dispositivo. Una vez más, datos razonables que es normal que Amazon tenga guardados como parte de nuestro historial de uso de sus servicios.

Alexa no preocupa, pero a Amazon le interesa mucho cuánto leemos y vemos en Kindle y Prime Video

Lo único que encontré relativamente curioso fueron dos cosas. La primera, que Amazon sabe qué coche tengo. En realidad es algo totalmente normal, ya que he comprado algún recambio como el limpiaparabrisas allí.

La segunda, la que probablemente preocupa a más usuarios, y es qué tipo de datos recolecta Amazon de nuestro uso de sus altavoces inteligentes o de Prime Video. Su familia Echo es muy popular y da acceso a funciones cómodas a través de comandos de voz, pero ¿hasta qué punto se invade nuestra privacidad?

A juzgar por los datos recolectados, esa invasión parece una vez más casi nula. En los ficheros descargados en mi caso no había grabaciones de Alexa, pero la razón es sencilla: usamos la cuenta de Amazon de mi mujer para este dispositivo, porque la suya es la que está asociada a Prime.

Al final no importa si no los descargué, porque todo lo que graba Amazon cuando hablamos con Alexa queda registrado y accesible en el apartado de privacidad de Alexa de nuestra cuenta de Amazon. Al visitar esa página web veremos un listado de las órdenes de voz que hemos dado, y si desplegamos cualquiera de ellas podremos reproducir la cadena de audio que ha quedado grabada en los servidores de Amazon.

Al hacer un repaso a esas órdenes solo he podido encontrar clips de audio en los que controlaba la reproducción musical del altavoz o le preguntaba por el tiempo.

No hay grabaciones extrañas de conversaciones captadas en segundo plano por ejemplo, y una vez más parece que el comportamiento aquí de la recolección de datos es el esperado. En esa misma página web es además posible eliminar todas las grabaciones, lo que le da al usuario el control sobre esos ficheros.

Quizás lo más curioso de toda esa recolección de datos ha sido ver cómo Amazon recolecta bastante información sobre nuestras sesiones de lectura en sus lectores de libros electrónicos. Hay un buen número de ficheros relacionados con el Kindle, aunque la mayoría son una vez más inocuos.

Sin embargo hay algunos ficheros en los que hay un seguimiento claro de nuestra actividad de lectura. El fichero “Kindle.Devices.ReadingSession.csv” es el más revelador aquí: aparece hora de comienzo y fin de la sesión, identificador del libro electrónico a través de su código ASIN, y luego dos datos aún más curiosos: el tiempo que hemos estado leyendo (en milisegundos), y cuántas páginas pasamos en esa sesión.

Aquí hay desde luego una particular obsesión de Amazon por saber qué libros hemos leído y si esos libros nos han interesado o no. Esas métricas son muy similares a las que el servicio mantiene para Prime Video, y que muestran en tablas CSV cuál fue la película o serie que vimos y cuántos segundos estuvimos viéndola en cada sesión.

¿Es ese interés de Amazon legítimo? Bueno, ciertamente uno podría argumentar que gracias a eso Amazon sabe qué libros, series o películas funcionan en sus catálogos, así que desde ese punto de vista la recolección de esos datos que hacen en Amazon parece lógica.

That, and all the spreadsheets on *how* I read (page turns, highlights, reading sessions), my Whole Foods purchases, my contacts lists, my video watching, my Amazon purchases, every time I've entered a physical store, etc etc etc etc pic.twitter.com/3JROpVBjkO

— Alina Utrata (@AlinaUtrata) January 23, 2022

Que los guarde con ese nivel de detalle puede parecer algo exagerado, y eso precisamente ha hecho que haya críticas en redes sociales sobre esa recolección de audios de Alexa o sobre las páginas que hemos pasado al leer un libro en nuestro Kindle.

Lo cierto es que los datos recolectados por Amazon no parecen exagerados. Son básicamente un historial de nuestra actividad en sus servicios, y en muchos casos parte de esos datos son útiles para hacer el servicio más cómodo a los usuarios —es útil poder acceder a nuestros pedidos o no tener que introducir direcciones de envío en cada compra, por ejemplo—.

Las suspicacias aquí pueden surgir con la forma en la que Amazon puede utilizar esos datos, pero una vez más esa recolección de uso y preferencias suele estar destinada a mejorar los servicios y los sistemas de recomendación: si los Kindle o Prime Video recolectan datos, parece razonable pensar que (al menos en gran parte) es para ayudarnos a elegir nuestro próximo libro, serie o película.

Es cierto que nuestro historial de compras puede ser útil para otros propósitos, como publicidad personalizada. La propia Amazon reconoce ese tipo de escenario en su aviso de privacidad y confirman que “trabajamos con terceros como anunciantes, editores, redes sociales, motores de búsqueda, proveedores de publicidad y empresas de publicidad que trabajan por su cuenta, para mejorar la relevancia de los anuncios que ofrecemos”. Con todo y con eso, todos esos datos recolectados por Amazon no parecen especialmente invasivos ni una amenaza grave a nuestra privacidad.

Imagen: Jonathan Borba

– La noticia He descargado todo lo que Amazon sabe de mí y esto es lo que me he encontrado fue publicada originalmente en Xataka por Javier Pastor .