Base de datos de Netflix susceptible a ataques de desanonimización

Netflix emplea el procesamiento algorítmico para crear perfiles de usuarios a partir de metadatos recopilados y predecir qué contenido es más probable que consuman. Cada vez que uno de sus 300 millones de usuarios selecciona una serie o una película, el sistema recopila una gran cantidad de datos relacionados con el consumo de medios, como clics, pausas, indicadores que el usuario dejó de mirar, y otros (Narayanan, 2008). El algoritmo agrega esos datos a perfiles modelo que intuyen una gran cantidad de información sobre el usuario.

Aunque la compañía ha establecido varios mecanismos de seguridad y utiliza proxies de los datos personales de los usuarios para construir sus perfiles, el sistema es bastante vulnerable a los ataques de desanonimización. Los investigadores Narayanan et al. (2008) pudieron romper el anonimato de la base de datos de Netflix analizando cierta información de proxy proporcionada por los usuarios. El avance de Narayanan et al. evidenció una “nueva clase de ataques estadísticos de anonimización contra microdatos de alta dimensión, tales como preferencias individuales, recomendaciones, registros de transacciones, etc.” (ibid). Usando esos nuevos métodos, los investigadores demostraron cómo se podía divulgar información confidencial, como preferencias políticas u origen étnico, desde una base de datos anónima.