Julio Sanchez Abogados Big Data y proceso penal SKY ECC Encrochat prueba digital

Big Data y proceso penal: límites, garantías y prueba digital en la era de los macrodatos

Facebook

Twitter

Big Data y proceso penal

Big Data y proceso penal: de la sospecha individual a la investigación prospectiva
Eficacia tecnológica, prueba digital y garantías frente a la vigilancia indiscriminada

I. Introducción

La investigación penal contemporánea ya no depende únicamente de testigos, registros domiciliarios, seguimientos físicos, vigilancias, intervenciones telefónicas individualizadas o incautaciones de documentos.

Cada vez con mayor frecuencia, la persecución penal se apoya en el tratamiento de grandes volúmenes de datos: comunicaciones cifradas, metadatos telefónicos, datos de localización, bases biométricas, movimientos financieros, registros administrativos, fuentes abiertas, redes sociales, imágenes captadas en espacios públicos y herramientas algorítmicas de análisis o predicción.

Esta transformación no supone simplemente la modernización tecnológica de técnicas tradicionales de investigación. Genera un cambio de paradigma.

Tradicionalmente, la investigación penal partía, al menos en principio, de una sospecha previa relativamente delimitada: un hecho punible, una persona sospechosa, una organización concreta, un dispositivo específico o una comunicación determinada. En cambio, en el modelo intensivo de tráfico de datos, el Estado puede captar, conservar, cruzar y analizar grandes masas de información para identificar posteriormente patrones, relaciones, comportamientos, riesgos o sospechosos.

La investigación penal basada en Big Data, supuestamente promete eficacia frente a formas complejas de criminalidad: delincuencia organizada, narcotráfico transnacional, blanqueo de capitales, corrupción, terrorismo, ciberdelincuencia y redes codelincuenciales, más o menos estructuradas.

Sin embargo, esa pretendida eficacia tiene un elevadísimo coste potencial. Cuando la investigación se desplaza desde el preexistente indicio individual hacia la explotación masiva de datos, emergen riesgos de investigación acomodaticia, prospectiva, vigilancia indiscriminada, opacidad tecnológica, reutilización de información, debilitamiento de la privacidad, desigualdad de armas y restricción del derecho de defensa.

Las operaciones EncroChat, Sky ECC y Anom constituyen ejemplos paradigmáticos de esta evolución, pero no agotan el fenómeno. Son una manifestación especialmente visible de una tendencia más amplia: la conversión del dato masivo en instrumento central de la persecución penal. En esas operaciones, las autoridades accedieron a sistemas de comunicación cifrada utilizados por miles de personas, obtuvieron grandes volúmenes de mensajes y posteriormente compartieron o utilizaron esos datos en múltiples procedimientos nacionales. (1)

La cuestión decisiva no es si el Estado puede utilizar Big Data para investigar delitos graves. En sociedades digitalizadas, la respuesta será inevitablemente afirmativa. La verdadera cuestión es bajo qué condiciones puede hacerlo sin transformar el proceso penal en un sistema de vigilancia prospectiva.

El Estado no debe investigar porque dispone de datos; debe acceder y tratar datos porque existe una sospecha jurídicamente suficiente.

Esa inversión conceptual es el eje de la presente reflexión.

II. Concepto de Big Data penal

Por Big Data penal puede entenderse el conjunto de técnicas, prácticas y estructuras mediante las cuales las autoridades de prevención, investigación o persecución penal captan, conservan, tratan, cruzan, analizan o explotan grandes volúmenes de datos con la finalidad de detectar delitos, identificar sospechosos, reconstruir hechos, establecer vínculos, anticipar riesgos o producir prueba judicial.

Este concepto no se reduce a la inteligencia artificial ni a los algoritmos predictivos. Incluye también bases de datos tradicionales, sistemas de conservación masiva, cruces administrativos, extracción de datos de dispositivos, análisis de comunicaciones, reconocimiento biométrico, herramientas OSINT (Open Source Intelligence: inteligencia de fuentes abiertas) y cooperación transfronteriza de información.

Sus rasgos principales son:

1.Volumen: la investigación trabaja con cantidades muy amplias de información.
2.Variedad: los datos pueden ser comunicaciones, imágenes, biometría, transacciones, metadatos, ubicaciones o registros administrativos.
3.Velocidad: los datos pueden captarse y analizarse en tiempo real o casi real.
4.Capacidad de cruce: la información adquiere valor al combinarse con otras fuentes.
5.Reutilización: los datos obtenidos para una finalidad pueden ser útiles para investigaciones posteriores.
6.Automatización: parte del tratamiento puede realizarse mediante herramientas algorítmicas.
7.Valor probatorio derivado: el producto final incorporado al proceso puede ser el resultado de múltiples operaciones técnicas previas.

La diferencia con la investigación digital ordinaria radica en la escala y en la lógica.

No es lo mismo analizar el teléfono de una persona investigada que explotar una base de datos que contiene comunicaciones de miles de usuarios.

No es lo mismo acceder a una cuenta bancaria concreta que cruzar masivamente patrones financieros.

No es lo mismo examinar una cámara de seguridad vinculada a un hecho que desplegar reconocimiento facial sobre espacios públicos.

La Big Data penal convierte el dato en infraestructura de investigación. Y cuando el dato se convierte en infraestructura, las garantías procesales deben adaptarse al ciclo completo de su vida: captación, conservación, filtrado, análisis, transmisión, selección, incorporación al expediente, contradicción y eventual destrucción.

III. Tipologías de Big Data en la investigación penal

La Big Data penal se manifiesta en distintas familias de datos.
Una aproximación amplia permite evitar que el debate quede reducido a las comunicaciones cifradas.

1. Datos de comunicaciones

Incluyen el contenido de mensajes, llamadas, correos electrónicos, chats, comunicaciones cifradas, datos de tráfico, datos de localización, direcciones IP, identificadores de dispositivos y metadatos.

EncroChat, Sky ECC y Anom pertenecen a esta categoría.

En EncroChat, las autoridades francesas accedieron a servidores situados en Francia y desplegaron una herramienta intrusiva para acceder a mensajes cifrados en forma descifrada. (2)

En Sky ECC, se autorizó la captación de tráfico y el uso de una herramienta técnica que permitía obtener claves de cifrado de los dispositivos. (3)

En Anom, el FBI distribuyó teléfonos cifrados cuyas claves estaban en poder de las autoridades estadounidenses. (4)

Pero el problema no se limita a estas operaciones. También incluye la conservación de metadatos telefónicos, el acceso a datos de localización y la identificación de usuarios a partir de registros de conexión.

El Tribunal de Justicia de la Unión Europea ha insistido en que el acceso a datos de comunicaciones puede ser altamente intrusivo incluso cuando no se accede al contenido. (5)

2. Datos biométricos

Incluyen ADN, huellas dactilares, fotografías policiales, reconocimiento facial, patrones de voz, iris, forma de caminar u otros identificadores físicos o conductuales.

Estos datos presentan un riesgo especial porque vinculan la identidad física de la persona con bases estatales persistentes.

El problema no es solo su obtención, sino su conservación y reutilización.

La jurisprudencia europea sobre ADN y huellas ha advertido de los riesgos de retener indefinidamente datos de personas no condenadas. (6)

El reconocimiento facial automatizado añade una dimensión nueva: permite identificar personas en espacios públicos mediante comparación con listas de vigilancia.

En el caso R (Bridges) v Chief Constable of South Wales Police [2020], la litigación inglesa sobre reconocimiento facial mostró la importancia de reglas claras sobre cuándo puede usarse la herramienta, quién puede ser incluido en las listas y qué controles existen sobre la discrecionalidad policial. (7)

3. Datos financieros y administrativos

La investigación penal se apoya cada vez más en datos bancarios, tributarios, societarios, registros de beneficiario real, operaciones sospechosas, movimientos patrimoniales y bases administrativas.

Estos datos son esenciales para investigar blanqueo, corrupción, fraude fiscal, financiación del terrorismo y criminalidad organizada.

Pero también plantean riesgos de perfilado financiero, reutilización de datos obtenidos con fines administrativos y generación automatizada de sospechas a partir de patrones económicos.

El dato financiero es especialmente poderoso porque permite reconstruir redes, hábitos, desplazamientos, relaciones patrimoniales y estructuras organizativas sin necesidad de vigilancia física directa.

La cuestión clave es si el acceso penal a estas bases respeta finalidad, proporcionalidad, control judicial y límites de uso secundario.

4. Datos abiertos, redes sociales y OSINT

La investigación penal utiliza cada vez más información disponible públicamente: redes sociales, fotografías, vídeos, geolocalizaciones, publicaciones, foros, páginas web, registros abiertos y bases filtradas.

La dificultad jurídica es que. La vigilancia individual de una publicación un dato públicamente accesible no pierde automáticamente toda protección no equivale a la captación, estructuración y análisis masivo de perfiles digitales. Cuando el Estado agrega, cruza y analiza información abierta a gran escala, puede generar una forma de vigilancia cualitativamente distinta.

Este ámbito es especialmente sensible para la libertad de expresión, reunión y asociación. La monitorización de protestas, activistas, periodistas o colectivos políticos mediante análisis de redes sociales puede producir un efecto inhibidor incluso si los datos originales eran públicamente visibles.

5. Sistemas predictivos y análisis algorítmico

La forma más avanzada de Big Data penal aparece en herramientas de policía predictiva, mapas de riesgo delictivo, análisis de redes criminales, scoring de personas, detección automatizada de anomalías y priorización algorítmica de sospechosos.

Estos sistemas plantean problemas específicos: opacidad, sesgos, discriminación, falta de explicabilidad, automatización de la sospecha, dificultad de impugnación y confusión entre correlación y culpabilidad.

El riesgo más profundo no es solo que el Estado sepa más, sino que empiece a decidir a quién investigar mediante modelos opacos de probabilidad, afinidad o riesgo.

IV. El cambio de paradigma: de la sospecha al patrón

El proceso penal liberal se construyó sobre una idea básica: la intervención estatal debe estar justificada por indicios.

La sospecha no puede ser una intuición general, una categoría sociológica o una mera correlación estadística. Debe existir una base objetiva, controlable y jurídicamente relevante.

La investigación Big Data tensiona esta lógica porque permite partir del dato antes que de la sospecha. En lugar de investigar a una persona por indicios previos, el Estado puede analizar un conjunto amplio de datos para descubrir quién merece ser investigado.

El orden se invierte:

Esta inversión no es necesariamente ilegítima en todos los casos. Las investigaciones complejas pueden requerir análisis exploratorios, cruces de información y reconstrucción de redes.

Pero el proceso penal debe impedir que la exploración de datos sustituya a la sospecha jurídicamente suficiente.

La diferencia entre indicio y patrón es esencial.

Un indicio conecta racionalmente a una persona con un hecho penalmente relevante.

Un patrón puede reflejar una regularidad estadística, una semejanza conductual, una relación indirecta o una probabilidad.

El patrón puede orientar la investigación, pero no debe convertirse sin más en fundamento de medidas intrusivas, ni menos aún en un mero sesgo confirmatorio de los prejuicios del investigador.

Lo mismo ocurre con la sospecha de plataforma. Que una infraestructura pueda ser utilizada para actividades delictivas no significa que todos sus usuarios sean criminales. Que una herramienta sea útil para ocultar delitos no significa que su simple uso sea delictivo.

El cifrado, la privacidad financiera, el anonimato relativo o la seguridad digital también protegen actividades lícitas y derechos fundamentales.

Fair Trials ha destacado precisamente que las operaciones sobre comunicaciones cifradas parten con frecuencia de una sospecha sobre la totalidad de la base de
usuarios, sin una sospecha individualizada previa respecto de cada uno. (8)

Esa lógica debe someterse a control estricto, porque puede convertir la pertenencia a un entorno tecnológico en sustituto de la sospecha individual.

V.- El riesgo de investigación prospectiva e indiscriminada

La investigación prospectiva es aquella que no se orienta inicialmente a comprobar una sospecha penal concreta, sino a explorar un conjunto amplio de datos con la expectativa de descubrir posibles delitos, sospechosos o líneas de investigación.

El problema no es que el Estado analice información. El problema aparece cuando la captación masiva precede a la sospecha individual y cuando el análisis de datos se convierte en una búsqueda general de criminalidad.

La investigación prospectiva tiene varias manifestaciones.

1. Ampliación subjetiva
Afecta a personas respecto de las cuales no existen indicios individualizados. Por ejemplo, usuarios de una plataforma, personas que transitan por un espacio público sometido a reconocimiento facial, individuos incluidos en una base biométrica o perfiles analizados por redes sociales.

2. Ampliación objetiva
Los datos obtenidos para investigar un fenómeno pueden revelar otros hechos no previstos inicialmente. Esto genera la tentación de ampliar la finalidad de la medida y reutilizar el dato para investigaciones distintas.

3. Ampliación temporal
Los datos conservados pueden adquirir una vida autónoma. Lo que se obtuvo para una investigación concreta puede convertirse en repositorio para investigaciones futuras.

4. Ampliación territorial
En contextos transfronterizos, los datos captados por un Estado pueden circular hacia otros Estados, cada uno de los cuales los emplea para fines penales propios.

La consecuencia es que el dato masivo puede transformarse en una reserva general de inteligencia penal.
Ese riesgo exige una respuesta garantista: finalidad determinada, autorización judicial reforzada, minimización, control de accesos, trazabilidad, límites de conservación y control del uso secundario.

La investigación penal no debe convertirse en una fishing expedition.

La eficacia tecnológica no puede justificar búsquedas indiscriminadas. Si el Estado quiere acceder a grandes volúmenes de datos, debe explicar por qué la medida es necesaria, qué delitos concretos justifican la injerencia, qué categorías de datos son imprescindibles, qué límites se aplicarán y cómo podrá la defensa controlar posteriormente el resultado.

VI. Privacidad, protección de datos y minimización

La Big Data penal afecta a la privacidad de forma intensa porque permite reconstruir aspectos profundos de la vida personal. Los metadatos, por ejemplo, pueden revelar tanto como el contenido: con quién se comunica una persona, cuándo, desde dónde, con qué frecuencia y en qué patrones.

La privacidad se ve afectada en todo el ciclo del dato:

1. captación;
2. copia;
3. descifrado;
4. almacenamiento;
5. filtrado;
6. análisis;
7. transmisión;
8. conservación;
9. reutilización;
10. uso probatorio.

Por ello, no basta con controlar la captación inicial. También debe controlarse el tratamiento posterior. Incluso si la obtención originaria no se atribuye al Estado que finalmente usa la prueba, el acto de importar y utilizar esos datos en juicio constituye una injerencia propia que debe justificarse. (9)

La proporcionalidad debe analizarse con criterios reforzados. Deben ponderarse:

.- gravedad de los delitos;
.- número de personas afectadas;
.- existencia de sospecha individual;
.- duración de la medida;
.- tipo de datos;
.- afectación a terceros;
.- protección de comunicaciones privilegiadas;
.- posibilidad de medios menos intrusivos;
.- límites de uso;
.- reglas de destrucción.

La minimización es esencial. El Estado no debe conservar ni explotar más datos de los necesarios. Los datos irrelevantes deben separarse, bloquearse o destruirse. Los usos secundarios deben requerir nueva justificación y, en su caso, nueva autorización judicial.

La jurisprudencia europea sobre retención de datos y vigilancia masiva ofrece una advertencia clara: la acumulación generalizada de información personal por el Estado exige límites estrictos y salvaguardias efectivas. (10)

VII. Control judicial y trazabilidad del ciclo de vida del dato

El control judicial tradicional suele estar diseñado para autorizar actos concretos: una entrada y registro, una intervención telefónica, una incautación documental.

La Big Data penal exige algo más: controlar el ciclo completo del dato.

No basta con que un juez autorice la captación si después no existe control sobre:

.- qué datos se copiaron;
.- dónde se almacenaron;
.- quién accedió;
.- qué filtros se aplicaron;
.- qué criterios de búsqueda se usaron;
.- qué datos se excluyeron;
.- qué datos se transmitieron;
.- cómo se preservó la integridad;
.- cómo se incorporaron al expediente;
.- cuánto tiempo se conservarán.

La trazabilidad se convierte así en una garantía constitucional. Sin trazabilidad no hay contradicción efectiva. Y sin contradicción efectiva, la prueba digital masiva puede convertirse en una afirmación de autoridad técnica no verificable.

La documentación mínima debería incluir:

.- valores hash;
.- logs de acceso;
.- registros de búsqueda;
.- criterios de filtrado;
.- fechas de extracción;
.- herramientas utilizadas;
.- identificación de operadores;
.- cadena de custodia;
.- documentación de conversiones;
.- informes de integridad;
.- control de comunicaciones privilegiadas.

La trazabilidad no es una formalidad. Es la condición que permite convertir datos masivos en prueba judicial.

VIII. Conversión del dato masivo en prueba penal

Uno de los mayores desafíos de la Big Data penal es la conversión del dato en prueba.

Los datos no llegan normalmente al juicio en estado bruto. Pasan por una cadena compleja de extracción, descifrado, copia, filtrado, selección, transmisión, análisis y conversión. El producto final puede ser una hoja Excel, un PDF, un informe policial, una transcripción o una visualización de relaciones.

Ese producto derivado puede ser útil para el tribunal, pero no sustituye al dato original.

En los procedimientos derivados de comunicaciones cifradas, se ha destacado que la evidencia que llega al proceso suele consistir en hojas Excel o PDFs derivados de un proceso previo opaco, y que esos productos pueden ser problemáticos y propensos a errores. (11)

También se ha señalado que normalmente no se proporciona a la defensa una imagen original de los datos brutos que permita examen forense independiente, verificación de cadena de custodia o búsqueda en igualdad de condiciones. (12)

En Julio Sánchez Abogados Redlex hemos descrito esta práctica como una suerte de “agujero negro probatorio”: el tribunal recibe un resultado, pero la defensa no siempre puede reconstruir suficientemente el camino técnico y procesal que llevó desde el dato captado hasta el documento usado como prueba de cargo. (13)

La defensa necesita poder reconstruir el itinerario que llevó desde el dataset inicial hasta la prueba usada contra el acusado. De lo contrario, no puede verificar:

.- autenticidad;
.- integridad;
.- completitud;
.- atribución;
.- contexto;
.- metadatos;
.- continuidad temporal;
.- errores de conversión;
.- omisión de datos exculpatorios;
.- sesgo de selección.

La evidencia Big Data debe ser verificable, reproducible y contradictoria. Si no lo es, su valor probatorio debe reducirse o, cuando sea decisiva, excluirse.

IX. Igualdad de armas y derecho de defensa

La igualdad de armas exige que la defensa tenga una posibilidad real de conocer, examinar y discutir la prueba de cargo. En investigaciones de Big Data, este derecho se enfrenta a dificultades específicas.

La acusación puede haber tenido acceso a un dataset amplio, mientras la defensa recibe solo extractos. La policía puede haber aplicado filtros que la defensa desconoce. El subproducto probatorio suele omitir metadatos. Las herramientas técnicas pueden estar protegidas por secreto. Y los datos de terceros pueden utilizarse como argumento para restringir el acceso.

No se trata de afirmar que la defensa deba acceder siempre a todos los datos de todos los usuarios. Pueden existir límites legítimos. Pero sí debe poder verificar de forma efectiva la prueba usada contra el acusado.

Ello puede requerir:

.- acceso a datos brutos relacionados con el investigado;
.- acceso a metadatos;
.- pericial informática independiente;
.- búsquedas supervisadas;
.- conocimiento de criterios de filtrado;
.- control judicial de datos no incorporados;
.- mecanismos para proteger datos de terceros sin vaciar el derecho de defensa.

La jurisprudencia europea sobre grandes datasets y prueba digital ofrece criterios útiles.

En Sigurður Einarsson, el Tribunal Europeo de Derechos Humanos abordó el problema de grandes volúmenes de material y la necesidad de que la defensa tenga una oportunidad efectiva de participar en la identificación de información relevante.

En Rook, el Tribunal aceptó que no siempre es necesario entregar todo indiscriminadamente, pero sí debe existir una oportunidad real de examen.

En Yüksel Yalçınkaya, el Tribunal subrayó la importancia de poder verificar la integridad de la prueba digital subyacente y no limitarse a productos secundarios. (14)

En la práctica forense la discusión sobre EncroChat y Sky ECC ha mostrado que la cuestión no se limita a la admisibilidad formal de los datos, sino que alcanza al núcleo del artículo 6 del Convenio Europeo de Derechos Humanos: la posibilidad real de que la defensa conozca, verifique y contradiga la evidencia digital utilizada como prueba de cargo. (15)

X. Derecho al silencio y carga imposible de la defensa

En la Big Data penal aparece un problema adicional: la carga imposible para la defensa.

Algunos tribunales exigen a la defensa que haga plausible una irregularidad antes de conceder acceso a datos brutos o materiales adicionales. Esa exigencia puede ser razonable frente a solicitudes puramente genéricas. Pero puede volverse circular cuando la defensa necesita precisamente esos datos para identificar la irregularidad.

La lógica kafkiana es la siguiente:

1.- no se concede acceso porque no se ha demostrado la irregularidad;
2.- pero no puede demostrarse la irregularidad porque no se concede el acceso.

Además, esta dinámica puede afectar al derecho al silencio. Si se exige al acusado explicar por qué un mensaje está descontextualizado, por qué una cuenta no era suya o por qué una conversación tiene un sentido distinto, puede verse presionado a admitir que usaba el dispositivo, reconocer comunicaciones o revelar su estrategia defensiva. (16)

La carga de demostrar autenticidad, integridad, atribución y fiabilidad corresponde a la acusación. La defensa no debe verse obligada a sacrificar el derecho al silencio para obtener acceso a elementos necesarios para impugnar la prueba.

XI. Cooperación transfronteriza, reconocimiento mutuo y confianza mutua

La Big Data penal es frecuentemente transnacional. Un Estado capta los datos, otro los almacena o canaliza, otro los solicita, otro los procesa y otro los usa como evidencia.

EncroChat, Sky ECC y Anom muestran esta fragmentación.

La cooperación transfronteriza permite combatir fenómenos criminales que no respetan fronteras. Pero también fragmenta la responsabilidad y el control. El Estado juzgador puede invocar confianza mutua y afirmar que no le corresponde revisar la actuación del Estado de origen. El Estado de origen puede no ofrecer remedio efectivo a una persona juzgada en otro país. La defensa, en la práctica, queda atrapada entre jurisdicciones sin que reciba respuesta a sus legítimas exigencias de acceder a un juicio justo.

El principio de reconocimiento mutuo facilita la cooperación penal europea, pero no equivale a una aceptación acrítica de cualquier resultado probatorio procedente de otro Estado. La cooperación judicial exige confianza, pero esa confianza opera dentro del Estado de Derecho, no al margen de él. (17)

El asunto C-670/22, Staatsanwaltschaft Berlin v. M.N. (EncroChat) es clave. El Tribunal de Justicia de la Unión Europea interpretó los artículos 6, 14 y 31 de la Directiva 2014/41/UE.

En relación con el artículo 6, una Orden Europea de Investigación destinada a obtener prueba ya existente debe ser necesaria, proporcionada y equivalente a una medida disponible en un supuesto interno comparable. (18)

En relación con el artículo 14, si una prueba tiene influencia preponderante y el acusado no puede comentarla efectivamente, debe excluirse o no tomarse en consideración. En relación con el artículo 31, la notificación territorial protege tanto la soberanía del Estado afectado como los derechos individuales, y esa protección se proyecta sobre el uso penal posterior de los datos. (19)

La confianza mutua no puede convertirse en confianza ciega.

El tribunal del Estado juzgador debe garantizar, al menos, que la prueba presentada ante él sea verificable, contradictoria y compatible con el derecho de defensa.

La pregunta “¿el fin justifica los medios?”, formulada en el debate práctico sobre Sky ECC, resume bien la tensión de fondo: la gravedad de los delitos investigados y la utilidad del resultado no bastan por sí solas para legitimar cualquier forma de captación, tratamiento o incorporación probatoria de datos digitales. (20)

XII. Hacia un estatuto garantista de la Big Data penal

La Big Data penal requiere un conjunto coherente de garantías.

No basta con aplicar mecánicamente reglas pensadas para diligencias tradicionales. Debe construirse un estatuto garantista del dato penal.

Ese estatuto podría articularse en torno a diez principios.

1. Sospecha previa suficiente

La captación de grandes volúmenes de datos debe apoyarse en indicios objetivos y delimitados. La mera utilidad potencial de los datos no justifica la injerencia.

2. Prohibición de investigaciones puramente exploratorias

El Estado no debe captar datos masivos para descubrir delitos de forma indeterminada. Debe existir una finalidad penal concreta.

3. Finalidad determinada

Los datos deben utilizarse para los fines que justificaron su obtención. Los usos secundarios deben requerir nueva justificación y control.

4. Autorización judicial reforzada

Cuanto más amplia sea la captación, más exigente debe ser la motivación judicial sobre necesidad, proporcionalidad, duración, alcance y salvaguardias.

5. Minimización de datos

Solo deben captarse, conservarse y analizarse los datos estrictamente necesarios. Los irrelevantes deben separarse o destruirse.

6. Trazabilidad completa

Debe documentarse todo el ciclo del dato: extracción, copia, filtrado, acceso, transmisión, conversión y conservación.

7. Registro de búsquedas y accesos

Las búsquedas realizadas por autoridades deben quedar registradas para permitir auditoría y control posterior.

8. Control de usos secundarios

La reutilización de datos para nuevas investigaciones debe estar sometida a autorización y límites claros.

9. Acceso efectivo de la defensa

La defensa debe poder verificar la prueba usada contra el acusado mediante acceso suficiente a datos, metadatos, criterios de filtrado y pericial independiente.

10. Exclusión de prueba no verificable

Cuando la prueba sea decisiva y no pueda ser contradicha de forma efectiva, debe excluirse o perder valor probatorio.

XIII. Conclusión

La investigación penal mediante Big Data constituye uno de los principales desafíos del proceso penal contemporáneo. Su potencial es innegable: permite detectar redes criminales complejas, reconstruir comunicaciones, identificar vínculos, rastrear flujos financieros y coordinar investigaciones transnacionales. Pero sus riesgos son igualmente profundos.

El principal peligro no es solo que el Estado acceda a más información, sino que cambie la lógica misma de la persecución penal.

Allí donde el proceso penal clásico exige sospecha previa, delimitación y proporcionalidad, la Big Data puede tentar al Estado a captar primero y justificar después, de hecho, es una tentación en lo que la mayoría de los Estados caen gustosos en detrimento de nuestro sistema de garantías legales.

La investigación puede dejar de buscar pruebas sobre delitos para empezar a buscar delitos dentro de la vida digital de las personas.

La pregunta central, por tanto, no es si el Estado puede usar Big Data. La pregunta es cómo puede hacerlo sin transformar el proceso penal en una vigilancia prospectiva e indiscriminada.

La respuesta pasa por una nueva cultura de garantías: sospecha previa, finalidad concreta, minimización, trazabilidad, control judicial, transparencia suficiente, acceso de la defensa, pericial independiente y exclusión de prueba no verificable.

El futuro del proceso penal no dependerá solo de la capacidad del Estado para acceder a datos, sino de su capacidad para convertir esos datos en prueba respetando los límites del Estado de Derecho.

La tecnología puede ampliar la eficacia de la justicia penal, pero no debe reducir la calidad democrática del proceso, el problema es que para que esto se cumpla es necesario creer realmente en el proceso penal como un proceso de garantías. Esto por desgracia brilla por su ausencia y se reduce a frases huecas carentes de sentido real.

Julio Sánchez Abogados Redlex

Notas

(1): Silgir v Germany (No. 2), Written Comments, p. 1.
Fair Trials, es una ONG internacional dedicada a defender la equidad, la igualdad y la justicia en los sistemas penales de todo el mundo actuando. En Silgir v Germany, actuando como amicus curiae describe la práctica por la que un Estado capta grandes volúmenes de comunicaciones cifradas, otro Estado obtiene parte de esos datos mediante cooperación judicial o asistencia mutua y posteriormente los usa como prueba penal expone la erosión de las garantías procesales debido al intercambio transfronterizo de datos encriptados.
(2): Fair Trials, Silgir v Germany (No. 2), Written Comments, p. 1.
(3): Fair Trials, Silgir v Germany (No. 2), Written Comments, pp. 1–2.
(4): Fair Trials, Silgir v Germany (No. 2), Written Comments, p. 2.
(5): TJUE, H.K. v Prokuratuur, C-746/18, EU:C:2021:152; véase también Athina Sachoulidou, The Court of Justice in Staatsanwaltschaft Berlin v. M.N. (EncroChat): From cross-border, data-driven police investigations to evidence admissibility.
Analiza el artículo 15, apartado 1, de la Directiva 2002/58/CE del Parlamento Europeo y del Consejo, de 12 de julio de 2002, relativa al tratamiento de los datos personales y a la protección de la intimidad en el sector de las comunicaciones electrónicas (Directiva sobre la privacidad y las comunicaciones electrónicas.
Athina Sachoulidou comenta la sentencia de la Gran Sala del Tribunal de Justicia de la Unión Europea (TJUE) en el asunto C-670/22, Staatsanwaltschaft Berlin contra M.N., y aborda la realidad de las investigaciones policiales basadas en datos a la luz de la Directiva 2014/41/UE relativa a la Orden Europea de Investigación (Directiva OEI).
(6): TEDH, S. and Marper v United Kingdom, nos. 30562/04 y 30566/04, 4 de diciembre de 2008.
Dictaminó por unanimidad que la conservación indefinida de perfiles de ADN, huellas dactilares y muestras biológicas de personas sospechosas pero no condenadas vulnera el Artículo 8 del Convenio Europeo de Derechos Humanos (CEDH), el cual protege el derecho al respeto de la vida privada y familiar.
(7): R (Bridges) v Chief Constable of South Wales Police, (2020).
Sentencia histórica del Tribunal de Apelación de Inglaterra y Gales. Fue el primer desafío legal en el mundo contra el uso de la tecnología de Reconocimiento Facial Automatizado en Vivo (LFR) por parte de las fuerzas del orden. El tribunal dictaminó que el uso de esta tecnología por la policía de Gales del Sur (South Wales Police) era ilegal tal como se estaba ejecutando
(8): Fair Trials, Silgir v Germany (No. 2), Written Comments, p. 2.
(9): Fair Trials, Silgir v Germany (No. 2), Written Comments, p. 8.
(10): TEDH, Big Brother Watch and Others v United Kingdom, nos. 58170/13, 62322/14 y 24960/15; TEDH, Centrum för Rättvisa v Sweden, no. 35252/08; TJUE, La Quadrature du Net, asuntos acumulados C-511/18, C-512/18 y C-520/18, EU:C:2020:791; TJUE, Privacy International, C-623/17, EU:C:2020:790.
Jurisprudencia esencial sobre la vigilancia masiva de datos y la privacidad. Estos casos del Tribunal Europeo de Derechos Humanos (TEDH) y del Tribunal de Justicia de la Unión Europea (TJUE) establecen límites estrictos a la retención generalizada e indiscriminada de datos de tráfico y localización por parte de los Estados miembros.
(11): Fair Trials, Silgir v Germany (No. 2), Written Comments, p. 3.
(13): Fair Trials, Silgir v Germany (No. 2), Written Comments, p. 3.
(14): Julio Sánchez Abogados, “Sky y el agujero negro probatorio: reflexiones sobre un juicio”
(15): TEDH, Sigurður Einarsson and Others v Iceland, no. 39757/15, 4 de junio de 2019; TEDH, Rook v Germany, no. 1586/15, 25 de julio de 2019; TEDH, Yüksel Yalçınkaya v Türkiye, no. 15669/20, 26 de septiembre de 2023.
(15): Julio Sánchez Abogados, “Análisis de operaciones EncroChat y Sky y su impacto en art. 6 del CEDH”
(16): Fair Trials, Silgir v Germany (No. 2), Written Comments, p. 5.
(17): Julio Sánchez Abogados, “El principio de reconocimiento mutuo: no todo vale”
(18): Fair Trials, Silgir v Germany (No. 2), Written Comments, p. 3; TJUE, Staatsanwaltschaft Berlin v M.N. (EncroChat), C-670/22; Athina Sachoulidou, The Court of Justice in Staatsanwaltschaft Berlin v. M.N. (EncroChat): From cross-border, data-driven police investigations to evidence admissibility; Análisis de operaciones encrochat y sky y su impacto en el artículo 6 del CEDH disponible en https://www.juliosanchezabogados.es/blog/analisis-de-operaciones-encrochat-y-sky-y-su-impacto-en-art-6-del-cedh/ ; https://www.juliosanchezabogados.es/blog/derecho-penal/el-tjue-ha-dictado-sentencia-sobre-el-hackeo-de-encrochat/
(19): Fair Trials, Silgir v Germany (No. 2), Written Comments, p. 9.
(20): Julio Sánchez Abogados, “Sky ECC: ¿el fin justifica los medios?”
(21): Sobre investigaciones basadas en datos y Sky ECC, véase The future of data-driven investigations in light of the Sky ECC operation.
(22): Sobre EncroChat, Sky ECC, confianza mutua y admisibilidad, véase Georgios Sagittae, On the lawfulness of the EncroChat and Sky ECC-operations.
(23): Sobre límites al uso posterior de datos policiales, véase To have or have not: Limiting the data available for subsequent use by the police.

Facebook

Twitter

Big Data y proceso penal: límites, garantías y prueba digital en la era de los macrodatos

Big Data y proceso penal: límites, garantías y prueba digital en la era de los macrodatos

Big Data y proceso penal

Big Data y proceso penal: de la sospecha individual a la investigación prospectiva Eficacia tecnológica, prueba digital y garantías frente a la vigilancia indiscriminada

I. Introducción

II. Concepto de Big Data penal

III. Tipologías de Big Data en la investigación penal

1. Datos de comunicaciones

2. Datos biométricos

3. Datos financieros y administrativos

4. Datos abiertos, redes sociales y OSINT

5. Sistemas predictivos y análisis algorítmico

IV. El cambio de paradigma: de la sospecha al patrón

V.- El riesgo de investigación prospectiva e indiscriminada

VI. Privacidad, protección de datos y minimización

VII. Control judicial y trazabilidad del ciclo de vida del dato

VIII. Conversión del dato masivo en prueba penal

IX. Igualdad de armas y derecho de defensa

X. Derecho al silencio y carga imposible de la defensa

XI. Cooperación transfronteriza, reconocimiento mutuo y confianza mutua

XII. Hacia un estatuto garantista de la Big Data penal

1. Sospecha previa suficiente

2. Prohibición de investigaciones puramente exploratorias

3. Finalidad determinada

4. Autorización judicial reforzada

5. Minimización de datos

6. Trazabilidad completa

7. Registro de búsquedas y accesos

8. Control de usos secundarios

9. Acceso efectivo de la defensa

10. Exclusión de prueba no verificable

XIII. Conclusión

Notas

Julio Sánchez.- Abogados

Big Data y proceso penal: de la sospecha individual a la investigación prospectiva
Eficacia tecnológica, prueba digital y garantías frente a la vigilancia indiscriminada