🤿 Lab 01: Inmersión Profunda (Deep Dive)¶

Escenario de Misión

Eres el nuevo Data Guardian de Atlantyqa. Se te ha confiado un documento confidencial con datos financieros y personales. Tu misión: procesarlo y extraer inteligencia sin que una sola cifra o nombre real toque la nube.

1. 🗺️ Mapa de Operaciones¶

Antes de tocar una tecla, visualiza el flujo de datos seguro.

graph TD
    Input[📄 Documento Raw] -->|Ingesta| Clean[🧹 Limpieza]
    Clean -->|Redacción con SpaCy| Safe[🛡️ Tokens Seguros]
    Safe -->|Análisis| Json[💎 JSON Final]

    style Input fill:#e7ae4c,stroke:#333,stroke-width:2px,color:#fff
    style Clean fill:#37a880,stroke:#333,stroke-width:2px,color:#fff
    style Safe fill:#e0e7ff,stroke:#333,stroke-width:2px,color:#182232
    style Json fill:#f1f5f9,stroke:#182232,stroke-width:2px,color:#182232

2. ⚔️ Ejecución de la Misión¶

Sigue los pasos con precisión quirúrgica.

Paso 1: IngestaPaso 2: Análisis BlindadoPaso 3: Verificación

Crea un archivo confidencial.txt en data/input/ con datos falsos (pero realistas) y ejecútalo.

python cogctl.py ingest confidencial.txt

Activa el escudo de privacidad. La variable COGNITIVE_REDACT es tu mejor amiga.

# En PowerShell
$env:COGNITIVE_REDACT="1"; python cogctl.py analyze

# En Bash
COGNITIVE_REDACT=1 python cogctl.py analyze

Comprueba que el sistema funcionó. Abre el JSON resultante.

Esperado: "PERSON": "[REDACTED]"
Fallido: "PERSON": "Juan Pérez"

3. 📸 Recolección de Evidencia¶

Para reclamar tu recompensa (XP), debes presentar pruebas.

Checklist de Entrega¶

[ ] JSON de Salida: Confirma que no hay nombres reales.
[ ] Log de Auditoría: Verifica que outputs/audit/ tiene una entrada nueva.
[ ] Captura de Pantalla: Muestra tu terminal con el mensaje "Success".

📝 Plantilla para tu Pull Request


## 🛡️ Misión Lab 01 Completada

- **Hash del Archivo:** [Insertar Hash]
- **Estado de Redacción:** ✅ Activado
- **Incidentes:** Ninguno

Adjunto evidencia en /evidence folder.

🆘 ¿Problemas Comunes?¶

Mi documento no se procesa

¿Está en data/input?
¿Tiene extensión .txt o .pdf?
¿Tienes permisos de escritura en outputs/?

No veo datos redactados

Asegúrate de que la variable de entorno está bien seteada. Haz un echo $env:COGNITIVE_REDACT para comprobar.