Saltar a contenido

🤿 Lab 01: Inmersión Profunda (Deep Dive)

Escenario de Misión

Eres el nuevo Data Guardian de Atlantyqa. Se te ha confiado un documento confidencial con datos financieros y personales. Tu misión: procesarlo y extraer inteligencia sin que una sola cifra o nombre real toque la nube.


1. 🗺️ Mapa de Operaciones

Antes de tocar una tecla, visualiza el flujo de datos seguro.

graph TD
    Input[📄 Documento Raw] -->|Ingesta| Clean[🧹 Limpieza]
    Clean -->|Redacción con SpaCy| Safe[🛡️ Tokens Seguros]
    Safe -->|Análisis| Json[💎 JSON Final]

    style Input fill:#e7ae4c,stroke:#333,stroke-width:2px,color:#fff
    style Clean fill:#37a880,stroke:#333,stroke-width:2px,color:#fff
    style Safe fill:#e0e7ff,stroke:#333,stroke-width:2px,color:#182232
    style Json fill:#f1f5f9,stroke:#182232,stroke-width:2px,color:#182232

2. ⚔️ Ejecución de la Misión

Sigue los pasos con precisión quirúrgica.

Crea un archivo confidencial.txt en data/input/ con datos falsos (pero realistas) y ejecútalo.

python cogctl.py ingest confidencial.txt

Activa el escudo de privacidad. La variable COGNITIVE_REDACT es tu mejor amiga.

# En PowerShell
$env:COGNITIVE_REDACT="1"; python cogctl.py analyze

# En Bash
COGNITIVE_REDACT=1 python cogctl.py analyze

Comprueba que el sistema funcionó. Abre el JSON resultante.

  • Esperado: "PERSON": "[REDACTED]"
  • Fallido: "PERSON": "Juan Pérez"

3. 📸 Recolección de Evidencia

Para reclamar tu recompensa (XP), debes presentar pruebas.

Checklist de Entrega

  • [ ] JSON de Salida: Confirma que no hay nombres reales.
  • [ ] Log de Auditoría: Verifica que outputs/audit/ tiene una entrada nueva.
  • [ ] Captura de Pantalla: Muestra tu terminal con el mensaje "Success".

📝 Plantilla para tu Pull Request


## 🛡️ Misión Lab 01 Completada

- **Hash del Archivo:** [Insertar Hash]
- **Estado de Redacción:** ✅ Activado
- **Incidentes:** Ninguno

Adjunto evidencia en /evidence folder.
    

🆘 ¿Problemas Comunes?

Mi documento no se procesa
  • ¿Está en data/input?
  • ¿Tiene extensión .txt o .pdf?
  • ¿Tienes permisos de escritura en outputs/?
No veo datos redactados

Asegúrate de que la variable de entorno está bien seteada. Haz un echo $env:COGNITIVE_REDACT para comprobar.