🤿 Lab 01: Inmersión Profunda (Deep Dive)¶
Escenario de Misión
Eres el nuevo Data Guardian de Atlantyqa. Se te ha confiado un documento confidencial con datos financieros y personales. Tu misión: procesarlo y extraer inteligencia sin que una sola cifra o nombre real toque la nube.
1. 🗺️ Mapa de Operaciones¶
Antes de tocar una tecla, visualiza el flujo de datos seguro.
graph TD
Input[📄 Documento Raw] -->|Ingesta| Clean[🧹 Limpieza]
Clean -->|Redacción con SpaCy| Safe[🛡️ Tokens Seguros]
Safe -->|Análisis| Json[💎 JSON Final]
style Input fill:#e7ae4c,stroke:#333,stroke-width:2px,color:#fff
style Clean fill:#37a880,stroke:#333,stroke-width:2px,color:#fff
style Safe fill:#e0e7ff,stroke:#333,stroke-width:2px,color:#182232
style Json fill:#f1f5f9,stroke:#182232,stroke-width:2px,color:#182232
2. ⚔️ Ejecución de la Misión¶
Sigue los pasos con precisión quirúrgica.
Crea un archivo confidencial.txt en data/input/ con datos falsos (pero realistas) y ejecútalo.
Activa el escudo de privacidad. La variable COGNITIVE_REDACT es tu mejor amiga.
Comprueba que el sistema funcionó. Abre el JSON resultante.
- Esperado:
"PERSON": "[REDACTED]" - Fallido:
"PERSON": "Juan Pérez"
3. 📸 Recolección de Evidencia¶
Para reclamar tu recompensa (XP), debes presentar pruebas.
Checklist de Entrega¶
- [ ] JSON de Salida: Confirma que no hay nombres reales.
- [ ] Log de Auditoría: Verifica que
outputs/audit/tiene una entrada nueva. - [ ] Captura de Pantalla: Muestra tu terminal con el mensaje "Success".
📝 Plantilla para tu Pull Request
## 🛡️ Misión Lab 01 Completada
- **Hash del Archivo:** [Insertar Hash]
- **Estado de Redacción:** ✅ Activado
- **Incidentes:** Ninguno
Adjunto evidencia en /evidence folder.
🆘 ¿Problemas Comunes?¶
Mi documento no se procesa
- ¿Está en
data/input? - ¿Tiene extensión
.txto.pdf? - ¿Tienes permisos de escritura en
outputs/?
No veo datos redactados
Asegúrate de que la variable de entorno está bien seteada. Haz un echo $env:COGNITIVE_REDACT para comprobar.