
l día de hoy, Unit 42 de Palo Alto Networks publicó una investigación que revela que DeepSeek es preocupantemente vulnerable al jailbreak y puede producir contenido nefasto con poco o ningún conocimiento o experiencia especializada.
Los investigadores de Unit 42 descubrieron recientemente dos técnicas de jailbreak novedosas y efectivas, Deceived Delight y Bad Likert Judge. Dado su éxito frente a otros LLM, Unit 42 de Palo Alto Networks probó estos dos jailbreak y otra técnica de jailbreak de varias etapas llamada Crescendo contra modelos DeepSeek.
La investigación revela:
- Altas tasas de éxito de bypass/jailbreak, lo que resalta los riesgos potenciales de estos vectores de ataque emergentes que pueden ser utilizados por actores maliciosos.
- Los métodos de jailbreak pueden generar orientación explícita para actividades maliciosas y podrían acelerar en gran medida sus operaciones.
- Las actividades maliciosas incluyen la creación de registradores de teclas, el robo y la exfiltración de datos, e incluso instrucciones para dispositivos incendiarios, lo que demuestra los riesgos de seguridad tangibles.
Para mayor información, accede al blog de Unit 42.