Buscar

Una nueva investigación de la Unit 42 revela que DeepSeek es vulnerable al jailbreak

l día de hoy, Unit 42 de Palo Alto Networks publicó una investigación que revela que DeepSeek es preocupantemente vulnerable al jailbreak y puede producir contenido nefasto con poco o ningún conocimiento o experiencia especializada.

Los investigadores de Unit 42 descubrieron recientemente dos técnicas de jailbreak novedosas y efectivas, Deceived Delight y Bad Likert Judge. Dado su éxito frente a otros LLM, Unit 42 de Palo Alto Networks probó estos dos jailbreak y otra técnica de jailbreak de varias etapas llamada Crescendo contra modelos DeepSeek.

La investigación revela:

  • Altas tasas de éxito de bypass/jailbreak, lo que resalta los riesgos potenciales de estos vectores de ataque emergentes que pueden ser utilizados por actores maliciosos.
  • Los métodos de jailbreak pueden generar orientación explícita para actividades maliciosas y podrían acelerar en gran medida sus operaciones.
  • Las actividades maliciosas incluyen la creación de registradores de teclas, el robo y la exfiltración de datos, e incluso instrucciones para dispositivos incendiarios, lo que demuestra los riesgos de seguridad tangibles.

Para mayor información, accede al blog de Unit 42.