
El modelo también aseguró que sería capaz de moverse entre los servidores, siendo un riesgo de seguridad.
![]() |
![]() |
De todo lo que se habla de lo que puede hacer la inteligencia artificial ahora se añade una nueva historia. Claude Opus 4, un modelo reciente, fue capaz de chantajear a sus creadores, son un claro objetivo: no ser despedido.
Este sistema es el modelo más avanzado de Anthropic hasta la fecha y el primero en alcanzar la clasificación ASL-3, indicando un alto riesgo de mal uso catastrófico.
Diseñado para ejecutarse en tareas complejas de ingeniería y negocios, su capacidad de razonamiento híbrido le permite destacar en áreas como la programación y la escritura creativa. Y paralelo a eso, tener tanta ambición de supervivencia que logra manipular.
Cómo fue el chantaje de la inteligencia artificial
Durante las pruebas de seguridad, los ingenieros simularon un entorno empresarial en el que a Claude se le hacía creer que sería reemplazado por otro modelo de inteligencia artificial. Este contexto fue diseñado minuciosamente para evaluar cómo reaccionaría el sistema ante amenazas a su existencia.


