Más detalles sobre las protecciones cibernéticas de Fable 5 y nuestro marco de trabajo para jailbreaks
Resumen
Fable 5 ya está disponible globalmente con medidas de seguridad cibernética mejoradas, incluidos clasificadores diseñados para bloquear usos peligrosos mientras se permiten los benignos. El sistema clasifica las actividades en cuatro niveles: prohibido, uso dual de alto riesgo, uso dual de bajo riesgo y uso benigno. Como complemento, la empresa ha propuesto un borrador de un "Marco de Gravedad de Jailbreak Cibernético" (CJS). Esta escala evalúa los riesgos según la ganancia de capacidad, la amplitud del uso, la facilidad de armamento y la descubribilidad, buscando establecer un lenguaje industrial estandarizado para evaluar y mitigar las amenazas a la seguridad de los modelos de IA.
(Fuente:Anthropic)