La compañía de IA confirmó la existencia del nuevo modelo, que se cree que se llama Claude Mythos, después de que detalles de su desarrollo se filtraran accidentalmente a través de una caché de datos pública y no segura, descubierta por la revista Fortune.
Un portavoz de Anthropic declaró a Fortune:
'Estamos desarrollando un modelo de propósito general con avances significativos en razonamiento, programación y ciberseguridad. Dada la potencia de sus capacidades, estamos siendo muy cuidadosos con su lanzamiento. Consideramos que este modelo representa un cambio radical y es el más potente que hemos creado hasta la fecha'.
La compañía de IA indicó que el modelo está siendo probado actualmente por un pequeño grupo de clientes con acceso anticipado y que aún no está listo para su lanzamiento general, en parte debido a su costo operativo y las preocupaciones sobre ciberseguridad.
Según el borrador filtrado de la publicación del blog, revisado por Fortune, el modelo 'actualmente supera con creces a cualquier otro modelo de IA en capacidades cibernéticas', lo que genera temores de que pueda ser explotado por hackers para lanzar ciberataques a gran escala.
Anthropic confirmó que la filtración de datos fue resultado de un 'error humano' en la configuración de su sistema de gestión de contenido, y la compañía eliminó el acceso público al repositorio de datos tras ser alertada por Fortune.