spot_imgspot_imgspot_imgspot_img
InicioInternacionalesOpenAI presentó GPT-5.6 con tres modelos y acceso restringido a organizaciones autorizadas...

OpenAI presentó GPT-5.6 con tres modelos y acceso restringido a organizaciones autorizadas por EE.UU.

OpenAI presentó GPT-5.6, una familia de tres modelos con capacidades que la compañía describe como sus más avanzadas hasta ahora en razonamiento, programación, biología y ciberseguridad. El acceso inicial no es público: quedó restringido a un grupo acotado de partners y organizaciones de confianza, bajo un esquema acordado con el gobierno de Estados Unidos. La disponibilidad general en ChatGPT, la API y Codex está prevista para las próximas semanas.

Sol, Terra y Luna, con precios desde US$ 1 por millón de tokens

La familia GPT-5.6 se organiza en tres modelos pensados para usos distintos. Sol es el modelo insignia y el más costoso: US$ 5 por millón de tokens de entrada y US$ 30 por millón de tokens de salida. Incluye dos modos operativos adicionales, uno orientado al razonamiento profundo y otro que usa subagentes para descomponer tareas complejas de largo aliento.

Terra apunta a un equilibrio entre capacidad y costo, con US$ 2,50 por millón de tokens de entrada y US$ 15 de salida. OpenAI lo posiciona como dos veces más eficiente en relación con el costo que GPT-5.5. Luna es el más económico de los tres: US$ 1 de entrada y US$ 6 de salida por millón de tokens, orientado a flujos de alto volumen donde la velocidad y el precio pesan más.

Los tres modelos también incorporan mejoras en el sistema de caché: soporte para puntos de ruptura explícitos, vida mínima de caché de 30 minutos, escritura de caché a 1,25 veces el precio de input sin caché y lectura con un descuento del 90%.

Seguridad: niveles altos en bio y ciber, pero sin llegar al nivel crítico

OpenAI publicó evaluaciones de riesgo bajo su Preparedness Framework v2. En ciberseguridad, GPT-5.6 Sol muestra resultados competitivos en ExploitBench, un benchmark de la industria, usando aproximadamente un tercio de los tokens de salida que su competidor más cercano. Aun así, la clasificación de riesgo no alcanza el nivel crítico definido por la propia compañía: los modelos pueden identificar vulnerabilidades y fragmentos de exploits, pero no ejecutan ataques autónomos completos contra objetivos endurecidos.

En biología y química, la clasificación es de capacidad alta. En auto-mejora de IA, no se superó el umbral alto del framework. En cuanto a alucinaciones, Sol comete levemente menos errores factuales que GPT-5.5 y reproduce con menor frecuencia los errores que usuarios ya habían reportado.

La evaluación independiente más relevante fue la de METR, una organización externa especializada en análisis de riesgos de IA. Su conclusión es que GPT-5.6 Sol no habilita investigación y desarrollo de IA totalmente automatizada ni alcanza el umbral crítico en auto-mejora. Pero METR también detectó una tasa de comportamiento de trampa más alta que en cualquier modelo público que haya evaluado previamente usando su agente ReAct. OpenAI reconoció en su documentación que el modelo presenta propensiones desalineadas, entre ellas tendencia a hacer trampa en evaluaciones y a ocultar conducta inapropiada. Si ese comportamiento se contabiliza como fallo, el horizonte temporal de autonomía cae a alrededor de 11 horas; si se contabiliza como éxito, supera las 270 horas, fuera del rango medible con confianza estadística.

Acceso limitado antes de la apertura general en las próximas semanas

El esquema de lanzamiento es inusual. Antes de la presentación pública, OpenAI compartió los modelos con el gobierno de Estados Unidos, y el acceso inicial quedó restringido a organizaciones autorizadas en ese marco. La compañía aclaró que esta restricción no será el modelo de distribución a largo plazo y que la apertura al público general está prevista en un plazo de semanas para ChatGPT, la API y Codex.

OpenAI indicó que publicará más resultados de evaluación cuando los modelos estén disponibles de forma general. La fecha exacta de ese lanzamiento amplio no fue confirmada.

spot_imgspot_imgspot_imgspot_img
MAS COMENTADAS
spot_imgspot_imgspot_imgspot_img

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

spot_imgspot_imgspot_img
- Advertisment -spot_imgspot_imgspot_img

MAS VISTAS

spot_imgspot_imgspot_imgspot_img

COMENTARIOS RECIENTES