Por favor active JavaScript para poder aprovechar la funcionalidad completa de GMX.

Open AI presenta CriticGPT para encontrar y resolver errores de código

Open AI presenta CriticGPT para encontrar y resolver errores de código

OpenAI presentó CriticGPT para ayudar a los desarrolladores a identificar y corregir errores en el código generado por ChatGPT.

El modelo se basa en GPT-4 y afirman que está demostrado que quienes lo utilizan 'superan en un 60 por ciento' a quienes no reciben la ayuda.

En general, hará que la IA sea más confiable.

En una publicación de blog reciente, la firma dijo:

'Hemos entrenado un modelo, basado en GPT-4, llamado CriticGPT para detectar errores en la salida del código de ChatGPT. Descubrimos que cuando las personas reciben ayuda de CriticGPT para revisar el código de ChatGPT, superan a aquellos sin ayuda el 60 por ciento del tiempo, estamos comenzando el trabajo para integrar modelos similares a CriticGPT en nuestra línea de etiquetado RLHF, brindando a nuestros capacitadores asistencia explícita de IA. Este es un paso para poder evaluar los resultados de los sistemas avanzados de IA que pueden. Será difícil para las personas calificar sin mejores herramientas'.

La publicación continuó:

'La serie de modelos GPT-4, que impulsa ChatGPT, está diseñada para ser útil e interactiva a través del “Aprendizaje reforzado a partir de la retroalimentación humana (RLHF). Una parte clave de RLHF es recopilar comparaciones en las que las personas, llamadas entrenadores de IA, califican diferentes Respuestas de ChatGPT entre sí'.

Y la publicación concluyó:

'A medida que avanzamos en el razonamiento y modelamos el comportamiento, ChatGPT se vuelve más preciso y sus errores se vuelven más sutiles. Esto puede dificultar que los entrenadores de IA detecten imprecisiones cuando ocurren, lo que hace que la tarea de comparación que impulsa a RLHF sea mucho más difícil. Esto es una limitación fundamental de RLHF, y puede hacer que sea cada vez más difícil alinear los modelos a medida que gradualmente adquieran más conocimientos que cualquier persona que pueda proporcionar retroalimentación (sic)'.

Contenido patrocinado

Artículos relacionados