Este artículo presenta el enfoque de Batched Prompting utilizado para etiquetar preferencias de manera eficiente con GPT-4, donde todas las respuestas candidatas se evalúan en un solo lote en lugar de individualmente. El análisis de costos de escalar el experimento a 600k entradas de entrenamiento revela que el muestreo fue la etapa más demorada y costosa, con un costo aproximado de $6,000 por iteración. La anotación fue el costo más alto, ascendiendo a $34,000 por iteración debido a los volúmenes de tokens. El entrenamiento fue relativamente económico, requiriendo solo 12-24 horas.