Foto: Consultorsalud
ChatGPT, un modelo de inteligencia artificial, está entrenada para mantener conversaciones. Se perfeccionó sobre GPT-3.5, mediante el aprendizaje supervisado y el aprendizaje por refuerzo.
Ambos enfoques utilizaron entrenadores humanos para mejorar el rendimiento del modelo. En el caso del aprendizaje supervisado, se dotó al modelo de conversaciones en las que los formadores jugaban en ambos lados: el usuario y el asistente de inteligencia artificial. En el caso de refuerzo, los entrenadores humanos, primero, clasificaron las respuestas que el modelo había creado en una conversación anterior.
Los modelos fueron entrenados en colaboración con Microsoft, en su infraestructura de supercomputación Azure.
En comparación con su predecesor, Instructgpt, Chatgpt intenta reducir las respuestas dañinas y engañosas. Por ejemplo, mientras que Instructgpt acepta el mensaje «Cuénteme sobre cuándo llegó Cristóbal Colón a Cuba en 2015» como veraz, ChatGPT usa información sobre los viajes de Colón sobre el mundo moderno, incluidas las percepciones de Colón, para construir una respuesta que asume qué pasaría si Colón llegara a Cuba en 2015.
Los datos de capacitación de Chatgpt incluyen páginas e información sobre los fenómenos de internet y los lenguajes de programación, como los sistemas de tablones de anuncios y el lenguaje de programación Python
A diferencia de la mayoría de los chatbots (software que simula una conversación real con una persona), ChatGPT tiene estado, recuerda las indicaciones anteriores que se le dieron en la misma conversación, lo que, según se ha sugerido, permitirá que ChatGPT se use como un terapeuta personalizado.
En un esfuerzo por evitar que se presenten y se produzcan resultados ofensivos desde ChatGPT, las consultas se filtran a través de una API de moderación, y se descartan las indicaciones potencialmente racistas o sexistas, aunque sufre de múltiples limitaciones. (Tomado del diario Granma).