Detectando el Texto Escrito por Humanos y Máquinas
Este clasificador utiliza técnicas de aprendizaje automático para evaluar una variedad de textos y determinar si es probable que haya sido escrito por un humano o por un sistema de IA. Aunque no es una solución perfecta, nuestro clasificador ha logrado identificar correctamente el 26% de los textos generados por IA y etiquetarlos como «probablemente escritos por IA». Además, la confiabilidad del clasificador aumenta a medida que aumenta la longitud del texto de entrada.
Es importante destacar que aún existen desafíos en la detección de texto generado por IA y que el clasificador que han creado fundamentalmente para identificar textos de ChatGPT , aún tiene margen de mejora. En 9% de los casos, el clasificador etiquetó incorrectamente el texto escrito por humanos como texto generado por IA.
Aseguran que están haciendo público este clasificador con la esperanza de recibir retroalimentación de la comunidad y continuar mejorándolo. La detección de texto generado por IA es un campo en constante evolución y esperamos compartir métodos aún más avanzados en el futuro.
¿Como se ha entrenado este clasificador ?
El entrenamiento del clasificador se realizó utilizando un conjunto de datos compuesto por pares de texto escritos por humanos y por IA sobre el mismo tema. Para obtener este conjunto de datos, se recopilaron fuentes creídas ser escritas por humanos, como datos previos al entrenamiento y demostraciones humanas en instrucciones enviadas a InstructGPT.
Cada texto se dividió en una pregunta y una respuesta, y las respuestas se generaron a partir de diferentes modelos de lenguaje entrenados por la organización y otras instituciones. Para la aplicación web, se ajustó el umbral de confianza para mantener una tasa baja de falsos positivos.
Impacto en los educadores y solicitud de aportes
El impacto de los clasificadores de texto generados por IA en el ámbito educativo ha sido objeto de discusión fundamentalmente en sectores como la Educación.
La organización ha desarrollado un recurso para educadores que describe algunos de los usos y limitaciones asociados al uso de ChatGPT. Este recurso se enfoca en los educadores, pero se espera que el clasificador y las herramientas relacionadas tengan un impacto en otros grupos, como los periodistas y los investigadores de información errónea y desinformación.
OpenAI está trabajando con educadores en los Estados Unidos para comprender las experiencias en las aulas y discutir las capacidades y limitaciones de ChatGPT. Estas conversaciones son importantes en la misión de implementar modelos de lenguaje grandes de manera segura y en colaboración con las comunidades afectadas.
La retroalimentación directa y los recursos desarrollados o encontrados útiles por los educadores son apreciados y se pueden enviar a través de un formulario en línea.
- [con]Neurona #31 - 28 de enero de 2024
- [con]Neurona #30 - 20 de enero de 2024
- [con]Neurona #29 - 14 de enero de 2024