En 2023, Meta dio a conocer una serie de modelos de lenguaje llamados LLaMA que, aunque de alta calidad, no seguían instrucciones. Estos modelos habían sido entrenados por más de 80,000 horas de GPU cada uno, utilizando trillones de palabras de la web. Poco después, en marzo, Stanford presentó el modelo Alpaca, basado en LLaMA, pero ajustado con un pequeño conjunto de datos de 50,000 preguntas y respuestas «humanas» que, sorprendentemente, lo hacían exhibir una interactividad similar a la de ChatGPT.
Databricks presenta Dolly, un modelo de lenguaje económico que exhibe un sorprendente grado de habilidades de seguimiento de instrucciones, similares a las de ChatGPT. Inspirado en el Centro de Investigación de Modelos de Fundación de Stanford y en particular en el equipo detrás de Alpaca, Dolly demuestra el potencial de los modelos de lenguaje grandes, incluso aquellos que no son los más grandes del mercado, para seguir instrucciones con pequeños conjuntos de datos de alta calidad.
Databricks ha publicado el código de Dolly como un cuaderno Databricks que puede ejecutarse en su plataforma. Sin duda modelos como Dolly democratizarán los LLM, transformándolos en algo que todas las empresas pueden permitirse y personalizar para mejorar sus productos.
No debemos olvidarnos que los modelos de inteligencia artificial generativa como Dolly son una tecnología emergente y aún están en las primeras etapas de la investigación sobre cómo abordar la precisión factual, el sesgo, las respuestas ofensivas, la toxicidad general y las alucinaciones en los modelos. Es importante que los usuarios ejerzan buen juicio en el diseño de aplicaciones utilizando esta tecnología.
La presentación de Dolly es la primera de una serie de anuncios de Databricks que se centrarán en ayudar a todas las organizaciones a aprovechar el poder de los modelos de lenguaje grandes. Asi que estaremos atentos a más noticias.
- [con]Neurona #18 - 24 de junio de 2023
- Snowflake en conversaciones avanzadas para adquirir la startup de búsqueda de inteligencia artificial Neeva - 18 de mayo de 2023
- La importancia de la anotación de la tonalidad de piel en la visión por computadora - 16 de mayo de 2023