13 de diciembre de 2024: La Universidad de Harvard ha lanzado un conjunto de datos de casi un millón de libros de dominio público para el entrenamiento de modelos de IA. Financiado por Microsoft y OpenAI, el conjunto de datos incluye libros escaneados de Google Books con derechos de autor vencidos.