13-déc-24: L’université de Harvard a lancé un ensemble de données de près d’un million de livres du domaine public pour la formation des modèles d’IA. Financé par Microsoft et OpenAI, l’ensemble de données comprend des livres numérisés de Google Books dont les droits d’auteur ont expiré.