Bonjour Christophe,
Merci pour cette question.
La méthodologie la plus aboutie actuellement est celle de l'université lyon 2 :
1. La DSI sort deux fichiers csv. L'un répertorie les cours présents sur la plateforme, l'autre les cours vides (donc sans aucune information à l'intérieur).
2. Le service archives fusionne ces deux documents et enrichie le nouveau fichier avec l'aide des ingénieurs pédagogiques (composante, code apogée, formation, niveau, type de cours, nom du cours, enseignant etc).
3. A partir de ce fichier, un échantillonnage est mis en place : pour les cours par exemple, le CST du Rhône a défini qu'on récupèrerait 1 cours sur 15 (si le cours est un CM, nous récupérons également les TD associés). L'objectif dans cet échantillonnage est que toutes les composantes et les niveaux soient représentés. A cet étape, rien n'a encore été extrait de Moodle.
4. Maintenant que les archivistes ont identifiés les cours qu'ils souhaitent récupérer, ils se connectent à la plateforme et, a mano, enregistrent les documents sur une nouvelle arborescence, sur un serveur. Ils cliquent donc sur le doc, le télécharge, le passe en PDF/A, le renomme et l'enregistre. Aucune impression n'est faite, tout reste numérique. Après avoir récupéré l'intégralité des pièces téléchargeables sous format vidéos, audios ou bureautique, l'archiviste récupère le cours ou la structure du cours incrémenté directement en html dans Moodle, à partir d'une impression de la page du cours. Toutes ces pièces sont mises dans le dossier du cours et l'action se répète jusqu'à la fin de la collecte. Par exemple, les archivistes de Lyon 2 ont pris 7 jours à deux pour extraire les cours sélectionnés pour une seule année universitaire (actions très chronophages).
L'arborescence numérique ressemble au final à cela :
Composante (Nom_comportante)
Nom du cours (Codeenseignement_Nom_enseignement_CM ou TD)
Nom du fichier 1
Nom du fichier 2
.... etc.
5. Après traitement archivistique et renseignement de documents obligatoires au versement, le "paquet" d'archives est transféré aux archives départementales pour conservation sur le très long terme.
Le but de la présentation était tout d'abord de montrer que nous avons une méthode pour récupérer les pièces (le contenu) disponibles sur Moodle mais que nous sommes convaincus qu'une automatisation de la collecte serait possible (extractions en masse, échantillonnage directement sur la plateforme etc.). Dans tous les cas ces pièces doivent être dans un format pérenne (PDFA, mp4, wav) et accepté par les archives départementales. Nous sommes d'ailleurs ouverts à toute proposition nous permettant d'améliorer ou de simplifier notre méthode de collecte.
Enfin, le but était de montrer que nous souhaitons récupérer "l'expérience moodle" c'est à dire le fonctionnement de la plateforme, sa structuration, ses multiples possibilités. Pour cela, nous n'avons pas de solutions actuellement. Les aspirateurs, par exemple, ne fonctionnent pas car pour aspirer il faut se connecter/s'identifier sur Moodle. Ils nous manquent dans le GT Archivage de Moodle des compétences techniques pour nous permettre d'avancer sur ce point.
J'espère avoir répondu à votre question.
N'hésitez pas à me recontacter au besoin.
Si vous êtes intéressés par le GT, vous pouvez m'envoyer un mail à aurelia.ducci@insa-lyon.fr
Cordialement,
Aurelia