import Transkribus : sont importées toutes les 'versions' de la transcription d'une page
Il y a du versioning sur Transkribus, et quand on importe une page où il y a eu plusieurs 'états' de transcriptions, ça les importe tous ; on le voit dans les logs où ça importe plusieurs 'transcripts' pour une même page.
Ex : https://arkindex.dev.teklia.com/element/c06a36e5-cec7-4526-b0ba-030b75ca5d1d (3 'transcripts') et https://arkindex.dev.teklia.com/element/7758b552-78cc-4c95-b7fb-3bd4be124b68 (2 'transcripts'.) Pour c06a36e5-cec7-4526-b0ba-030b75ca5d1d j'ai remplacé le texte des transcriptions dans les fichiers xml, puis synchronisé avec le doc dans Tranzkribus ; c'est pour ça qu'il y a des entités pcq j'ai rien modifié d'autre que le texte dans les balises Unicode. Pour 7758b552-78cc-4c95-b7fb-3bd4be124b68 j'ai changé le texte dans Transkribus manuellement.
On ne peut pas distinguer les différentes transcriptions du coup ça les mélange toutes, on le voit en survolant les lignes.
On pourrait ne récupérer, par défaut, que la dernière version de la transcription ?