README.md

git clone https://github.com/FactoDeepLearning/DAN.git
pip install -r requirements.txt
python3 Datasets/dataset_formatters/read2016_formatter.py
python3 Datasets/dataset_formatters/rimes_formatter.py
python3 OCR/line_OCR/ctc/main_syn_line.py
model.generate_syn_line_dataset("READ_2016_syn_line")
dataset_name = "READ_2016"
python3 OCR/line_OCR/ctc/main_line_ctc.py
dataset_name = "READ_2016"
"output_folder": "FCN_read_line_syn"
python3 OCR/document_OCR/dan/main_dan.py
dataset_name = "READ_2016"
"transfer_learning": {
    # model_name: [state_dict_name, checkpoint_path, learnable, strict]
    "encoder": ["encoder", "../../line_OCR/ctc/outputs/FCN_read_2016_line_syn/checkpoints/best.pt", True, True],
    "decoder": ["decoder", "../../line_OCR/ctc/outputs/FCN_read_2016_line_syn/best.pt", True, False],
},
pip install -e .
import cv2
from dan.predict import DAN

image = cv2.cvtColor(cv2.imread(IMAGE_PATH), cv2.COLOR_BGR2RGB)
model_path = 'model.pt'
params_path = 'parameters.yml'
charset_path = 'charset.pkl'

model = DAN('cpu')
model.load(model_path, params_path, charset_path, mode="eval")
text, confidence_scores = model.predict(image, confidences=True)
@misc{Coquenet2022b,
  author = {Coquenet, Denis and Chatelain, Clément and Paquet, Thierry},
  title = {DAN: a Segmentation-free Document Attention Network for Handwritten Document Recognition},
  doi = {10.48550/ARXIV.2203.12273},
  url = {https://arxiv.org/abs/2203.12273},
  publisher = {arXiv},
  year = {2022},
}