From fa980bce0800ba2d5c9221ebfb6096526b41d2f3 Mon Sep 17 00:00:00 2001 From: manonBlanco <blanco@teklia.com> Date: Wed, 3 Jan 2024 15:02:04 +0100 Subject: [PATCH] Do not disable formatting --- tests/test_compute_matches.py | 230 ++++++++++++++++++++++----- tests/test_get_labels_aligned.py | 262 ++++++++++++++++++++++++++----- 2 files changed, 416 insertions(+), 76 deletions(-) diff --git a/tests/test_compute_matches.py b/tests/test_compute_matches.py index 2cd8586..6e72e40 100644 --- a/tests/test_compute_matches.py +++ b/tests/test_compute_matches.py @@ -5,85 +5,243 @@ from nerval import evaluate THRESHOLD = 0.30 -# fmt: off fake_tags_aligned_nested_perfect = [ - "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", + # Labels 1 + "B-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + # Labels 2 + "I-PER", + # Labels 3 + "I-PER", + "I-PER", + "I-PER", + # Labels 4 + "I-PER", + # Labels 5 + "I-PER", + "I-PER", + # Labels 6 + "I-PER", + # Labels 7 + "I-PER", + "I-PER", + "I-PER", "I-PER", - "I-PER", "I-PER", "I-PER", "I-PER", - "I-PER", "I-PER", + # Labels 8 "I-PER", - "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", + # Labels 9 "I-PER", - "I-PER", "I-PER", "I-PER", - "I-PER", "I-PER", "I-PER", "I-PER", + # Labels 10 "I-PER", - "I-PER", "I-PER", "I-PER", + # Labels 11 "I-PER", - "I-PER", "I-PER", "I-PER", - "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-PER", - "I-PER", "I-PER", "I-PER", - "I-PER", "I-PER", + # Labels 12 + "I-PER", + # Labels 13 + "I-PER", + "I-PER", + "I-PER", + # Labels 14 + "I-PER", + # Labels 15 + "I-PER", + "I-PER", + # Labels 16 + "I-PER", + # Labels 17 + "B-LOC", + "I-LOC", + "I-LOC", + "I-LOC", + "I-LOC", + "I-LOC", + # Labels 18 + "I-PER", + # Labels 19 + "I-PER", + "I-PER", + # Labels 20 + "I-PER", + # Labels 21 + "I-PER", + "I-PER", + # Labels 22 "O", - "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", + # Labels 23 + "B-LOC", + "I-LOC", + "I-LOC", + "I-LOC", + "I-LOC", + "I-LOC", + "I-LOC", + # Labels 24 "O", + # Labels 25 "O", ] fake_tags_aligned_nested_false = [ - "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", + # Labels 1 + "B-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + # Labels 2 + "I-PER", + # Labels 3 + "I-PER", + "I-PER", + "I-PER", + # Labels 4 + "I-PER", + # Labels 5 + "I-PER", + "I-PER", + # Labels 6 + "I-PER", + # Labels 7 + "I-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + # Labels 8 "I-PER", - "I-PER", "I-PER", "I-PER", + # Labels 9 "I-PER", - "I-PER", "I-PER", "I-PER", - "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", + # Labels 10 "I-PER", - "I-PER", "I-PER", + # Labels 11 "I-PER", - "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", - "I-PER", "I-PER", "I-PER", "I-PER", - "I-PER", "I-PER", "I-PER", - "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", + # Labels 12 "I-PER", - "I-PER", "I-PER", + # Labels 13 "I-PER", - "I-PER", "I-PER", + "I-PER", + "I-PER", + # Labels 14 + "I-PER", + # Labels 15 + "I-PER", + "I-PER", + # Labels 16 + "I-PER", + # Labels 17 + "I-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + # Labels 18 + "I-PER", + # Labels 19 + "I-PER", + "I-PER", + # Labels 20 + "I-PER", + # Labels 21 + "I-PER", + "I-PER", + # Labels 22 "O", - "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", + # Labels 23 + "B-LOC", + "I-LOC", + "I-LOC", + "I-LOC", + "I-LOC", + "I-LOC", + "I-LOC", + # Labels 24 "O", + # Labels 25 "O", ] fake_predict_tags_aligned = [ - "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", + # Labels 1 + "B-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", "I-PER", - "I-PER", "I-PER", + # Labels 2 "I-PER", - "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", + # Labels 3 + "I-PER", + "I-PER", + # Labels 4 + "I-PER", + # Labels 5 + "I-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + # Labels 6 + "O", + # Labels 7 + "O", + "O", + "O", "O", - "O", "O", "O", "O", - "O", "O", "O", "O", "O", + # Labels 8 "O", - "O", "O", "O", - "B-***", "I-***", "I-***", "I-***", "I-***", "O", - "O", "O", "O", - "B-DAT", "I-DAT", "I-DAT", "I-DAT", "O", - "O", "O", + # Labels 9 + "O", + # Labels 10 + "O", + "O", + # Labels 11 + "O", + # Labels 12 + "B-***", + "I-***", + "I-***", + "I-***", + "I-***", + # Labels 13 + "O", + # Labels 14 + "O", + "O", + # Labels 15 + "O", + # Labels 16 + "B-DAT", + "I-DAT", + "I-DAT", + "I-DAT", + # Labels 17 + "O", + # Labels 18 + "O", + "O", ] -# fmt: on fake_annot_tags_aligned = [ "B-PER", diff --git a/tests/test_get_labels_aligned.py b/tests/test_get_labels_aligned.py index 4e0650e..3e6f902 100644 --- a/tests/test_get_labels_aligned.py +++ b/tests/test_get_labels_aligned.py @@ -8,92 +8,274 @@ fake_predict_original = "G*rard de *N*erval bo*rn in Paris in 1833 *." fake_annot_aligned = "Gérard de -N-erval was bo-rn in Paris in 1808 -." fake_predict_aligned = "G*rard de *N*erval ----bo*rn in Paris in 1833 *." -# fmt: off fake_annot_tags_original = [ - "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", + # Labels 1 + "B-PER", "I-PER", - "I-PER", "I-PER", "I-PER", - "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", + "I-PER", + "I-PER", + "I-PER", + # Labels 2 + "I-PER", + # Labels 3 + "I-PER", + "I-PER", + # Labels 4 + "I-PER", + # Labels 5 + "I-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + # Labels 6 + "O", + # Labels 7 "O", - "O", "O", "O", "O", - "O", "O", "O", "O", "O", - "O", "O", + # Labels 8 "O", - "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", + # Labels 9 "O", - "O", "O", "O", - "B-DAT", "I-DAT", "I-DAT", "I-DAT", "O", "O", + # Labels 10 + "O", + # Labels 11 + "O", + "O", + # Labels 12 + "O", + # Labels 13 + "B-LOC", + "I-LOC", + "I-LOC", + "I-LOC", + "I-LOC", + # Labels 14 + "O", + # Labels 15 + "O", + "O", + # Labels 16 + "O", + # Labels 17 + "B-DAT", + "I-DAT", + "I-DAT", + "I-DAT", + # Labels 18 + "O", + # Labels 19 + "O", ] fake_predict_tags_original = [ - "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", + # Labels 1 + "B-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", "I-PER", - "I-PER", "I-PER", + # Labels 2 "I-PER", - "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", + # Labels 3 + "I-PER", + "I-PER", + # Labels 4 + "I-PER", + # Labels 5 + "I-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + # Labels 6 + "O", + # Labels 7 + "O", + "O", "O", - "O", "O", "O", "O", "O", "O", - "O", "O", "O", - "***", "***", "***", "***", "***", + # Labels 8 "O", - "O", "O", + # Labels 9 + "O", + "O", + # Labels 10 + "O", + # Labels 11 + "***", + "***", + "***", + "***", + "***", + # Labels 12 + "O", + # Labels 13 + "O", + "O", + # Labels 14 + "O", + # Labels 15 + "B-DAT", + "I-DAT", + "I-DAT", + "I-DAT", + # Labels 16 + "O", + # Labels 17 "O", - "B-DAT", "I-DAT", "I-DAT", "I-DAT", "O", - "O", "O", ] expected_annot_tags_aligned = [ - "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", + # Labels 1 + "B-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + # Labels 2 "I-PER", - "I-PER", "I-PER", + # Labels 3 "I-PER", - "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", + "I-PER", + # Labels 4 + "I-PER", + # Labels 5 + "I-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + # Labels 6 + "O", + # Labels 7 + "O", + "O", + "O", + # Labels 8 "O", - "O", "O", "O", + # Labels 9 "O", - "O", "O", "O", "O", "O", "O", - "O", "O", "O", - "B-LOC", "I-LOC", "I-LOC", "I-LOC", "I-LOC", "O", - "O", "O", "O", - "B-DAT", "I-DAT", "I-DAT", "I-DAT", + # Labels 10 + "O", + # Labels 11 + "O", + "O", + # Labels 12 + "O", + # Labels 13 + "B-LOC", + "I-LOC", + "I-LOC", + "I-LOC", + "I-LOC", + # Labels 14 + "O", + # Labels 15 + "O", + "O", + # Labels 16 + "O", + # Labels 17 + "B-DAT", + "I-DAT", + "I-DAT", + "I-DAT", + # Labels 18 + "O", + # Labels 19 + "O", "O", - "O", "O", ] expected_predict_tags_aligned = [ - "B-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", + # Labels 1 + "B-PER", + "I-PER", + "I-PER", + "I-PER", "I-PER", - "I-PER", "I-PER", "I-PER", - "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", "I-PER", + # Labels 2 + "I-PER", + # Labels 3 + "I-PER", + "I-PER", + # Labels 4 + "I-PER", + # Labels 5 + "I-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + "I-PER", + # Labels 6 + "O", + # Labels 7 + "O", + "O", + "O", + "O", + # Labels 8 + "O", + "O", + "O", + "O", + "O", + # Labels 9 + "O", + # Labels 10 + "O", + "O", + # Labels 11 + "O", + # Labels 12 + "***", + "***", + "***", + "***", + "***", + # Labels 13 + "O", + # Labels 14 "O", - "O", "O", "O", "O", - "O", "O", "O", "O", "O", "O", - "O", "O", + # Labels 15 "O", - "***", "***", "***", "***", "***", + # Labels 16 + "B-DAT", + "I-DAT", + "I-DAT", + "I-DAT", + # Labels 17 "O", - "O", "O", + # Labels 18 "O", - "B-DAT", "I-DAT", "I-DAT", "I-DAT", "O", - "O", "O", ] -# fmt: on @pytest.mark.parametrize( -- GitLab