Snippets Groups Projects

Add an argument for entity tokens during prediction

Entity tokens are currently hard-coded during prediction. These tokens are specific to the CICR dataset:

index = [pos for pos, char in enumerate(text) if char in ["ⓝ", "ⓟ", "ⓓ", "ⓡ"]]

We should add a new --tokens argument that takes the tokens.yaml file. Here is an example of tokens.yaml:

---
Accusations:
  start: "ⓐ"
  end: ""
Ages:
  start: "Ⓐ"
  end: ""
Arrêtés de la chambre:
  start: "Ⓣ"
  end: ""
Dates des arrêts:
  start: "Ⓓ"
  end: ""
Demeures:
  start: "ⓓ"
  end: ""
Juridictions:
  start: "Ⓙ"
  end: ""
N° de carton:
  start: "Ⓒ"
  end: ""
N° de registre:
  start: "Ⓡ"
  end: ""
Noms des accusés (Prénoms):
  start: "Ⓝ"
  end: ""
Noms des accusés (Prénoms) epouse:
  start: "Ⓔ"
  end: ""
Peines prononcées par les sentences:
  start: "Ⓟ"
  end: ""
Qualités:
  start: "Ⓠ"
  end: ""

Designs

Child items ...

Activity

Solene Tarride changed milestone to %ML Prod - Next 1 year ago

changed milestone to %ML Prod - Next
Solene Tarride added P2 label 1 year ago

added P2 label
Solene Tarride assigned to @mgenerali 1 year ago

assigned to @mgenerali
Mélodie Boillet assigned to @manonBlanco and unassigned @mgenerali 1 year ago

assigned to @manonBlanco and unassigned @mgenerali
Mélodie Boillet assigned to @mgenerali and unassigned @manonBlanco 1 year ago

assigned to @mgenerali and unassigned @manonBlanco
Thibault Lavigne mentioned in merge request !211 (merged) 1 year ago

mentioned in merge request !211 (merged)

By M Generali on 2023-07-17T14:10:08 (imported from GitLab)
Thibault Lavigne assigned to @mgenerali and unassigned @tlavigne 1 year ago

assigned to @mgenerali and unassigned @tlavigne
Yoann Schneider closed with merge request !211 (merged) 1 year ago

closed with merge request !211 (merged)

Please register or sign in to reply