Thibault Lavigne
--- a/dan/predict/prediction.py
+++ b/dan/predict/prediction.py
                confidence_scores.append(
                    torch.max(torch.softmax(pred[:, :], dim=1), dim=1).values
                )
+                tot_confidence_scores.append(torch.softmax(pred[:, :], dim=1))
--- a/dan/predict/prediction.py
+++ b/dan/predict/prediction.py
            confidence_scores = (
                torch.cat(confidence_scores, dim=1).cpu().detach().numpy()
            )
+            tot_confidence_scores = (
+                torch.cat(tot_confidence_scores, dim=1).cpu().detach().numpy()
+            )
            attention_maps = torch.cat(attention_maps, dim=1).cpu().detach().numpy()

            # Remove bot and eot tokens
            predicted_tokens = predicted_tokens[:, 1:]
+            tot_pred = tot_pred[:, 1:, :]
--- a/dan/predict/prediction.py
+++ b/dan/predict/prediction.py
            confidence_scores = (
                torch.cat(confidence_scores, dim=1).cpu().detach().numpy()
            )
+            tot_confidence_scores = (
+                torch.cat(tot_confidence_scores, dim=1).cpu().detach().numpy()
+            )
            attention_maps = torch.cat(attention_maps, dim=1).cpu().detach().numpy()

            # Remove bot and eot tokens
            predicted_tokens = predicted_tokens[:, 1:]
+            tot_pred = tot_pred[:, 1:, :]
            prediction_len[torch.eq(reached_end, False)] = self.max_chars - 1
            predicted_tokens = [
                predicted_tokens[i, : prediction_len[i]] for i in range(batch_size)
            ]
+            tot_pred = [tot_pred[i, : prediction_len[i], :] for i in range(batch_size)]