Référentiel auteurs (new)

(Page en cours de construction)

Pour accéder au site de démo du référentiel des auteurs : https://aurehal.demo.archives-ouvertes.fr/. Attention, les données ne sont pas forcément celles des sites de production

La consultation du référentiel est libre. Il permet d’accéder à la liste des dépôts HAL. Pour toute modification, il faut se connecter à AURéHAL et avoir les droits de modification sur le référentiel (administrateur de portail).

Métadonnées

Les métadonnées décrivant un auteur sont celles saisies lors du dépôt quand on ajoute un auteur :

  • au minimum nom et prénom : obligatoires à l’ajout d’un auteur
  • autre(s) prénom(s), initiales
  • email
  • ORCID

Un auteur identifié est un auteur pour lequel il y a au moins un identifiant :

  • adresse mail : adresse mail de l’auteur saisie lors du dépôt, adresse mail de l’utilisateur qui a créé son idHAL. On peut associer plusieurs adresses mail à une personne. En consultation, et pour des raisons de respect de la vie privée, seul le domaine de l’email est affiché dans le référentiel auteur.
  • idHAL : choisi par l’utilisateur lors de la création de son idHAL, il est souvent sous le format prénom-nom
  • ORCID : identifiant ORCID (ex : 0000-0003-3220-0122) enregistré par l’utilisateur dans son idHAL. Il est possible d’associer plusieurs identifiants ORCID à un auteur dans le cas où le chercheur a plus d’un ORCID
  • idRef : identifiant  IdRef enregistré par l’utilisateur lors de la création de son idHAL, importé via STAR pour les auteurs de thèses
  • Autres identifiants enregistrés par l’utilisateur lors de la création de son idHAL : ArXiv,  ResearcherID , VIAF , ISNI

Formes alternatives de l’auteur (code couleur jaune) : on peut associer plusieurs formes auteur à un auteur identifié, de façon à lui attribuer de façon sure les publications. On peut ainsi :

  • regrouper les différentes formes sous lesquelles sont saisis les noms des auteurs dans les dépôts ou peuvent potentiellement être saisis : minuscules, majuscules, inversion prénom-nom, prénom composé avec ou sans tiret. Une forme alternative n’est pas forcément liée à une publication.
  • associer les noms d’usage utilisés au cours de sa carrière (notamment nom de femme mariée, qu’il soit associé ou non à celui de naissance).

Un auteur non identifié (code couleur rouge) est une forme sans identifiant : on y associe tous les dépôts contenant cette façon dont est saisi le nom de l’auteur dans le dépôt. c’est en quelque sorte une forme « en réserve » qui peut ainsi être logiquement utilisée pour un auteur identifié et/ou une forme alternative ou rester une forme auteur non gérée. Associer un auteur non identifié comme forme alternative ne supprime pas l’auteur non identifié du référentiel. Un auteur non identifié ne peut être modifié dans AURéHAL.

L’administrateur pourra pour un auteur identifié :

  1. modifier la liste des formes alternatives
  2. modifier la liste des identifiants
  3. modifier la liste des publications

Il peut également répartir ou fusionner des données entre plusieurs auteurs.

Recommandations

  • toujours vérifier les publications associées à une forme auteur avant modification : la modification d’une forme auteur génère automatiquement une mise à jour dans les dépôts liés
  • ne modifier que des auteurs dépendant de sa structure
  • ne pas modifier la forme préférée d’un auteur et les identifiants saisis par l’utilisateur lors de la création de son idHAL sans son accord préalable

Consultation

Exemple de résultat de requête dans le référentiel  pour un administrateur connecté :

Toutes les métadonnées peuvent être recherchées : nom prénom bien sûr mais aussi ORCID, IdRef, etc

  • ID forme : identifiant numérique de la forme auteur, celle qui est présente dans le document
  • ID auteur : identifiant numérique de l’auteur identifié en tant que personne
  • idHAL : idHAL de l’auteur
  • Actions :
    • Voir : consultation des métadonnées associées à l’auteur identifié
    • Modifier : modification des métadonnées (ajout/suppression de formes alternatives, ajout/suppression d’identifiants, gestion des documents associés)
    • Dissocier : rompre l’association auteur identifié-identifiant et/ou auteur identifié-document
    • Répartir/fusionner : répartir des données (identifiant, document) entre 2 auteurs identifiés pour les homonymes ou fusionner les données de 2 auteurs identifiés dans le référentiel qui sont une seule personne physique.
    • Consulter les publications : ouvre un page de résultats de requête dans HAL

Il est possible de trier les ID forme, ID auteur et Nom en cliquant sur la valeur.

Codes couleurs :

  • vert : forme préférée d’un auteur identifié
  • jaune : forme alternative d’un auteur identifié
  • rouge : forme auteur sans identifiant

Consulter les documents associés à un auteur

  • Pour un auteur identifié (codes couleur vert et jaune) : cliquer sur Voir puis sur l’onglet « Voir les documents associés » : une page de résultats de requête s’ouvre dans HAL qui liste tous les dépôts dont les métadonnées auteurs contiennent cet auteur.
  • Pour un auteur non identifié (code couleur rouge) : cliquer sur l’icône Consulter les publications

Il est possible qu’aucun document ne soit associé à une forme auteur (dans le cas par ex, où une forme alternative a été ajoutée par un administrateur).

Modifier la liste des formes alternatives

Sélectionner l’auteur à modifier puis cliquer sur l’action « Modifier »

  • Choisir la forme préférée : cliquer sur l’étoile à côté du nom. La forme préférée équivaut à la forme par défaut choisie dans l’idHAL par l’utilisateur. Elle est présentée en priorité dans le dépôt avec le code couleur vert. Recommandation : valider avec l’auteur le choix de la forme préférée s’il n’a pas d’idHAL.
  • Ajouter des formes permet de regrouper les différentes façon dont le nom de l’auteur existe dans HAL :  initiale du prénom (attention M. Curie et M Curie sont 2 formes différentes), prénoms composés (Paul-Emile, Paul Emile, P-E., P.E.), nom de naissance-nom d’usage (pour les personnes mariées qui ont signé leurs publications de différentes façons). Consulter ensuite la Liste des documents : si des documents sont associés aux formes ajoutées, vérifier ceux qui doivent être associés à l’auteur identifié.
  • Retirer une forme : il y a obligatoirement au moins une forme. Les documents associés à la forme retirée sont retirés automatiquement de la liste des documents de l’auteur identifié.

Cliquer sur l’onglet Modifier pour enregistrer les modifications.

Modifier la liste des identifiants

Ajouter un identifiant : vérifier au préalable que l’identifiant n’est pas déjà présent dans le référentiel

  • il n’existe pas encore dans le référentiel : éditer l’auteur (action Modifier) et cliquer sur La liste des identifiants. Sélectionner ensuite le type d’identifiant, ajouter sa valeur puis cliquer sur +
  • il existe déjà dans le référentiel : il est donc déjà associé à un auteur identifié et risque de générer une situation conflictuelle. Utiliser la fonction « Répartir/Fusionner » pour faire glisser l’identifiant d’un auteur à l’autre (voir plus bas Répartir/fusionner les données).

Retirer un identifiant :

  • Si l’identifiant peut être supprimé de la base (s’il est obsolète comme une adresse mail), utiliser la fonction Modifier ->Lister les identifiants puis supprimer. Il y a obligatoirement au moins 1 identifiant sinon la suppression est impossible.
  • Si l’identifiant doit être conservé dans la base (identifiant fort comme un ORCID ou un IdRef qui ne correspond pas à l’auteur identifié sur lequel on travaille), utiliser la fonction Dissocier. L’identifiant sera associé à une forme auteur identique à celle de l’auteur sur lequel on travaille (création d’un autre auteur identifié). Avant d’enregistrer, il est recommandé de vérifier également la liste des documents.
Règles : On ne peut pas supprimer un idHAL. 
On ne peut pas supprimer un ORCID saisi lors de la création de l'idHAL.

Cliquer sur l’onglet Modifier pour enregistrer les modifications

Modifier la liste des documents associés

La forme auteur présente dans le document n’est jamais modifiée : on gère l’association auteur identifié-document via les formes auteur (forme préférée, forme(s) alternative(s)).

Par exemple, si on ajoute une forme à l’auteur sur lequel on travaille et que cette forme est présente dans des documents, ceux-ci sont présentés : l’administrateur vérifie parmi eux s’ils peuvent être associés à l’auteur sur lequel il travaille.

Si on supprime une forme alternative, les documents associés sont retirés de la liste des documents de l’auteur sur lequel on travaille.

L’administrateur peut dissocier un ou plusieurs documents de l’auteur sur lequel il travaille.

Cliquer sur l’onglet Modifier pour enregistrer les modifications

Répartir ou fusionner des données

La fonctionnalité Répartir/fusionner permet :

  • de répartir les bonnes métadonnées entre 2 auteurs identifiés (homonymes notamment) : formes, identifiants, documents
  • de fusionner 2 auteurs identifiés s’il s’agit de la même personne

Cas pratiques

Je veux ajouter l’identifiant ORCID à un auteur

Pour un auteur identifié : cliquer sur l’action « Modifier » puis ajouter l’ORCID et enregistrer.

Pour une forme auteur simple (code couleur rouge), cliquer sur l’icône « crayon » puis  ajouter l’ORCID et enregistrer. Cette forme devient un auteur identifié dans le référentiel (l’indexation peut prendre plusieurs minutes).

Un auteur de ma structure a un homonyme

Dans le cas d’homonymie, il faut attribuer les publications au bon auteur.

Si l’homonyme n’est pas un auteur identifié, il suffit simplement de retirer le dépôt de la liste des publications (voir Modifier la liste des documents associés).

Si l’homonyme est un auteur identifié, il faut utiliser la fonctionnalité Répartir/Fusionner et faire glisser les publications sous le bon auteur. Le regroupement des publications par affiliation permet de faire un premier tri si le nombre de dépôts est important.

Il manque des publications à la liste d’un auteur identifié

Cela signifie que dans les dépôts manquants, la forme qui correspond à cet auteur n’est pas celle de l’auteur identifié : il faut ajouter la forme auteur présente dans le document comme forme alternative.

Dans HAL, repérer la graphie de cette forme dans le document puis, dans AURéHAL,  modifier l’auteur identifié et ajouter cette forme dans la liste des formes . Lister ensuite les publications pour attribuer les documents à l’auteur identifié (l’auteur peut avoir un homonyme).

L’adresse mail de l’auteur n’est plus valable

Si l’auteur a plusieurs identifiants, il est possible de supprimer une adresse mail qui n’est plus valide.

Si l’adresse mail est le seul identifiant, ne jamais la supprimer sans ajouter un autre identifiant (adresse mail actuelle, l’ORCID ou l’IdRef par ex).

Une adresse mail associée à l’idHAL ne peut être supprimée, elle correspond à celle du compte utilisateur qui a créé l’idHAL. Contacter la personne si possible et éventuellement, modifier l’information dans le compte utilisateur (voir aussi https://doc.archives-ouvertes.fr/gerer-un-portail/gerer-les-utilisateurs/).

Je veux fusionner 2 auteurs qui ont chacun un idHAL

L’opération n’est pas possible dans AURéHAL, il faut vous adresser au service support et assistance : le chercheur a plusieurs comptes et chaque idHAL est lié à un de ses comptes utilisateur . Il est donc nécessaire de fusionner ces comptes et dans ce cas, seul le chercheur peut déterminer quel compte et quel idHAL il veut garder.

Impacts sur les APIs

L’évolution du référentiel auteurs aura des impacts sur l’utilisation des APIs synthétisés ci-dessous. Les organisations utilisant les API de façon applicative doivent absolument vérifier la compatibilité.

Interrogation du référentiel :

  • Les champs Ids deviennent multivalués
  • Les identifiants sont maintenant en arxivId_s  et non plus en arxiv_s
  • Le champs email_s  disparaît au profit de emailId_s multivalué
  • Le mail est indexé mais pas récupérable (RGPD)
  • Le champs multivalués emailDomain_s permet de récupérer les domaines des adresses e-mails
  • Il n’y a plus de structure liée à une forme auteur/auteur
    (La structure d’appartenance est liée à un document ou à un utilisateur, pas à un auteur)

Interrogation des documents :

  • authId_i  (integer multivalue) devient authIdFormPerson_s (string multivalue)
  • ajout :
    • authIdForm_i liste d’identifiants de forme du document
    • authIdPerson_i  liste identifiant de personnes (équivalent à authIdHalId_i)
    • authFullNameIdFormPerson_fs
  • Suppression :
    • organismId_i : n’est défini que si présent (et non plus vide…)
    • authQuality  PAS organisé en facet