Base de données sur L'Information psychiatrique (Mathis Lorenzo - TEMOS - Le mans Université)

DOI : 10.34847/nkl.f6ff1h5c Publique
Créée le 06/02/2024

Cette base de donnée vise à recenser les articles publiés dans l’Information Psychiatrique. Elle a été construite selon le procédé suivant :
- Scanner des tables de matière des journaux
- Traitement par OCR des scans
- Conception et passage dans un programme Python permettant l’automatisation du passage des scans OCR à une base de donnée en .csv
- Relecture et harmonisation
- Création de deux... bases de données distinctes, l’une organisée selon les auteur.rices, l’autre selon les articles
Limites globales de la base de données
1 – L’ensemble des saisies s’est faite de façon automatisée. Elle a été ensuite vérifiée une seule fois pour les deux journaux. En ce sens, les erreurs de saisie ne sont pas à exclure, en particulier pour les titres et les initiales.
2 – La base de données sur l’Information Psychiatrique en raison des normes éditoriales utilisées et des difficultés posées au niveau de l’automatisation ne contient pas les variables : Volume, Fascicule.
Description des bases de données :
Article_final :
Cette base de données recense l’ensemble des articles d’un journal. Chaque article n’apparaît qu’une fois et peut avoir plusieurs auteurs.
Auteur_final :
Cette base de données recense l’ensemble des références aux auteur.rices qui ont publié. Un article peut ainsi apparaître plusieurs fois s’il a plusieurs auteur.rices (3 références à l’article dans la base de données si trois personnes l’ont écrit).
La variable Initiales renvoie à l’ensemble des auteur.rices d’un article et non pas uniquement à celui ou celle de la ligne de référence.

nakala:title fr Base de données sur L'Information psychiatrique (Mathis Lorenzo - TEMOS - Le mans Université)
dcterms:description fr Cette base de donnée vise à recenser les articles publiés dans l’Information Psychiatrique. Elle a été construite selon le procédé suivant :
- Scanner des tables de matière des journaux
- Traitement par OCR des scans
- Conception et passage dans un programme Python permettant l’automatisation du passage des scans OCR à une base de donnée en .csv
- Relecture et harmonisation
- Création de deux bases de données distinctes, l’une organisée selon les auteur.rices, l’autre selon les articles
Limites globales de la base de données
1 – L’ensemble des saisies s’est faite de façon automatisée. Elle a été ensuite vérifiée une seule fois pour les deux journaux. En ce sens, les erreurs de saisie ne sont pas à exclure, en particulier pour les titres et les initiales.
2 – La base de données sur l’Information Psychiatrique en raison des normes éditoriales utilisées et des difficultés posées au niveau de l’automatisation ne contient pas les variables : Volume, Fascicule.
Description des bases de données :
Article_final :
Cette base de données recense l’ensemble des articles d’un journal. Chaque article n’apparaît qu’une fois et peut avoir plusieurs auteurs.
Auteur_final :
Cette base de données recense l’ensemble des références aux auteur.rices qui ont publié. Un article peut ainsi apparaître plusieurs fois s’il a plusieurs auteur.rices (3 références à l’article dans la base de données si trois personnes l’ont écrit).
La variable Initiales renvoie à l’ensemble des auteur.rices d’un article et non pas uniquement à celui ou celle de la ligne de référence.
dcterms:subject fr histoire
fr Psychiatrie
Filtrer par :