Base de données sur L'Information psychiatrique (Mathis Lorenzo - TEMOS - Le mans Université)
Cette base de donnée vise à recenser les articles publiés dans l’Information Psychiatrique. Elle a été construite selon le procédé suivant :
- Scanner des tables de matière des journaux
- Traitement par OCR des scans
- Conception et passage dans un programme Python permettant l’automatisation du passage des scans OCR à une base de donnée en .csv
- Relecture et harmonisation
- Création de deux... bases de données distinctes, l’une organisée selon les auteur.rices, l’autre selon les articles
Limites globales de la base de données
1 – L’ensemble des saisies s’est faite de façon automatisée. Elle a été ensuite vérifiée une seule fois pour les deux journaux. En ce sens, les erreurs de saisie ne sont pas à exclure, en particulier pour les titres et les initiales.
2 – La base de données sur l’Information Psychiatrique en raison des normes éditoriales utilisées et des difficultés posées au niveau de l’automatisation ne contient pas les variables : Volume, Fascicule.
Description des bases de données :
Article_final :
Cette base de données recense l’ensemble des articles d’un journal. Chaque article n’apparaît qu’une fois et peut avoir plusieurs auteurs.
Auteur_final :
Cette base de données recense l’ensemble des références aux auteur.rices qui ont publié. Un article peut ainsi apparaître plusieurs fois s’il a plusieurs auteur.rices (3 références à l’article dans la base de données si trois personnes l’ont écrit).
La variable Initiales renvoie à l’ensemble des auteur.rices d’un article et non pas uniquement à celui ou celle de la ligne de référence.
nakala:title | fr | Base de données sur L'Information psychiatrique (Mathis Lorenzo - TEMOS - Le mans Université) | |
dcterms:description | fr |
Cette base de donnée vise à recenser les articles publiés dans l’Information Psychiatrique. Elle a été construite selon le procédé suivant : - Scanner des tables de matière des journaux - Traitement par OCR des scans - Conception et passage dans un programme Python permettant l’automatisation du passage des scans OCR à une base de donnée en .csv - Relecture et harmonisation - Création de deux bases de données distinctes, l’une organisée selon les auteur.rices, l’autre selon les articles Limites globales de la base de données 1 – L’ensemble des saisies s’est faite de façon automatisée. Elle a été ensuite vérifiée une seule fois pour les deux journaux. En ce sens, les erreurs de saisie ne sont pas à exclure, en particulier pour les titres et les initiales. 2 – La base de données sur l’Information Psychiatrique en raison des normes éditoriales utilisées et des difficultés posées au niveau de l’automatisation ne contient pas les variables : Volume, Fascicule. Description des bases de données : Article_final : Cette base de données recense l’ensemble des articles d’un journal. Chaque article n’apparaît qu’une fois et peut avoir plusieurs auteurs. Auteur_final : Cette base de données recense l’ensemble des références aux auteur.rices qui ont publié. Un article peut ainsi apparaître plusieurs fois s’il a plusieurs auteur.rices (3 références à l’article dans la base de données si trois personnes l’ont écrit). La variable Initiales renvoie à l’ensemble des auteur.rices d’un article et non pas uniquement à celui ou celle de la ligne de référence. |
|
dcterms:subject | fr | histoire | |
fr | Psychiatrie |