État de l’art sur les fonds numérisés

ETAT DES LIEUX DE LA NUMERISATION
LES GRANDS CORPUS DE DOCUMENTS NUMERISES

La constitution de corpus d’œuvres littéraires a été historiquement l’un des objectifs des projets de numérisation. Elle continue à faire l’objet de grands programmes et de nombreuses réalisations :

  • Il s’agit souvent de mettre à disposition du public et des chercheurs des œuvres non éditées depuis longtemps et difficiles à trouver dans les librairies ou les bibliothèques.
  • Ces œuvres sont en général libres de droit, ce qui facilité leur numérisation et leur diffusion.

La constitution de grands corpus d’œuvres littéraires vise en général à mettre à disposition de la communauté scientifique une « mémoire » de la littérature. Mais l’apparition du e.book est porteuse d’une ouverture vers un public plus large. Le souci de s’adresser à un large public est présent depuis longtemps dans des initiatives comme celles de l’ABU, voire de Bibliopolis (qui s’adresse également aux ensignants).

LES GRANDS CORPUS D’œuvres LITTERAIRES

De nombreux fonds d’œuvres classiques francophones sont disponibles sur INTERNET. De nombreux serveurs proposant des fonds numérisés sur des auteurs sont le fait d’initiatives individuelles ou d’associations.

Les bases de ressources littéraires
  • Le projet coopératif ARTFL sur les trésors de la langue française associe l’Institut National de la langue française (INALF) du Centre National de la Recherche (CNRS) et le département des sciences Humaines et Social de l’Université de Chicago. L’ARTFL met en ligne la version de la 1ère édition de l’encyclopédie de Diderot et d’Alembert. D’autres collections devraient prochainement compléter le site, telles que la traduction de la bible par Louis Second. Présence de liens avec des sites complémentaires.
  • La bibliothèque universelle de l’ABU propose sur son serveur 253 textes numérisés de 89 auteurs.
  • Le site « ClicNet » (www.swarthmore.edu) est un portail de littérature francophone virtuelle donnant accès à des documents protégés par des droits d’auteur (biographies, correspondances, poésie, nouvelles et contes…).
  • Le serveur de l’IUFM d’Amiens «tic» met en ligne  des textes littéraires intégraux.
  • Le site de la bibliothèque des “mille et un livre”, propose une base de ressources sur la littérature de jeunesse avec une fiche analytique pour chaque ouvrage ; les oeuvres sont regroupées par grands thèmes pédagogiques.
  • En poésie, deux serveurs référencent des textes : le serveur de Poésie française de la société webnet (www.poésie.webnet.fr) a sélectionné plus de 1500 poèmes français de la Renaissance au début du XXème siècle.
  • Le Centre de ressources de textes électroniques (US, Europe, Canada, Australie)
  • La collection française de l’Université de Virginie (textes classiques et gazette de 1669)

Les bibliothèques sont naturellement très nombreuses à proposer des fonds numérisés :

  • Gallica : serveur expérimental de consultation à distance des collections numérisées de la BNF
  • La BM de Lisieux met chaque mois un nouveau texte en ligne.
  • La Bibliothèque Municipale de Lyon met en ligne des enluminures numérisées. Elle donne accès dans ses locaux (Part-Dieu) à des dossiers de presse régionaux.
  • BCS Bibliotheca Classica Selecta études classiques (Belgique)

Les revues littéraires

Éducatechnologies, revue de technologie de l’Université de Laval, Erofile, Le Magazine littéraire, le Factory, L’Oeil de Boeuf, Mots Pluriels, Paroles Gelées, République InternaZazieweb, une passion pour les livres, Pagina, revue de recherche de sémiotique littéraire (Université de Toronto).

Les sites consacrés à un auteur

Ces sites sont extrêmement nombreux ; ils sont très souvent l’œuvre d’associations ou d’individus.

  • Jean-Jacques Rousseau Association : le site présente les ressources éducatives en lettres et philosophie.
  • “Chateaubriand, les itinéraires du romantisme” : œuvre d’universitaires proposant une découverte intégrale de l’oeuvre de Chateaubriand.
  • Des sites sur le théâtre : Molière, Corneille, Shakespeare, Sacha Guitry…..
ESSAI D’EVALUATION QUANTITATIVE

Le tableau ci-après constitue une tentative d’évaluation du nombre d’oeuvres numérisées dans le cadre des projets de « bibliothèque virtuelle » d’œuvres littéraires.
Fonds numérisés d’œuvres francophones

Service Oeuvres Volume Mode d’accès
Gallica (BnF) Grands auteurs français du Moyen-Age à nos jours.
Les documents sont en mode image, sauf 1 500 en mode texte (dans le cadre d’accords avec l’INALF et des éditeurs).
Approche thématique en développement.
Accès public : 36 500 ouvrages en mode image, du domaine public.
Accès interne : 86 000 ouvrages en mode image, 3 000 en mode texte.
Accès public en PDF, stockage en .TIFF.
ABU Grands auteurs classiques françaises. 263 œuvres (89 auteurs-) Html (évolution vers TEI, RTF, Psion, Pilot).
ATHENA (Université de Genève) Grands auteurs classiques internationaux. 4 000 titres (dont 500 en langue française) PDF, RTF, Claris (Zip)
La République des Lettres (Bibliopolis) Grands auteurs classiques françaises. 1 600 titres ?
Lili (Bibliopolis) 337 titres ?
Biblionet (Bibliopolis) 101 titres ?
00h00 ? PDF
Planete Book Html, ASCII, RTF, WORD
Frantext (INALF) Auteurs de la littérature française. 3 000 Texte (ISO 8859)
ARTFL (INALF, Université de Chicago) Grands auteurs classiques françaises. 2 000
ClicNet ?
Le Chateau 100

Gallica représente à lui seul la très grande majorité des œuvres numérisées (90 000 sur environ 100 000).Le développement de l’e.book s’accompagne de la mise à disposition (dans des conditions variables) de plusieurs centaines de titres numérisés, parfois avec l’accord d’éditeurs (cf. CYTALE).

Cours gratuitTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *