ETAT DES LIEUX DE LA NUMERISATION
LES GRANDS CORPUS DE DOCUMENTS NUMERISES
La constitution de corpus d’œuvres littéraires a été historiquement l’un des objectifs des projets de numérisation. Elle continue à faire l’objet de grands programmes et de nombreuses réalisations :
- Il s’agit souvent de mettre à disposition du public et des chercheurs des œuvres non éditées depuis longtemps et difficiles à trouver dans les librairies ou les bibliothèques.
- Ces œuvres sont en général libres de droit, ce qui facilité leur numérisation et leur diffusion.
La constitution de grands corpus d’œuvres littéraires vise en général à mettre à disposition de la communauté scientifique une « mémoire » de la littérature. Mais l’apparition du e.book est porteuse d’une ouverture vers un public plus large. Le souci de s’adresser à un large public est présent depuis longtemps dans des initiatives comme celles de l’ABU, voire de Bibliopolis (qui s’adresse également aux ensignants).
LES GRANDS CORPUS D’œuvres LITTERAIRES
De nombreux fonds d’œuvres classiques francophones sont disponibles sur INTERNET. De nombreux serveurs proposant des fonds numérisés sur des auteurs sont le fait d’initiatives individuelles ou d’associations.
Les bases de ressources littéraires
- Le projet coopératif ARTFL sur les trésors de la langue française associe l’Institut National de la langue française (INALF) du Centre National de la Recherche (CNRS) et le département des sciences Humaines et Social de l’Université de Chicago. L’ARTFL met en ligne la version de la 1ère édition de l’encyclopédie de Diderot et d’Alembert. D’autres collections devraient prochainement compléter le site, telles que la traduction de la bible par Louis Second. Présence de liens avec des sites complémentaires.
- La bibliothèque universelle de l’ABU propose sur son serveur 253 textes numérisés de 89 auteurs.
- Le site « ClicNet » (www.swarthmore.edu) est un portail de littérature francophone virtuelle donnant accès à des documents protégés par des droits d’auteur (biographies, correspondances, poésie, nouvelles et contes…).
- Le serveur de l’IUFM d’Amiens «tic» met en ligne des textes littéraires intégraux.
- Le site de la bibliothèque des “mille et un livre”, propose une base de ressources sur la littérature de jeunesse avec une fiche analytique pour chaque ouvrage ; les oeuvres sont regroupées par grands thèmes pédagogiques.
- En poésie, deux serveurs référencent des textes : le serveur de Poésie française de la société webnet (www.poésie.webnet.fr) a sélectionné plus de 1500 poèmes français de la Renaissance au début du XXème siècle.
- Le Centre de ressources de textes électroniques (US, Europe, Canada, Australie)
- La collection française de l’Université de Virginie (textes classiques et gazette de 1669)
Les bibliothèques sont naturellement très nombreuses à proposer des fonds numérisés :
- Gallica : serveur expérimental de consultation à distance des collections numérisées de la BNF
- La BM de Lisieux met chaque mois un nouveau texte en ligne.
- La Bibliothèque Municipale de Lyon met en ligne des enluminures numérisées. Elle donne accès dans ses locaux (Part-Dieu) à des dossiers de presse régionaux.
- BCS Bibliotheca Classica Selecta études classiques (Belgique)
Les revues littéraires
Éducatechnologies, revue de technologie de l’Université de Laval, Erofile, Le Magazine littéraire, le Factory, L’Oeil de Boeuf, Mots Pluriels, Paroles Gelées, République InternaZazieweb, une passion pour les livres, Pagina, revue de recherche de sémiotique littéraire (Université de Toronto).
Les sites consacrés à un auteur
Ces sites sont extrêmement nombreux ; ils sont très souvent l’œuvre d’associations ou d’individus.
- Jean-Jacques Rousseau Association : le site présente les ressources éducatives en lettres et philosophie.
- “Chateaubriand, les itinéraires du romantisme” : œuvre d’universitaires proposant une découverte intégrale de l’oeuvre de Chateaubriand.
- Des sites sur le théâtre : Molière, Corneille, Shakespeare, Sacha Guitry…..
ESSAI D’EVALUATION QUANTITATIVE
Le tableau ci-après constitue une tentative d’évaluation du nombre d’oeuvres numérisées dans le cadre des projets de « bibliothèque virtuelle » d’œuvres littéraires.
Fonds numérisés d’œuvres francophones
Service | Oeuvres | Volume | Mode d’accès |
Gallica (BnF) | Grands auteurs français du Moyen-Age à nos jours. Les documents sont en mode image, sauf 1 500 en mode texte (dans le cadre d’accords avec l’INALF et des éditeurs). Approche thématique en développement. |
Accès public : 36 500 ouvrages en mode image, du domaine public. Accès interne : 86 000 ouvrages en mode image, 3 000 en mode texte. |
Accès public en PDF, stockage en .TIFF. |
ABU | Grands auteurs classiques françaises. | 263 œuvres (89 auteurs-) | Html (évolution vers TEI, RTF, Psion, Pilot). |
ATHENA (Université de Genève) | Grands auteurs classiques internationaux. | 4 000 titres (dont 500 en langue française) | PDF, RTF, Claris (Zip) |
La République des Lettres (Bibliopolis) | Grands auteurs classiques françaises. | 1 600 titres | ? |
Lili (Bibliopolis) | 337 titres | ? | |
Biblionet (Bibliopolis) | 101 titres | ? | |
00h00 | ? | ||
Planete Book | Html, ASCII, RTF, WORD | ||
Frantext (INALF) | Auteurs de la littérature française. | 3 000 | Texte (ISO 8859) |
ARTFL (INALF, Université de Chicago) | Grands auteurs classiques françaises. | 2 000 | |
ClicNet | ? | ||
Le Chateau | 100 |
Gallica représente à lui seul la très grande majorité des œuvres numérisées (90 000 sur environ 100 000).Le développement de l’e.book s’accompagne de la mise à disposition (dans des conditions variables) de plusieurs centaines de titres numérisés, parfois avec l’accord d’éditeurs (cf. CYTALE).