Aide
À propos

L'application BnF Collecte du web (BCweb) est destinée à gérer des ensembles de sites web devant être capturés, conservés et communiqués par la Bibliothèque nationale de France au titre du dépôt légal de l'internet.
Cette application permet aux correspondant-e-s DLweb de sélectionner et de gérer (saisir, modifier, inactiver, contrôler) des sites à collecter en indiquant leur adresse URL, des paramètres techniques et une description documentaire. Les listes de sites sélectionnés sont ensuite transmises selon une périodicité adaptée aux robots de collecte de la BnF pour qu'ils soient archivés.

BCweb regroupe les références de tous les sites faisant l'objet de collectes ciblées : collectes régulières et en profondeur d'un nombre limité de sites choisis en fonction de leur thème (la littérature, le développement durable…) ou de leur rapport à un événement (comme les élections ou les Jeux Olympiques). Seule une petite fraction des sites faisant l'objet de collectes larges (collectes annuelles de l'ensemble de l'internet français) est référencée dans BCweb.

BCweb permet également à tous les professionnels de la BnF de consulter la liste des sites sélectionnés. En revanche, cet outil ne donne pas accès aux archives des sites : c'est le rôle d'une autre application, Archives de l'internet, disponible sur les postes professionnels et dans les salles de recherche de la BnF et des bibliothèques partenaires en région.

Pour plus d'information, vous pouvez consulter le site internet de la BnF, rubrique dépôt légal ou contacter le service du Dépôt légal numérique de la BnF.

Qu'est-ce qu'une collecte dans BCweb ?
Une collecte est une sélection de sites regroupés selon une logique documentaire. Les collectes sont gérées par le service du Dépôt légal numérique de la BnF. Il existe deux catégories de collectes :
  • des collectes courantes : sélections maintenues par les différents départements de la BnF, dans leur domaine de compétence et en lien avec leur politique documentaire. Elles font l'objet de collectes continues ;
  • des collectes projet : sélections sur un thème spécifique ou en lien avec un événement. Elles sont généralement effectuées par des agents de plusieurs départements de la BnF, parfois en coopération avec des partenaires externes (bibliothèques de dépôt légal imprimeur, bibliothèques universitaires, laboratoires de recherche...). Elles font l'objet de collectes ponctuelles.

Les collectes actives font l'objet de collectes par le robot d'archivage, contrairement aux collectes inactives. Bien que ces dernières ne fassent plus l'objet de captures, elles demeurent consultables dans BCweb.

Qu'est-ce qu'un site dans BCweb ?

Un site est une unité à collecter, une fiche de site correspond à la description de cette unité. Les fiches de sites sont gérées par les correspondant-e-s DLweb. Elles se composent de trois parties :

1) Informations de suivi

Chaque fiche de site fait partie d'une collecte et dispose d'un identifiant unique. Elle est gérée par un responsable qui veille au suivi du site et à la mise à jour de la fiche. Des informations documentent la gestion de la fiche : son créateur, sa date de création, le nom de la personne ayant effectué la dernière mise à jour, la date de mise à jour.

2) Paramètres de collecte

L'état (actif/inactif) détermine si le site est collecté ou s'il ne l'est plus (ex : cas d'un site qui n'existe plus en ligne).
L'URL de départ est le point de départ de la collecte. Elle peut correspondre à la page d'accueil d'un site, à une sous-partie du site ou à une page.
Des URL supplémentaires peuvent être ajoutées afin d'améliorer la couverture ou la qualité de la collecte (ex : un plan de site, une rubrique importante).

Il existe deux types de collecte : large et ciblée. Trois paramètres précisent la configuration des sites en collecte ciblée :
  • le budget indique le nombre d'URL à collecter sur le site (déterminé en fonction de la taille du site),
  • la fréquence indique la périodicité de la collecte (quotidienne, annuelle...),
  • la profondeur indique si la collecte porte sur la totalité du site ou sur une partie.

Selon la collecte, ces paramètres peuvent varier. Les sites en collecte large sont tous collectés avec la même configuration (budget défini, fréquence annuelle, profondeur domaine).

3) Description du site

Chaque collecte est organisée en thèmes qui précisent le contenu, l'émetteur ou le modèle éditorial. Une fiche de site est associée à un seul thème.
Les mots clés décrivent de manière plus précise le contenu d'un site.

Comment trouver un site dans BCweb ?

Chaque collecte est décrite dans une page spécifique qui permet de consulter les fiches de tous les sites sélectionnés dans le cadre de cette collecte. Un encart précise le type de collecte (courante/projet), son état (actif/inactif), son contenu, sa date de création et sa date de dernière mise à jour. Des contacts sont associés à chaque collecte : les agents du service du Dépôt légal numérique de la BnF répondent aux questions techniques, ceux des autres institutions ou départements de la BnF aux questions documentaires.

Il est également possible de faire une recherche simple ou avancée. La recherche simple porte sur l'URL de départ, le thème et les mots clés de toutes les fiches enregistrées. Il est possible d'utiliser un ou plusieurs mots. Un opérateur ET implicite relie les mots entre eux. Une troncature à droite et à gauche, également implicite, permet ainsi de retrouver des mots avoisinants ou une URL entière à partir d'une chaîne de caractères. Il est nécessaire d'utiliser des guillemets pour rechercher une expression exacte (par exemple : "publications officielles").

La recherche avancée permet de combiner plusieurs critères de recherche correspondant aux éléments descriptifs de la fiche de site. Par défaut la recherche s'effectue sur les fiches actives. Pour rechercher une fiche inactive, cocher l'état inactif ou tous au-dessus du champ URL.
Si la recherche concerne plusieurs critères, un ET implicite relie les différents champs.

Voici des précisions sur quelques points :
  • Collecte : si la recherche porte sur une collecte particulière, le choix des paramètres budget, fréquence, profondeur ainsi que du thème est limité aux éléments propres à la collecte.
  • Correspondant correspond au prénom et au nom du responsable et/ou des personnes qui ont créé ou mis à jour la fiche, selon le rôle précisé. Une troncature implicite à droite et à gauche permet de retrouver une personne à partir de quelques lettres de son nom ou son prénom.
  • Date permet de rechercher une fiche par sa date de création ou de mise à jour. Il est possible de saisir directement la date sous la forme JJ/MM/AAAA ou de la sélectionner dans un calendrier. La recherche peut s'effectuer sur une période, à partir d'une date (de début) ou jusqu'à une date (de fin).
  • Pour URL, thème et mots clés, il est possible d'utiliser un ou plusieurs mots. Un opérateur ET implicite relie les mots entre eux. Une troncature implicite à droite et à gauche permet de trouver des mots avoisinants. Il est nécessaire d'utiliser des guillemets pour rechercher une expression exacte.
Les critères de recherche sont rappelés dans le panneau latéral/bandeau de gauche et peuvent être modifiés.
Comment lire une liste de sites dans BCweb ?

Les sites sélectionnés dans BCweb sont présentés sous la forme de tableaux. Il est possible d'affiner la liste et de combiner plusieurs critères d'affinage. À chaque critère est associé le nombre de résultats correspondants. Les critères d'affinage proposés dépendent de la vue sélectionnée.

La vue simple contient les principaux paramètres de collecte (URL de départ, état, type de collecte, fréquence), la vue experte des informations supplémentaires utiles aux correspondant-e-s DLweb (profondeur, budget, responsable, mise à jour par, mise à jour le, mots clés, thème). Il est possible de passer d'une vue à l'autre à tout moment. Les résultats d'une recherche simple sont présentés en vue simple, et les résultats de la recherche avancée en vue experte.

Les sites sont triés par ordre alphabétique des URL de départ. D'autres tris par ordre croissant ou décroissant peuvent être appliqués en cliquant sur la flèche présente à côté de l'entête de la colonne. Seul un tri à la fois est possible. Le pictogramme avec la loupe permet d'accéder à la fiche de site.

Pourquoi et comment se connecter à BCweb ?

Seuls les correspondant-e-s DLweb habilités et les agents du service du Dépôt légal numérique peuvent se connecter à BCweb pour proposer des sites à collecter et gérer leur sélection.
Pour les agents de la BnF, l'identifiant et le mot de passe sont identiques à ceux utilisés lors de l'ouverture de session Windows sur les postes informatiques. Pour les correspondant-e-s appartenant à un autre établissement, les identifiants ont été communiqués par courriel lors de l'inscription.
La durée d'une session de travail sur BCweb est de 60 minutes. Au-delà de 60 minutes sans activité sur l'application, la session est fermée automatiquement.

Avec quelle configuration technique utiliser BCweb ?
Pour une utilisation optimisée de cet outil, voici quelques informations techniques :
  • L'accès à BCweb est sécurisé par le protocole HTTPS pour les utilisateurs externes à la BnF.
  • BCweb est compatible avec les navigateurs Firefox et Chrome récents.
  • BCweb requiert l'activation des cookies et du javascript.