Projet:Wiktionnariste en résidence
2020
Contexte
Le Dictionnaire des francophones est un outil en ligne qui permet la consultation de plusieurs ressources lexicographiques libres. Il est financé par la Délégation générale à la langue française et aux langues de France, réalisé au sein de l’Institut international pour la Francophonie, à Lyon et conçu par Noé. Un conseil scientifique veille sur ce projet, présidé par Bernard Cerquiglini. Lyokoï en est membre.
Cet outil intègre les entrées de français du Wiktionnaire ainsi que d’autres ressources sous licence libre. Une version de test, en cours de développement, est consultable à cette adresse, et permet de parcourir les entrées du Wiktionnaire et celles de l’Inventaire des particularités lexicales du français en Afrique noire, un ouvrage libéré dans le cadre de ce projet. La première version complète sortira autour du 20 mars 2020, avec d’autres ressources et la possibilité de contribuer. Les apports dans le Dictionnaire des francophones seront complémentaires à la rédaction du Wiktionnaire. La zone dans laquelle est utilisée une définition ajoutée est une information primordiale qui sera collectée alors qu’elle ne l’est pas dans le Wiktionnaire. L’effort principal portera sur les usages du français hors de la France, ce qui n’est pas le contenu le plus développé dans le Wiktionnaire. Les définitions seront liées entre elles (mot A sens 1 avec mot B sens 2) plutôt que les mots entre eux (mot A avec mot B comme dans le Wiktionnaire). La spécificité technique du projet est l’utilisation d’une base RDF et d’une ontologie qui permettront de faire des requêtes élaborées, à l’instar des requêtes dans Wikidata.
Le contenu du Wiktionnaire n’est pas homogène, ce qui est normal car il s’agit d’un projet collaboratif qui évolue depuis plus de quinze ans en impliquant de très nombreuses personnes rédigeant chacune à sa manière. Le nettoyage de modèles obsolètes, la documentation des modèles utilisés et la rédaction de pages d’explications supplémentaires dans le Wiktionnaire pourraient être réalisés dans le cadre de ce projet, via un dispositif de Wiktionnariste en résidence (s’inscrivant dans la tradition des Wikimédiens en résidence). L’association Wikimédia France cofinance cette mission, à hauteur de 15 000 euros. La DGLFLF verse la même somme.
Personnes
- Utilisateur:Seb en Résidence (2IF) est le compte utilisé par le Wiktionnariste en résidence, Sebleouf
- Noé accompagne le dispositif
Feuille de route
Plusieurs tâches pourront être réalisées par le Wiktionnariste en résidence dans le cadre de ce projet. Elles sont d’abord en lien avec le Wiktionnaire, mais aussi avec la structure d’accueil et le projet de Dictionnaire des francophones.
- Dans le Wiktionnaire
- Régulariser, organiser et documenter l’usage des étiquettes de marques d’usage qui se trouvent au début des définitions. Ces étiquettes sont aujourd’hui mal documentées et utilisées de manière hasardeuse selon les contributeurs. Ce travail de rationalisation permettra de mieux relier entre elles les définitions au sein des pages et de mieux décrire les sens. Certaines étiquettes pourront être supprimées (ex : "suite" {{suite}}) et d’autres mieux présentées au lectorat en les rangeant par type de marques, et rendues plus accessibles et plus compréhensibles pour les contributeurs (comme fait par exemple avec la création de la catégorie Modèles de fréquence .
- Corriger les modèles désuets ambigus, notamment {{mplur}}, {{fplur}}, le paramètre équiv dans les modèles de genre, etc. Certaines décisions collectives prises dans le Wiktionnaire n’ont pas données lieu à des transformations, car les chantiers étaient trop importants. Une vérification humaine est presque toujours nécessaire pour s’assurer de lever l’ambiguïté convenablement.
- Clarifier l’inventaire des domaines et nettoyer les alias inutiles tel que {{éleva}} (pour élevage), {{text}} (pour textile), {{écol}} (pour écologie), {{théât}} (pour théâtre), etc. Cette tâche implique la rédaction et l’organisation d’une discussion pour arriver à une décision validée par la communauté. La réalisation pourra être demandée à un dompteur de bot qui le réalisera automatiquement.
- Créer les domaines identifiés comme manquants à partir des entrées existantes ou en créant de nouvelles entrées. Ajouter par exemple les domaines suivants : électromagnétisme, pharmacie, broderie, électroacoustique, sport de cible, travail du cuir, orfèvrerie, marionnette, etc.
- Enrichir les glossaires et renforcer leur organisation en ajoutant des liens entre les glossaires et les domaines.
- Augmenter le nombre de définitions marquées géographiquement, grâce aux ressources libérées, par l’ajout de marques et par l’ajout de nouvelles définitions.
- Vérifier les définitions commençant par Variante de… ou Synonyme de…, et rédiger des définitions puis mettre le contenu de la ligne dans une section dédiée aux synonymes.
- À l’Institut international pour la Francophonie
- Ajouter des exemples d’usage de termes francophones à partir des ouvrages du centre de documentation de l’Institut international pour la Francophonie.
- Enrichir Wikipédia avec les ouvrages de référence possédés par l’Institut international pour la Francophonie, ou auprès des personnalités de passage.
- Participer à la numérisation d’ouvrages au sein de Wikisource (identification de référence, pilotage d’ateliers de contribution).
- Documenter et proposer des comptes-rendus d’activité trimestriels pour valoriser ce statut original.
- Opération Les accents de la francophonie
Sur proposition de la directrice de l’Institut international pour la Francophonie, nous pourrons déployer une opération spécifique en février 2020. Profitant de la venue d’étudiants au Diplôme d’Université Francophonie et développement durable, il sera possible de les solliciter pour transmettre des photographies de leurs lieux d’origines, puis d’enregistrer leurs prononciations via Lingua Libre. Cela s’inscrira dans leur formation via 2h dédiées à la présentation de la valorisation numérique par la mise sous licence libre (Commons, Wikipédia, Wiktionnaire principalement). Les ateliers d’enregistrement seront organisés sur place, à partir de listes préparées à l’avance afin de ratisser rapidement le vocabulaire de base pour plusieurs pays du monde. Cette opération pourra impliquer Emma Vadillo, service civique à Wikimédia France en charge de la promotion de Lingua Libre. Le rendu aux participants se fera par une exposition photo (si la qualité est au rendez-vous) ainsi que par la mise en avant de pages du Wiktionnaire où leurs enregistrements seront audibles. Courant 2020, ces fichiers audios pourront également être écoutés dans le Dictionnaire des francophones.
Bénéfices
Pour le Wiktionnaire
Ces réalisations amélioreront le Wiktionnaire, faciliteront la contribution et la réutilisation des données. S’il est indéniable que les contributeurs et contributrices de longue date se sont formés à divers aspects de la rédaction de dictionnaire (rédaction de définition, choix des exemples, alphabet phonétique international, flexions, etc.), il est tout aussi frappant de voir que les termes spécialisés de la lexicographie sont repris mais mal maîtrisés (populaire est par exemple fréquent alors qu’il est désuet dans les dictionnaires imprimés). Les documenter et en faciliter l’usage permettra aux personnes qui contribuent d’acquérir leur maîtrise et de les utiliser à bon escient, facilitant par là même leur compréhension par le lectorat.
Les tâches proposées visent à des contributions spécialisées en lexicographie d’une part et dans une visée francophone d’autre part. Elles visent à réduire la complexité du Wiktionnaire et à enrichir le contenu. Il n’y aura pas d’introduction de termes techniques supplémentaires ou de balises supplémentaires. Ce chantier est délimité dans la page Projet:Informations lexicographiques.
Pour la personne en résidence
Le profil attendu est celui d’une personne connaissant déjà bien le Wiktionnaire, ou alors d’une personne connaissant déjà bien la lexicographie. Selon le profil, les bénéfices ne seront pas de la même ampleur.
- Être formée en lexicographie, c’est-à-dire d’avoir une vision plus méthodique de la manière dont les mots peuvent être décrits.
- Mieux comprendre les relations entre les définitions et la manière dont le vocabulaire peut être organisé et présenté dans un dictionnaire.
- Participer à une expérience collective de création d’un outil numérique commun.
- Travailler au sein d’une équipe manipulant des dictionnaires sous licence libre et qui réfléchit aux limites du Wiktionnaire et à la manière de les dépasser collectivement.
- Découvrir de nouveaux mots utilisés hors de France, et améliorer sa compréhension de la façon dont la langue fonctionne dans le dictionnaire et au-delà.
Pour le Dictionnaire des francophones
Les corrections apportées dans le cadre de cette résidence amélioreront le contenu qui pourra être affiché au sein du Dictionnaire des francophones. Actuellement, de nombreuses pages vont présenter des scories dues à des irrégularités de présentation au sein du Wiktionnaire. Faire le traitement au sein du Wiktionnaire plutôt que sur les données récupérées permettra d’alléger le temps de traitement et de suivre les mises à jour de la base de données du Wiktionnaire.
Le Dictionnaire des francophones tire profit gratuitement de données de grande qualité provenant du Wiktionnaire. Cette résidence est un moyen de donner le change, de renvoyer l’ascenseur. C’est aussi un très bon moyen pour améliorer des données qui figureront dans le Dictionnaire des francophones plus proprement.
Pour les partenaires à ce projet
Ce projet va permettre une amélioration qualitative de la description de la langue française tout en favorisant le développement d’un contenu francophone, prenant en compte la diversité de la langue. Proposer une organisation plus claire du contenu du Wiktionnaire bénéficiera à une audience très large, de par le lectorat conséquent du Wiktionnaire lui-même mais aussi par une réemploi des données dans le Dictionnaire des francophones qui sera plus cohérent et uniforme. Harmoniser les données facilitera leur compréhension par le lectorat mais aussi leur enrichissement par les locuteurs et locutrices.
Informations pratiques
Cette résidence est au sein de l’Institut international pour la Francophonie, composante de l’Université Jean Moulin Lyon 3. Un poste de travail est mis à disposition, ainsi que toutes les commodités impliquées par un contrat équivalent catégorie A. Il s’agit d’un recrutement sous la forme d’un CDD administratif d’un an, de janvier à décembre 2020.
Transparence
Cette démarche a été transmise et discutée :
- Wikidémie de juillet 2019, Wikidémie de septembre 2019
- Bistro de Wikipédia du 4 septembre 2019
- Scriptorium de Wikisource de septembre 2019
- La salle café de la Wikiversité de septembre 2019
- Échanges avec le conseil d’administration de Wikimédia France à partir de février 2019.
- Espace de discussion sur Discord, messages à ce sujet le 26 juillet et le 4 septembre 2019.
- Démarrage annoncé le 6 janvier 2020 sur la Wikidémie, le Bistro et Wikimedia Space, le Beer Parlour du Wiktionnaire anglophone ainsi que la liste mail des membres de Wikimédia France.
- Article de blog de Wikimédia France publié le 13 novembre 2020, présentant le projet, son organisation, ses enjeux et dressant un premier bilan : « Un Wiktionnariste en résidence ».
Un bilan
Le bilan de cette opération a été publié dans la Wikidémie de janvier 2021.
Et ensuite ?
Le dispositif de Wiktionnariste en résidence n’est pas prolongé, d’un commun accord entre les personnes concernées. À l’issue de cette résidence, une nouveau contrat de travail d’un an est proposé à la personne derrière le compte Seb en Résidence (2IF), en tant que responsable opérationnel du Dictionnaire des francophones.
Une nouvelle opération de Lingualibriste en résidence est pensée en 2021, pour poursuivre les partenariats positifs pour les projets collaboratifs en ligne. Il s’agira cette fois qu’un stage de quatre mois, dont le maître de stage est Sebleouf !
Discussions
Que pensez-vous de ce dispositif ? Que pensez-vous des missions proposées ? Vous pouvez faire vos retours sur la page de discussion.