Wiktionnaire:Actualités/084-mars-2022
Actualités du Wiktionnaire
Wiktionnaire:Actualités est un journal mensuel sur le Wiktionnaire, les dictionnaires et les mots. Il est publié en ligne depuis avril 2015. Son écriture est ouverte à toutes les bonnes volontés. Vous pouvez recevoir un avis lors de la publication des prochains numéros, consulter les anciens numéros et participer au brouillon de la prochaine édition. Vous pouvez lire aussi les Regards sur l’actualité de la Wikimedia. Pour les commentaires, critiques ou suggestions, voir la page de discussion.
Brèves d’ici
- Le 22 mars, le Wiktionnaire francophone célébrait ses dix-huit ans d’existence ! Lyokoï a profité de l’occasion pour renouer avec les lives et raconter l’histoire du projet.
- Le mécanisme des « entrées du jour » en français a été modifié pour ne plus simplement prendre l’entrée de janvier 2021 au jour correspondant lorsque l’entrée du jour est manquante : dans le cas d’absence de l’entrée à la date du jour, il cherchera d’abord une entrée à la même date en 2021 avant de chercher en janvier 2021. Ainsi, il y aura davantage de variétés dans les entrées, et cela doit nous inciter à compléter les entrées de l’année 2021 : toute aide est bienvenue !
- Lepticed7 et Darmo117 se sont attaqués à la correction d’erreurs de balisage dans le code, que l’on appelle aussi des erreurs de lint. Celles-ci peuvent être dues par exemple à des enchevêtrements entre ouverture et fermeture de balises ou encore à des évolutions dans les codes à privilégier. Ces corrections ne modifient pas l’affichage final pour la majeure partie du lectorat mais peuvent améliorer les choses pour les affichages sur mobiles ou avec des navigateurs exotiques. Les corrections facilitent également la maintenance dans le temps. Ainsi, le Wiktionnaire devient l’un des projets wikis francophones présentant le moins d’erreurs de lint graves.
- L’utilisateur Marxav a ajouté un prédicteur de prononciation usuelle d’un mot en français. Ce prédicteur utilise un modèle de langage pré-entraîné à l’aide des nombreuses données déjà présentes dans le Wiktionnaire. Pour l’utiliser, écrivez en entrée un mot (ou une locution) suivi d’un deux-points (ex: anticonstitutionnellement:), il générera en sortie la prononciation avec l’indication du découpage en syllabes (ex: ɑ̃.ti.kɔ̃s.ti.ty.sjɔ.nɛl.mɑ̃), ce qui pourra aider les contributeurs pour renseigner les informations de prononciation lors de la création ou modification d’une entrée dans le Wiktionnaire. L’outil reste expérimental et commet encore des erreurs, en particulier au niveau des liaisons et des homographes non homophones. De plus, l’hébergement sur la plateforme HuggingFace étant réalisé à titre gracieux, le temps de traitement du premier mot dure une vingtaine de secondes et requiert un peu de patience.
- L’outil de recherche avancé proposé dans le Wiktionnaire a été développé et est maintenu par un bénévole, Darkdadaah. Il est tombé en panne ce mois-ci mais a été prestement remis d’aplomb. Il permet de rechercher des anagrammes, ou selon la prononciation des mots.
- Le Wiktionnaire en anglais a passé la barre des 7 millions de pages de contenu à la fin du mois de mars. Le nombre d’entrées est encore plus élevé, car plusieurs entrées de langues différentes peuvent être sur une même page.
- L’interface de consultation depuis un ordinateur continue à évoluer, et l’équipe en charge du développement a présenté son quatrième prototype.
- Une discussion a été engagée et n’est pas encore terminée à date de publication sur la formulation des définitions qui indiquent « Personne (de sexe féminin) » afin de les remplacer par « Femme » ou bien plutôt « Personne de sexe ou de genre féminin ».
Statistiques
- Du 20 février au 20 mars 2022
+ 16 456 entrées et 101 langues modifiées pour atteindre 4 513 282 entrées et 1 284 langues avec au moins cinq entrées.
+ 2 902 entrées en français pour atteindre 399 713 lemmes et 616 103 définitions.
Les cinq langues qui ont le plus avancé, outre le français, sont le same du Nord (+ 4 311 entrées), l’allemand (+ 3 978 entrées), le sicilien (+ 1 763 entrées), l’anglais (+ 708 entrées) et l’arabe (+ 735 entrées).
Les nouvelles langues sont : le vietnamien (+2) (code langue vi-chuno), le slave molisan (+1),
+ 4 080 citations ou exemples en français pour atteindre 515 018.
+ 412 médias d’illustrations (images et vidéos) dans les pages principales du Wiktionnaire, pour atteindre 59 940.
- Du 28 février au 31 mars 2022
+ 8 533 sections de langue contenant au moins une prononciation audio (dont 1 424 pour le français) pour atteindre 323 284 sections de langue contenant au moins une prononciation audio pour 140 langues (dont 136 069 pour le français).
+ 1 nouveau thésaurus ce mois-ci, pour un total de 1 103 thésaurus dans 67 langues dont 806 thésaurus en langue française. Le nouveau thésaurus est sur l’anniversaire par Lyokoï et toutes les personnes présentes durant le live d’anniversaire du projet.
Wikiscan et Wikistats donnent chaque mois accès à beaucoup de mesures, dont la liste des pages les plus consultées et des pages modifiées par le plus de personnes.
+ 17 mots créés sur les 33 proposés dans les Mots du jour !
+ 1 domaine sémantique en français ce mois-ci, celui de la celtologie, proposé par Treehill. De son côté, Pixeltoo a créé des catégories pour les composés organophosphorés, les composés de l’azote et les composés de l’oxygène.
Brèves d’ailleurs
- Le laboratoire de recherche Analyse et traitement informatique de la langue française (ATILF), à l’origine notamment de la version numérique du Trésor de la langue française et de la base de textes en français FranText, a fêté ses vingt ans en 2021 et vient de publier un livret alphabétique sur leurs projets principaux sur les langues. L’occasion d’y voir plus clair dans les nombreux sigles de projets de recherche !
- À l’occasion de son premier anniversaire, le Dictionnaire des francophones intègre de nouvelles fonctionnalités. L’innovation majeure réside dans un moteur de recherche à facettes qui permet une exploration sélective de mots via un paramétrage de critères combinables (aires géographiques, glossaires, marques lexicales et domaines), et qui de ce fait offre une véritable interaction avec un dictionnaire. Par exemple, pour chercher des mots liés au sport spécifiques au Québec, il suffit de sélectionner l’aire « Québec » et le glossaire « Sportifs » ; contrairement à l’usage habituel qui est de cliquer le plus vite possible sur la solution des mots proposés par un moteur de recherche, l’utilisateur se surprendra ici à marquer une pause avant le fameux clic et à se creuser les méninges pour trouver la signification de chaque mot : mais que diable peut être un « cerbère » dans le monde du sport québécois ?
- Dictionnaire des francophones publie un entretien détaillé du responsable opérationnel du projet pour Le National, journal haïtien. Le Wiktionnaire est mentionné, étant la source principale des données présentées. Les explications permettent de cerner les différences en terme d’approche entre les deux projets… qui sont bien liés, l’interviewé étant également wiktionnariste et wikimédien !
- Dans une chronique de France Culture, Géraldine Mosna-Savoye discute de l'expression parfois mal-aimée qu’est « du coup ». Par la suite, n’hésitez pas ensuite à jeter un coup d’œil à page « du coup » pour identifier d’éventuels synonymes.
- Dorothée Aquino-Weber et Maguelone Sauzet, de l’Université de Neuchâtel, dirigent un ouvrage collectif sur La Suisse romande et ses patois qui est diffusé gratuitement en ligne, sous licence Creative Commons BY-NC-ND. Cet ouvrage offre une large place à la position des institutions publiques sur les langues, documentant les actions et regards sur les langues et formes de parler en usage dans la partie francophone de la Suisse.
- Avis de parution du Dictionnaire du numérique, un ouvrage encyclopédique présenté par une de ses coordinatrices dans une courte interview vidéo. L’ouvrage présente les concepts principaux et s’adresse au grand public.
- Entre le 12 et le 20 mars 2022, c’était la Semaine de la langue française et de la Francophonie partout dans le monde, avec de très nombreuses activités autour de la langue, dont de la poésie, des rencontres, des dictées, et même un jeu vidéo mobile, Exploratio.
- L’agence de communication Mots-Clés s’est associée à Google pour une étude relative à l’écriture inclusive, réalisée au 4e trimestre 2021, auprès d’un échantillon représentatif de la population française de 2 500 personnes (interrogées via Google Survey) et à partir de données de recherche issues du moteur de recherche Google analysées grâce à Google Trends. Plusieurs points de l’étude concernent le vocabulaire : « On relève aussi que les usages évoluent rapidement. Ainsi en 2021, “autrice” a quasiment autant de volume de recherches que “auteure”, et “entrepreneuse” dépasse désormais “entrepreneure”. » L’étude est disponible gratuitement.
À voir ou écouter
Quelques émissions audio ou vidéo sur la lexicographie, la linguistique et la langue française sorties ou découvertes ce mois-ci.
- Vous avez du mal avec l’écriture et la lecture de l’anglais. Si oui, la merveilleuse vidéo The Screwed-Up History of English Spelling, qu’on peut traduire en « Comment l'orthographe anglaise est partie en sucette », va vous rassurer en expliquant les nombreuses raisons de sa chaotique évolution. Bien que la vidéo soit en anglais, il est possible d’activer un sous-titrage en français.
- La Maison des francophonies de Berlin a proposé un concours vidéo « Mes mots pour le dire » qui demandait de raconter dans une courte vidéo son mot ou son expression préféré. 270 vidéos ont été reçues, depuis 48 pays différents ! Vingt vidéos ont été retenues par le jury. Elles sont émouvantes, amusantes, étonnantes, pédagogiques ou simplement légères.
- La chaîne Scilabus, de vulgarisation scientifique, propose une vidéo pour faire un état de la recherche sur le sujet de l’écriture inclusive.
- La chaîne AGuard- propose une vidéo sur le jargon du jeu vidéo Raid Shadow Legends, avec notamment son grand nombre de mots anglais.
- Sur la chaîne Binne, une courte vidéo pour présenter les termes les plus communs pour parler d’identité de genre et de transidentité.
De l’usage des catégories
Dans le Wiktionnaire, les pages proposant des définitions sont associées à des catégories. Cela se fait grâce à l’indication du nom de la catégorie ou via un modèle servant également à afficher une information. Ce sont ensuite des liens qui relient les pages à ces listes de pages. On relie par exemple les mots de français, les noms, les usages propres à une région, les pages qui partagent un même type d’étymologie (du latin, du grec,…), les pages qui présentent du vocabulaire lié à un métier en particulier ou bien des noms de vents, plantes, capitales, etc. Ces catégories dans le Wiktionnaire, sont-elles utiles pour le lectorat ? Facilitent-elles la navigation et la découverte de mots ? Je pense qu’elles sont sous-utilisées par rapport à l’intérêt qu’elles présentent. Elles se trouvent en bas de la page, en listes vagues, avec des noms très longs et peu avenants. Et une fois ouvertes, ce sont des pages froides, avec rarement un préambule explicatif, n’incitant pas à l’exploration et au rebond entres pages et catégories, ni à glisser vers d’autres catégories plus englobantes ou plus spécifiques (les catégories étant elles-mêmes dans des catégories).
C’est la situation actuelle pour la majeure partie des catégories, à l’exception de celles liées à des domaines sémantiques, qui proposent des explications initiales un peu plus développées grâce à une centralisation des textes explicatifs, permettant de les proposer régulièrement sur l’ensemble des catégories. Un tel dispositif pourrait éventuellement être déployé plus largement, mais demeure complexe et long à préparer. Mais même ainsi, comment amener le lectorat vers ces catégories ? Faudrait-il retravailler la mise en forme des listes en bas de page ou bien ajouter des encarts ou des listes plus haut dans les pages ?
Pour les listes thématiques (noms de vents, noms de monnaies, etc.), ce pourrait être éventuellement dans la sous-section Vocabulaire, avec une phrase indiquant qu’au moins une définition ci-avant appartient à la ou les listes suivantes, puis lister les liens. Un peu à la manière des liens vers les thésaurus qui enregistrent le mot (exemple : racine). Est-ce que ce serait clair ou est-ce que ça ferait doublon ? Est-ce que ce serait facile à déployer et à maintenir dans le temps ? Est-ce que le lectorat s’en servirait davantage ?
Beaucoup de questions se posent, et il n’est pas facile d’expliquer ces enjeux et de faire dialoguer le contributorat qui structure l’information et le lectorat qui vient à sa recherche !Du travail inédit au service de notre superbe
Cette chronique ne vise pas à présenter uniquement des éléments factuels sur les langues ou les pratiques lexicographiques. Elle est la trace d’une réflexion que j’ai menée sur le Wiktionnaire, sur sa neutralité et sa ligne directrice. Elle vise à vous inviter à vous poser les mêmes questions, voire à en discuter sur la Wikidémie.
Le deuxième principe fondateur de Wikipédia est la neutralité de point de vue. Il implique que tous les points de vue doivent être présentés, de façon proportionnée, tant qu’ils sont sourcés. Ainsi, ce principe empêche les travaux inédits, c’est-à-dire des travaux issus de la seule réflexion de la personne contribuant. Bien qu’on puisse en retrouver dans certains articles, il s’agit d’une pratique à bannir si l’on veut respecter le second principe fondateur.
Sur le Wiktionnaire, la communauté est bien plus habituée au travail inédit. Il existe des sections, telle que la section Étymologie, dans lesquelles un tel travail est proscrit. Mais en ce qui concerne les définitions, il n’est pas étonnant de voir une définition forgée de toute pièce. Il existe bien sûr des définitions importées d’autres dictionnaires, pour être ensuite actualisées, mises au goût du jour. Néanmoins, sur des entrées moins courantes, voire absentes des autres dictionnaires, libre aux personnes qui contribuent de rédiger une définition. Pour de telles définitions, il n’y a pas pour objectif à terme de fournir des sources. Elles sont bien en l’état. Certain·es pourraient avancer l’argument selon lequel les attestations sont des sources. Ma réponse est oui et non. L’attestation permet bien de sourcer l’existence d’un tel mot. Toutefois, c’est à l’interprétation et à la compréhension de la personne qui contribue que l’on doit la définition. Contrairement à Wikipédia, sur le Wiktionnaire, nous interprétons les données pour en extraire de la connaissance.
Cette liberté est, je pense, une force. Où en serions-nous, si, à la manière de Wikipédia, il ne fallait donner que les définitions des autres dictionnaires ? Si, à la manière de Wikipédia, nous nous fixions comme rôle de restituer la connaissance générée par d’autres, plutôt que d’en créer, comme nous le faisons actuellement ? Nous ne serions pas le premier dictionnaire en nombre d’entrées ni en nombre de langues décrites. Nos méthodes restent perfectibles, et le Wiktionnaire s’améliore tous les jours. Il nous reste encore tellement à décrire. Toutefois, soyons fier·es d’être le dictionnaire que nous sommes : le plus grand dictionnaire jamais fait, qui explore chaque recoin que les langues ont à offrir.Les collaborations de la semaine de mars
Ces suggestions, affichées sur la page d’accueil, ont été proposées par Noé, Pom445 et Sebleouf. Merci de leurs contributions aux personnes qui ont créé ces nouvelles entrées !
Semaine 09 (28 février au 6 mars 2022)
Semaine 10 (7 au 13 mars 2022)
Semaine 11 (14 au 20 mars 2022)
Semaine 12 (21 au 27 mars 2022)
Semaine 13 (28 mars au 3 avril 2022)
Semaines suivantes
Jeux de mots
Depuis quelques mois maintenant, des jeux d’un nouveau genre occupent les amateurs et amatrices de mots et de lettres. Cette vague, initiée par Wordle en anglais dès novembre 2021 a été déclinée en français sous divers noms dont Sutom ou Le Mot, mais aussi avec des mots régionaux en usage à Marseille sous le nom de Motchus. Ces jeux demandent de trouver un mot par jour, en indiquant à chaque tentative le nombre de lettres bien placées avec leurs positions, et le nombre de lettres présentes mais mal placées.
Un principe qui n’est pas sans rappeler celui du jeu télévisé Motus (en France) ou Lingo, l’inspiration de Wordle. Pour le lectorat le plus assidu des Actualités, cela rappellera peut-être le jeu Bouche cousue proposé par DaraDaraDara dans les Actualités de janvier 2017.
Dans un autre style, Cémantix aura occupé bien des esprits. Dans celui-ci, il s’agit de trouver un mot à partir de l’environnement de celui-ci, des mots qui apparaissent à la même place ou en sa compagnie au sein de textes. La recherche par le sens et les liens plus ou moins logiques est guidée par des smileys indiquant si l’on chauffe. Il faudra parfois plus de cent essais pour s’approcher du sens, et souvent sans l’atteindre vraiment, poussant Slate à publier un article laissant entendre que ce jeu nous veut du mal. Mentionnons également Worldle, consistant à reconnaître un territoire à la forme de ses contours.
Ces différents jeux poussent les gens à la consultation du Wiktionnaire, ce que l’on peut observer par des pics de visites sur les pages des mots du jour en même temps qu’ils sont vérifiés. Pour le Cémantix, d’autres outils sont probablement aussi découverts, comme le concordancier du CNRTL ou le Dictionnaire des synonymes du CRISCO. Les résultats sont partagés en ligne, notamment sur le serveur Discord de la communauté, dans un fil dédié.Dictionnaire du mois
Anne-Marie Siebenaler (dir), Dictionnaire Plus : de l’idée au mot, Sélection du Reader’s Digest, 1992, ISBN 2-7098-0370-4
Nous sommes en 1992, et dans une relative ignorance du public et du milieu lexicographique, sort un dictionnaire un peu particulier : Le Dictionnaire Plus. Il faut dire que l’éditeur, Sélection du Reader's Digest, n’est pas connu pour ses dictionnaires, mais il est très suivi par un lectorat pour son magazine éponyme. Néanmoins, au fil du temps, les publications se diversifient. C’est dans cette démarche qu’est publié notre dictionnaire d’aujourd’hui.
Sans être une totale révolution de l’objet dictionnairique, car on retrouve un format similaire aux dictionnaire des synonymes de la première moitié du 19e, l’objet est très efficace dans son usage, chose qui est difficile à imaginer tant on peut facilement comparer ce type d’ouvrage à un simple dictionnaire de synonymes — ce qui factuellement n’est pas très faux, puisqu’on les utilise souvent pour la même raison. Néanmoins, partir de l’idée d’un mot qu’on cherche pour arriver enfin à le trouver, lui, le bon mot, celui qu’on a au bout de la langue est un exercice difficile, surtout à cause de la frustration que l’on ressent de ne pouvoir nommer l’idée, la chose, que l’on a en tête. Les autrices de ce dictionnaire comparent ce phénomène à une forte envie d’éternuer, qu’une pincée de tabac à priser permettrait de faire sortir, et fort de cette comparaison indique que le Dictionnaire Plus serait une « véritable tabatière linguistique, pour déclencher l’éternuement récalcitrant ».
Construit autour de « mots sources » desquels on part pour arriver à des « mots cibles » que l’on cherche désespérément, ce dictionnaire théorise plus ou moins la recherche d’un mot en partant de l’idée. Ainsi, dans l’ouvrage, il y a trois manières de parvenir à son but : 1. Un dictionnaire de « mots sources » où sont déployés diverses acceptions accompagnées de contextes afin de proposer un éventail de « mots cibles » ; 2. Des tableaux thématiques qui listent des « mots cibles » – tableaux qui, dans le Wiktionnaire, s’expriment sous la forme de catégories, d’annexes et de thésaurus ; 3. Des illustrations annotés (comme le thésaurus figure de proue en français ) où se trouve le « mot cible ».
Nous en conviendrons, les chemins reliant les mots les uns aux autres sont de toutes natures, complexes, presque infinis, mais en tout cas colossalement nombreux et les autrices ont surtout choisi les plus courts et les plus évidents, jouant de la multiplicité des possibilités pour aider le lectorat. De plus, trois aspects supplémentaires de l’usage de ce dictionnaire sont mis en avant par ces dernières : l’enrichissement du vocabulaire par l’ajout de mots rares parmi les « mots cibles » ; l’amusement par la distillation de mots désuets mais amusant à prononcer, à comprendre ou à moquer ; et surtout la possibilité de créer des mots par le listage de suffixes et de préfixes (surtout latins et grecs) qui permettront de pallier les manques de la langue et de « devenir artisan du mot ». Partant de là, il n’est plus possible de pouvoir dire ce que l’on pense, et si ce n’est avec le bon mot, c’est au moins avec un mot.
Je vous laisse ici les derniers mots de leur introduction qui me parle vraiment lorsque je contribue sur le Wiktionnaire et que j’aimerais lire sur beaucoup plus d’ouvrages : « Ainsi, LE DICTIONNAIRE PLUS sera pour vous autant un instrument d’innovation qu’une source de référence. Il vous amusera en même temps qu’il vous éclairera. Vous vous en servirez comme d’une tabatière de mots ou d’une malle aux trésors. En parcourant ses pages, vous aurez, de temps à autre, la joie de découvrir quelques-uns des plus coruscants joyaux de la langue française. »Anciens numéros
- 2015 : avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2016 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2017 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2018 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2019 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2020 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2021 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2022 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2023 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2024 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, brouillon du prochain numéro