Wiktionnaire:Actualités/018-septembre-2016
Wiktionnaire:Actualités est un journal mensuel sur le Wiktionnaire, les dictionnaires et les mots. Il est publié en ligne depuis avril 2015. Son écriture est ouverte à toutes les bonnes volontés. Vous pouvez recevoir un avis lors de la publication des prochains numéros, consulter les anciens numéros et participer au brouillon de la prochaine édition. Vous pouvez lire aussi les Regards sur l’actualité de la Wikimedia. Pour les commentaires, critiques ou suggestions, voir la page de discussion.
Brèves
- Selon une étude récemment publiée dans Scientific American et discutée sur le blog Sciences du Monde.fr, il semblerait que notre jugement moral varie suivant la langue dans laquelle une situation est présentée. Ainsi sommes-nous moins sensibles lorsqu’on s’exprime dans une langue autre que notre langue maternelle. Sur ce sujet, voir la controverse autour de l’hypothèse de Sapir-Whorf sur l’encyclopédie Wikipédia
- Une nouvelle présentation de mots issus de l’ouest de la France a été faite par le blog Français de nos régions ! Il présente la zone d’utilisation de mots provenant de l’ouest : tancarville, on n’est pas rendu (à Loches), débaucher, loger.
- Slate consacre un long article Le journaliste l’ignore, mais les mots ont un sens sur l’étude d’Ingrid Riocreux au sujet du langage des médias.
- Les Actualités du mois d’août ont été traduites en anglais et le Signpost du 29 septembre mentionne cette publication. Le Signpost est la plus ancienne et complète des publications à propos des projets wiki, et c’est une joie que de voir cette démarche de traduction saluée de la sorte.
Synonymes
Les Dictionnaires de synonymes sont des ouvrages lexicographiques qui permettent de lister les mots de sens proches, sans les définir. Peu sont disponibles en ligne, les principaux étant le Dictionnaire Électronique des Synonymes (DES) de l’Université de Caen, le Dictionnaire des synonymes français (ISC) de l’Institut des Sciences cognitives du CNRS et le Wordnet Libre du Français (WOLF) développé par une équipe de l’Université de Paris 7. Durant la WikiConvention francophone d’août, Arkanosis a animé un atelier sur l’exploitation de données et il a montré l’efficacité de sa méthode (grep + python) pour construire un dictionnaire de synonymes à partir du Wiktionnaire. Pour le côté technique de sa méthode, voir les diapositives de la présentation. Les chiffres obtenus sont présentés ci-contre.
Grâce au travail effectué sur le Wiktionnaire jusque-là, il est possible en à peine quelques minutes de générer un dictionnaire des synonymes à partir des données déjà présentes. Il est composé de davantage d’entrées que ces deux concurrents directs mais le nombre de relations indiquées est nettement plus faible, car il n’a pas été conçu dans ce but là. Pour autant, le produit est déjà digne d’intérêt et pourrait être édité sous forme de livre numérique à l’avenir. Et il sera possible de publier de nouvelles éditions avec l’avancée du Wiktionnaire ! |
|
Par ailleurs, le Wiktionnaire publie un classement des mots en français ayant le plus de synonymes mentionnés dans leur page. Quand il y a de trop nombreux synonymes, ils sont plutôt sur une page de thésaurus.
Statistiques
- De mi-aout à mi-septembre (du 20/08/2016 au 20/09/2016) (Attention deux mises à jour de statistiques sont accumulées)
- Le français gagne 12 074 entrées et 2 775 citations. Il est désormais à 332 672 lemmes, 486 502 définitions et 303 265 citations d’illustration.
- Les trois autres langues qui ont le plus avancé sont le same du Nord (+ 3 642 entrées), le tchèque (+ 1 272 entrées) et le russe (+ 605 entrées).
- Les nouvelles langues dans le projet sont : le komo (langue bantoue) (+2), le gujarati (+1), le lo-toga (+1), le lakon (+1), le lemerig (+1), le koro (Vanuatu) (+1), le mlabri (+1), le mising (+1), le mwerlap (+1), le mru (+1), le olrat (+1), le hiw (+1), le nume (+1), le lehali (+1), le volow (+1), le vera’a (+1) et le dorig (+1).
- Cette période a vu l’enrichissement de 19 470 pages pour au moins 71 langues !
- Les nouveaux codes de langues dans le Wiktionnaire sont : le komo (langue bantoue) (code : kmw) et le mamara (code : myk).
- Le Wiktionnaire propose maintenant des définitions pour 4 025 langues !
- Autres
- Qualité du Wiktionnaire : l’entrée prout est proposée comme étant un bon contenu.
- Dictionnaire illustré, le Wiktionnaire propose actuellement 26 672 images dans ses entrées. La progression est de 129 de plus que le mois dernier.
- Le Wiktionnaire francophone dispose de 243 thésaurus en français.
Le dico du mois
- Henriette Walter, Le français dans tous les sens, Points, 1988, ISBN 978-2-7578-5999-5
Comment dire… Henriette Walter est quelqu'un d’extraordinaire, en plus d’être une excellente linguiste. J’eus la chance de la rencontrer deux fois, et j'aimerais vraiment pouvoir lui parler de notre projet Langues de France pour qu’elle nous corrige et nous aiguille. En quelques mots, cette vénérable dame a la malice et l’intelligence qui rayonnent à chaque échange et ses publications sont de grande qualité. C’est un honneur pour moi de vous présenter ici un de ses ouvrages phares : Le français dans tous les sens. Ce livre sans prétention vous initie à l’histoire du français au travers d’un grand nombre d’anecdotes connues ou rares et replace cette histoire dans le contexte du pays qui a connu parallèlement à l’évolution de cette langue, l’apparition et la disparition de bien d’autres ! Si vous cherchez à découvrir cette histoire, cette œuvre est un excellent début, chacune des affirmations citées est sourcée en fin d’ouvrage, la bibliographie proposée est fournie et le ton est neutre. En effet, l’auteur est critique lorsque la science l’est et pédagogique lorsqu’il faut que le lecteur comprenne pourquoi tel fait est une base acquise en linguistique. Accessible à tous tout en étant un excellent outil pour qui veut aller plus loin, il me serait intolérable qu’aucun des contributeurs du Wiktionnaire n’en ait un exemplaire… Et fait que je trouve incroyable, c’est que malgré la critique de la normalisation du français et de la pensée conservatrice de l’Académie, ce chef-d’œuvre a obtenu le prix de l’Académie française ! (Ce qui m’amène à penser que soit ils étaient plus progressistes il y a 30 ans, soit ils n’ont pas lu le livre qu'ils ont récompensé…) Quoi qu'il en soit, il est très éclairant sur l’étymologie du français en donnant les mécanismes d’évolution qui ont construit les mots qui constituent cette langue. --— Lyokoï (Parlons ) 1 octobre 2016 à 15:21 (UTC)
Deuxième LexiSession sur les voies
Impulsé par le Fantastique Groupe du Wiktionnaire, les LexiSessions visent à proposer des thèmes mensuels pour des contributions ciblées sur l’ensemble des Wiktionnaires simultanément. La deuxième LexiSession portait sur le thème des voies urbaines et a permis l’amélioration du thésaurus sur les voies urbaines et la création du thésaurus sur les ponts en français .
Les participations sur les autres Wiktionnaires et l’enrichissement qualitatif du Wiktionnaire francophone sont difficiles à mesurer. On relève avec plaisir le premier thésaurus sur le Wiktionnaire catalan ! On peut mentionner également la liste générée par Benoît Prieur des termes utilisés par Wikidata pour le champ des voies, qui a révélé de nombreux liens rouges dans le Wiktionnaire et l’utilisation de termes étrangers pour désigner des types de voies particuliers.
La LexiSession d’octobre portera sur le thème de la police !
En vidéo
Cette rubrique vous propose de faire une revue des vidéos sur la linguistique et la langue française du mois ! Ce mois-ci, pas grand chose de neuf.
- Langue de Cha’, qui parle d’habitude de linguistique, s’intéresse cette fois à Internet et la recherche, en illustrant une de ces définitions par la jolie page sur la sérendipité.
- Linguisticae et Usulmaster ont préparé conjointement une vidéo sur la manipulation politique par la langue.
Les mots du mois qui précède
Les statistiques permettent de connaître les mots modifiés par le plus de monde au cours d’un mois. Voici donc les mots les plus modifiés d’août 2016 ! En exposant, le nombre de participants différents :
- Le thésaurus chat en français 8 (créé dans le cadre de la première LexiSession !)
- guigne7
- Le thésaurus cyclisme en français 5
- bouche en cul-de-poule5
- burkini5
- Bruxelles5
- à mouchoir que veux-tu4 (créé durant un atelier de formation à la WikiConvention francophone)
- Macquelines4 (création)
- démonique4 (création)
- vague4
Ce mois-ci est le premier mois où les statistiques dévoilent des thésaurus parmi les pages les plus modifiées !
Curiosité
Une des préoccupations des langues vivantes est de se montrer réceptive à la modernité. Cela implique une capacité à créer des néologismes à partir de mots d’emprunt. Parmi les divers procédés possibles, le plus élaboré consiste à trouver un mot dont le sens et la prononciation ressemblent au mot emprunté (correspondance phono-sémantique). Le mandarin se prête assez bien à cela. Entres autres exemples on peut citer :
On notera, pour le fun, cette étonnante série de dérivations phono-sémantiques entre le sanskrit, l’anglais et le mandarin au sujet du viagra :
- व्याघ्र (vyāghrá, « tigre ») — viagra (vigor + Niagara) — 伟哥 (wěigē, « grand frère ») lui même faisant référence par antonymie à 小弟弟 (xiăodìdi, « petit frère »), euphémisme pour « pénis ».
Ce mois-ci deux nouvelles listes ont été dressées : Catégorie:Mots féminins en français pouvant désigner des hommes et Catégorie:Mots masculins en français pouvant désigner des femmes. On constate dans l'ensemble que le travestissement de quelqu'un par un substantif a une connotation péjorative voire injurieuse.
Anciens numéros
- 2015 : avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2016 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2017 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2018 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2019 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2020 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2021 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2022 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2023 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2024 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, brouillon du prochain numéro