Wiktionnaire:Actualités/067-October-2020
Actualités du Wiktionnaire
Wiktionnaire:Actualités is a monthly periodical about French Wiktionary, dictionaries and words, published online since April 2015. Everyone is welcome to contribute to it. You can sign in to be noticed of future issues, read old issues and participate to the draft of the next edition. You can also have a look at Regards sur l’actualité de la Wikimedia. If you have any comments, critics or suggestions, our talk page is open!
News from here
- For several years, the Lyon Part-Dieu Municipal Library has been organising meetings to contribute to online collaborative projects, increasingly integrating a cross-project cross-disciplinary dynamic. On Thursday 15 October, the proposed theme was the vocabulary of bookbinding, which led to the improvement of the bookbinding thesaurus, the creation of reliure pleine peau, couvrure en cuir, papier marbré and comblage, as well as the improvement of demi-reliure, jaspure, dos brisé, grecquer, ferlet, gabarit, passure, ais and plaçure. Thanks to Briqueloup, NinaLust, Mnjida, Maringue, Vaulque, Lyokoï and to all the non-registered people for their participation! Thanks also to the Numelyo team for its support and participation!
- The University Library of Languages and Civilizations (BULAC) hosted on October 17th a first introduction and contribution workshop to the French-speaking Wiktionary and Lingua Libre thanks to the association Plateforme Atlas, created with the aim of bringing together the study of poorly documented languages and collaborative knowledge-sharing tools. Eavq and WikiLucas00 presented the Wiktionnaire and Lingua Libre. Participants tried their hand at contributing in Amis, Arabic, Korean, Italian, Kabyle, Macedonian, Wushi, Yoruba, and in Yiddish. A new session will be organized online.
- In response to many discussions, a renovation of the header of the community discussion page, the Wikidémie, has been implemented this month as well as a redesign of the automatic pages appearing when searching for non-existent pages. These changes are due to the graphic design efforts of Koreller, who benefited (suffered?) from the feedback of DenisdeShawi, Jpgibert, Noé, Snawei, Thomas Linard, Otourly and Assassas77. These changes were validated by a community vote and a long discussion.
- A new discussion is under way on improving the search engine so that it gives more information on the pages suggested when typing.
Statistics
- September 20th to October 20th, 2020
+ 34,236 entries and 95 languages modified to reach 4,132,842 entries and 1,191 languages with at least five entries.
+ 1,897 entries in French, to reach 387,638 lemmas et 587,983 definitions.
Top three languages with most addition after French is Portuguese (+ 20,489 entries), le Northern Sami (+ 7,296 entries) and Spanish (+ 1,434 entries).
+ 8 new languages for a total of 4,867 languages : Meroitic (+16), Middle Scots (+11), Purepecha (+9), Michoacán's Mazahua (+4), Early Scots (+2), Gija (+2), Kwakum (+1), Southern Puebla Mixtec (+1).
+ 3 062 quotations or examples in French, reaching 447,626.
+ 169 illustrative media (pictures and videos) in French Wiktionary pages, to reach 51,152.
+ 1,566 pronunciations (including 758 for French) to reach 218,931 audio pronunciations for 122 languages (including 100,319 for French). French passed the 100,000 audio pronunciations treshold this month.
+ 5 new thesauri, reaching 847 thesauri in 65 languages including 598 thesauri in French ! The new ones are the live cell in Russian by Pom445, the animation movie in Chinese by Popolon, Thinking in French by Tambuccoriel, Thinking in Esperanto by Lepticed7 and architecture in French by Trace.
Wikiscan and Wikistats give access each month to many figures, including a list of most viewed pages and pages modified by biggest numbers of editors.
+ 5 words created out of the 30 proposed in the Mots du jour. Is the mot du jour out of fashion?
+ 5 semantic fields : sudoku, ontology, pathology, addictology, packaging.
Wiktionnaire:Questions sur les mots [Questions on words] recorded in October 35 questions, compared to 34 in September and 19 questions in August.
News from elsewhere
- A major update of the Dictionary of South African English with a new interface made mobile-first. More than 4,000 entries are presented with examples showing the specific uses of English as it is used in South Africa.
- Le site Arcamax considère que le 16 octobre est la journée du dictionnaire et publie en cette occasion une liste de nouveaux mots apparus dans les dictionnaires d’anglais par années vous permettant de découvrir les nouveaux mots ajoutés votre année de naissance.
- Le Dico des ados passe la barre symbolique des 3,500 entrées avec le mot seul présenté par Kitel, une administratrice de 14 ans ! Félicitations à elle et à l’ensemble des bénévoles jeunes et moins jeunes qui font vivre ce projet ! Un vote a également eu lieu ce mois-ci pour changer la couleur du logo du bleu vers le orange, plus distinctif.
- Isabelle Kersimon décrypte dans un article les mots islamo-gauchisme et islamo-droitisme sur le site de l’Institut de recherche et d’étude sur les radicalisations. Une première source pour améliorer ces entrées d’actualité dans le Wiktionnaire ?
- Alice Raybaud propose au journal Le Monde un article choc : Faut-il gommer son accent pour réussir son entrée dans la vie active ?, qui aborde les problématiques de la norme dominante et de la perception des accents.
- Alice Develey propose pour Le Figaro un entretien avec Jean Pruvost à propos de l’histoire de la langue française.
- Suzanne Raga a compilé pour le site anglophone Mentalfloss une liste de douze faits surprenants sur les dictionnaires.
- Victor Connes et Nicolas Dugué proposent sur le site de vulgarisation scientifique Papier-Mâché un article titré Quand les algorithmes reproduisent les stéréotypes : le cas du traitement automatique du langage qui présente brièvement les méthodes de la linguistique computationnelle et notamment le plongement lexical.
- Le 28 octobre est décédé Alain Rey à l’âge de 92 ans. Ce lexicographe, connu pour son travail chez les éditions Robert où il y a dirigé la rédaction du Grand et du Petit Robert, est une des rares figures de la lexicographie reconnue par le grand public, notamment grâce à ses nombreuses apparitions à la radio et à sa volonté de vulgarisation de la lexicographie et de la linguistique du français. Des hommages lui ont été rendus dans de nombreux journaux, dont les éditions Le Robert se font écho dans leur hommage. C’était un modèle inspirant pour plusieurs personnes parmi nous. Puisse-t-il reposer en paix.
- Alexander Delaporte propose sur son blog un nouveau billet pour identifier à qui s’adresse un dictionnaire bilingue.
- Sur son blog dédié au Moyen-Âge, Hugo Blanchet lance une série d’analyses de mots qui viennent de loin avec un premier billet sur lobby.
- Mathieu Goux, spécialiste de l’histoire de la langue française, vient de mettre en place un blog appelé Questions de langue sur lequel il va republier des brèves qu’il publie chaque lundi sur Twitter à propos de la grammaire de la langue française.
Linguistic Resources
En mai 2020 devait se tenir la douzième conférence Language Resources and Evaluation à Marseille, un très grand rassemblement d’experts en ingénierie de la langue du monde entier. La conférence n’a pas eu lieu mais les actes ont été publiés en ligne. Voici quelques articles intéressants. Si vous en lisez d’autres qui mentionnent ou utilisent le Wiktionnaire, n’hésitez pas à les présenter ici !
- Massively Multilingual Pronunciation Modeling with WikiPron par Jackson L. Lee et al. : création d’une base de mots avec leurs prononciations pour 160 langues, à partir du Wiktionnaire anglophone.
- ENGLAWI: From Human- to Machine-Readable Wiktionary par Franck Sajous et al. : un minage du Wiktionnaire anglophone pour en faire une version requêtable par une machine.
- Wikinflection Corpus: A (Better) Multilingual, Morpheme-Annotated Inflectional Corpus par Eleni Metheniti et Günter Neumann : création d’une base de flexions à partir du Wiktionnaire anglophone, pour 138 langues.
- Common Voice: A Massively-Multilingual Speech Corpus par Rosana Ardila et al. : présentation de quelques résultats obtenus par l’équipe de Mozilla avec son outil de collecte de prononciations audio, Common Voice.
- Urban Dictionary Embeddings for Slang NLP Applications par Steven Wilson et al. : utilisation de Urban Dictionary comme dictionnaire pour entraîner une IA sur la détection de sens.
- Recent Developments for the Linguistic Linked Open Data Infrastructure par Thierry Declerck et al. : État des lieux du web sémantique lexicographique au niveau européen.
Dictionary of the month
Les éditions du Dictionnaire Le Robert
Les éditions Dictionnaires Le Robert sont à l’origine du dictionnaire éponyme. Créée en 1951 par Paul Robert, elles ont fini par se hisser à égalité avec les éditions Larousse, implantées depuis bien plus longtemps dans les ventes de dictionnaires. Cela s’explique par le publication de dictionnaires innovants qui ont rapidement conquis le public. En effet, alors que la forme d’une entrée de dictionnaire courante à l’époque est assez simple (MOT : Une ou plusieurs définitions, avec possiblement des citations et des exemples d’usage), Robert veut offrir plus. Le seul dictionnaire accessible à l’époque ayant plus d’information était le Dictionnaire de la langue française d’Émile Littré, établi en 1863. Et c’est d’ailleurs ce dernier qui sera l’inspiration première de Paul Robert, lorsqu’il lance son projet de rédaction. Il veut faire comme le Littré, mais en agrémentant les mots de liens analogiques en plus de leurs étymologies et de citations d’actualité.
C’est ainsi que naît celui qu’on appellera le « Grand Robert » mais qui, dans sa première édition, est titré « Dictionnaire alphabétique et analogique de la langue française » lors de sa sortie en 1964. Cette analogie s’exprime par les liens de synonymies et d’antonymies omniprésents dans l’ouvrage. Cette première publication de la « société du nouveau Littré » (premier nom des éditions Le Robert) a pris 13 ans de rédaction. Un travail important dirigé par Alain Rey, diplômé de lettres et d'histoire de l'art à la Sorbonne, engagé dès 1952 pour apporter son expertise stylistique puis lexicographique. La même année est engagée Josette Debove, linguiste issue de la Sorbonne également, qui prendra le secrétariat de la rédaction et apportera ses connaissances linguistiques pour la description des mots. Et de fait, elle deviendra la première femme lexicographe reconnue (en 1952… ).
Trois ans plus tard, en 1967, la même équipe sortira le « Petit Robert », version plus courte, elle ne tient plus qu’en un seul tome, contrairement à 7 ou 5 pour la première et la deuxième édition du Grand Robert. L’ouvrage n’est pas annualisé tout de suite, mais il est apprécié du public pour qui le Grand Robert était trop cher et trop encombrant. Intégrant rapidement des néologismes ainsi qu’un vocabulaire provenant des argots, il fait sa place à côté du Larousse jugé trop souvent timide à l’intégration de nouvelles entrées et sur le vocabulaire. Devant le succès, c’est le Petit Robert qui devient l’ouvrage phare de la maison d’édition, qui se contentera de seulement 2 éditions supplémentaires du Grand Robert, et se contentant de seulement le réimprimer régulièrement.
Néanmoins, l’établissement d’une équipe de lexicographes expérimenté·e·s a permis aux Éditions Le Robert de publier une pléthore d’ouvrages autour de la langue française. Que ce soit d’autres dictionnaires parfois très innovants, parfois plus classiques mais ciblés sur des publics particuliers (écoliers et écolières, apprenant·e·s du français, etc…), parfois plus spécialisés. Et contrairement à Paul Robert, qui ne publiera que très peu d’ouvrages à côté de son dictionnaire, Alain Rey et Josette Rey-Debove publieront beaucoup d’ouvrages, notamment scientifiques. Leur vision très ouverte sur la langue (descriptif plutôt que prescriptif, très favorable à la féminisation, à la promotion de l’argot et des régionalismes…) en ont fait des personnes marquantes dans leurs milieux respectifs d’études et, pour Alain Rey, pour le grand public grâce à ses interventions radiophoniques nombreuses.
Pour conclure, je redirigerai celles et ceux qui veulent en lire plus sur le sujet vers l’ouvrage « Les dictionnaires Le Robert » publié en 2003 et accessible sur ce lien.
Collaborations of the Week in October
These proposals, displayed on the homepage, have been made by Noé and Sebleouf. Thank you for your contributions to the people who created the words!
Semaine 40 (28 septembre au 4 octobre 2020)
Semaine 41 (5 au 11 octobre 2020)
Semaine 42 (12 au 18 octobre 2020)
Semaine 43 (19 au 25 octobre 2020)
Semaine 44 (26 octobre au 1er novembre 2020)
Semaines suivantes
Collaboration of the month
La proposition du mois était de s’intéresser aux locutions ! La plupart des thèmes hebdomadaires comportent déjà de nombreuses entrées avec des suites de mot, car les mots simples sont déjà bien renseignés, mais pour autant, il reste difficile dans certains cas de déterminer si une entrée est nécessaire ou s’il s’agit d’une composition normale de la langue, qui n’est pas mémorisée à part par les locuteurs et locutrices de la langue. Pas de gros travaux ce mois-ci, mais le projet reste ouvert pour qui veut rejoindre la réflexion sur ce sujet ! Pour le mois de novembre, comme il y a nouveau confinement, on propose un nouveau défi de création de thésaurus !
La frange lexicale
Pour décrire une langue, il est possible d’étudier de nombreux aspects complémentaires qui participent à la définir comme une langue : inventaire des sons, système des sons, inventaire des assemblages de sons qui ont un sens, système pour l’agencement des assemblages, cadres d’usage et registres, usages paralinguistiques tel que la gestuelle et les bruits, etc. Un dictionnaire va présenter surtout la partie d’inventaire, en ayant besoin des autres éléments pour bien l’expliquer, et c’est pour ça que le Wiktionnaire propose l’indication de la prononciation, donne des informations grammaticales complexes et essaye parfois en note d’expliquer les usages sociaux ou la gestuelle expressive.
L’inventaire est appelé aussi le lexique de la langue, ce sont tous les éléments disponibles à une communauté, qui sont intégrés dans la langue. Certains mots ou certaines expressions circulent mais ne sont pas tout à fait perçues ou considérées comme intégrées, elles restent dans les marges, dans ce qu’on appelle affectueusement la frange lexicale.
Cette zone grise, floue, mouvante, peut couvrir un ensemble très large de termes, selon la vitesse de circulation des mots et la vitesse à laquelle ils sont décrits par les dictionnaires. Les dictionnaires à publication annuelle ont permis de réduire la taille de la frange lexicale, et le Wiktionnaire, capable de décrire près de 15,000 nouveaux termes en un an, va probablement encore venir réduire la taille de cette frange ! Il demeurera cependant toujours des usages non-décrits dans les dictionnaires, qui ne sont qu’une tentative de représentation de la réalité. De même que l’on dit que la carte n’est pas le territoire, on pourrait dire que le dictionnaire n’est pas le lexique.
See (or listen to) also
Some audio or video shows on lexicography, linguistics and the French language, released or discovered this month.
- France Culture and its journalist Philippe Garbit published a 13-part audio series in podcast (in French : baladodiffusion) of the series « Nuit des Dictionnaires », with, in particular, archive reruns on the theme.
- The Paris Institute for Rare Languages (ILARA) launches a live conference cycle on their YouTube channel of which the first video was broadcast on 29 October 2020 with Scott DeLancey, a leading specialist in Sino-Tibetan languages.
- New episode of the audio programme "La langue bien pendue" with chronicles on language, and Mathieu Avanzi as a guest.
- Not yet mentioned here, the Paris Fire Brigade offers videos explaining their jargon.
- The podcast programme Parler comme jamais comes back for a new season with a first episode on the 28th of October, about the question of whether young people speak badly. The programme is carried by Laélia Véron and Maria Candea, and produced this year by Le Robert publishing house.
- This month's episodes of the programme L’humeur de Linda are devoted to the inclusive writing, to the French expression "être habillé comme la chienne à Jacques", to the longest word and to the curfew.
- A less-than-three-minute video to learn more about francophones in America.
- And a more-than-two-hour one by Monté from the channel "Linguisticae" about history and the simplification of ortografy.
Anciens numéros
- 2015 : avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2016 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2017 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2018 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2019 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2020 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2021 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2022 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2023 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2024 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, brouillon du prochain numéro