Wiktionnaire:Actualités/028-juillet-2017
Wiktionnaire:Actualités est un journal mensuel sur le Wiktionnaire, les dictionnaires et les mots. Il est publié en ligne depuis avril 2015. Son écriture est ouverte à toutes les bonnes volontés. Vous pouvez recevoir un avis lors de la publication des prochains numéros, consulter les anciens numéros et participer au brouillon de la prochaine édition. Vous pouvez lire aussi les Regards sur l’actualité de la Wikimedia. Pour les commentaires, critiques ou suggestions, voir la page de discussion.
Brèves
- La langue maori s’enrichit de plus de 200 mots sur la santé mentale et l’autisme, preuve de sa vitalité et de la volonté de ses locuteurs et locutrices à lui donner des outils pour mieux décrire le monde.
- Le Monde diplomatique du mois de juillet 2017 consacre une page au serbo-croate, langue considérée comme une seule langue par beaucoup de linguistes mais séparée en quatre (bosnien, croate, monténégrin, serbe) pour des raisons politiques.
- Parce que Mathieu Avanzi fait un travail formidable avec le français de nos régions, il a gagné une belle audience et une large diffusion de ses merveilleuses cartes. Néanmoins, toute gloire comporte sa suite de déboires. Et Béatrice Rea sur le site The Conversation revient sur Le nom de la « rose » ou l’épineuse question de la prononciation des mots français et montre comment on peut voir la glottophobie en direct sur internet, notamment par la fausse interprétation de cartes linguistiques comme celles de M. Avanzi.
Il est plus que temps de vous présenter ce projet qui viendra enrichir énormément le Wiktionnaire dans les années à venir ! Le projet Lingua Libre est la rencontre entre deux autres projets : Langues de France sur Wikipédia et Shtooka un projet développé par Zmoostik (d · c · b) pour enregistrer massivement les langues et qui a versé des milliers de fichiers audios dans Wikimedia Commons (même si beaucoup ne sont pas catégorisés).
Lingua Libre a pour vocation d’enregistrer toutes les langues du monde, commune par commune… et propose une interface d’enregistrement en ligne avec deux voies d’enregistrement possibles : Un enregistrement unique avec tous les paramètres disponibles, ou bien un enregistrement par liste de mots qui coupe les fichiers sons automatiquement après chaque silence. Cette dernière possibilité est une technologie issue directement du projet Shtooka réutilisée pour le net.
Actuellement, l’outil est encore en développement et il garde sur son serveur les enregistrements effectués. Il est possible de télécharger les enregistrements un à un d’un simple clic ou par lot en allant sur le profil d’un locuteur. En effet, en plus de proposer la possibilité de faire des enregistrements, Lingua Libre propose une gestion de compte permettant d’associer plusieurs locuteurs à un compte. Cela dans le but de pouvoir enregistrer plusieurs personnes avec le même compte.
Lingua Libre a été financé par des subventions de la DGLFLF en quasi-totalité et a été initié puis dirigé par Lyokoï (d · c · b), avec la collaboration de Xenophôn (d · c · b), qui a été engagé par l’association Wikimédia France pour l’occasion et qui a pris en charge tout le côté administratif et l’organisation de réunions et de sessions d’enregistrement de test. Enfin, l’outil a été en très grande partie codé par Zmoostik (d · c · b).
À l’avenir, le projet va se rapprocher le plus possible d’une structure Wiki en se basant sur MédiaWiki avec une interface Wikibase afin de faciliter l’accès à ses métadonnées. Ce sera une forme proche de la base multimédia Wikimedia Commons, mais dédiée aux enregistrements de langues, avec des metadonnées spécifiques pour permettre l’intégration dans les Wiktionnaires mais aussi la réutilisation pour l’apprentissage, la valorisation ou l’étude des langues.
Statistiques
- De mi-juin à mi-juillet (du 20/06/2017 au 20/07/2017)
- Le français gagne 1 765 entrées et 1 779 citations ou exemples. Il est désormais à 353 794 lemmes, 526 189 définitions et 325 897 citations d’illustrations ou exemples.
- Les trois autres langues qui ont le plus avancé sont le same du Nord (+ 6 950 entrées), le latin (+ 209 entrées) et l’ancien français (+ 202 entrées).
- Deux nouvelles langues dans le Wiktionnaire ce mois-ci : le kaera (+1) et le dharug (+1).
- Cette période a vu l’ajout de 10 777 nouvelles entrées pour 67 langues !
- Les mots du mois
Les pages de statistiques externes permettent de connaître :
- Autres évolutions
- Il y a 32 172 médias d’illustrations (images et vidéos) dans les articles du Wiktionnaire, soit 192 de plus que le mois dernier.
- Au 31 juillet 2017, le Wiktionnaire propose 275 thésaurus en langue française ! Trois nouveaux thésaurus ce mois-ci, sur le vol aérien, la pomme et le médicament.
- Parmi les pages décrivant des mots de français, 3 883 pages incluent un lien vers au moins un thésaurus, permettant une navigation par le sens.
- La page Wiktionnaire:Questions sur les mots a reçu en juillet 124 questions, contre 112 en juin, 166 en mai, 148 en avril.
Maintenance
Ce mois-ci, le Wiktionnaire a fait peau neuve en remplaçant dans son wikicode les balises HTML devenues désuètes avec le standard HTML5, ce qui aura pour effet d’améliorer le référencement des pages et d’avoir un code plus pérenne. Cette opération a été rendue possible grâce au développement d’un outil informatique appelé Linter qui traque les irrégularités dans le code du site, ainsi que les balises désuètes et rend disponible à tous ses résultats. Cela a permis de mettre à jour plus de 30 000 pages du Wiktionnaire. Les contributeurs et contributrices sont maintenant vivement invités à ne plus utiliser les balises suivantes : <center>
, <font>
, <strike>
, et <tt>
, et à les remplacer par des solutions équivalentes.
Anciennes balises | Balises de remplacement | Exemple |
---|---|---|
<span style="text-align:center;"> | <div style="text-align: center;"> | Texte avec "text-align: center"
|
<span style="color:x"> | <span style="color: x; font-size: y; font-family: z;"> | Texte avec "color: red" Texte avec "font-family: Times New Roman;" |
<s> | <s> | |
<code> | <code> | Texte avec code
|
Le dico du mois
Jean Tardieu, dans Un mot pour un autre, Éditions Gallimard, 1951.
Le Professeur Frœppel avait conçu le projet grandiose de construire une langue complète, uniquement basée sur l’utilisation des « mots inférieurs ». À travers ce personnage fictif, Tardieu expérimente des écritures minimalistes et montre que, finalement, la langue pourrait se contenter de bien peu et nous nous comprendrions tout aussi bien.
Avec un brin d’humour et un effort de description des usages, ce dictionnaire resté hélas ! inachevé compte 214 entrées (que j'ai dénombrées moi-même !) de termes qu’empruntent les humains pour parler aux animaux domestiques, aux enfants et aux étrangers, diminutifs familiers, mots vagues, monosyllabes bêtifiants à répétition, expressions enfantines ou gâteuses, mots et grommellements imitatifs, interjections et exclamations, argot édulcoré, etc.
En plus d’être un recueil assez inattendu de ces mots, les entrées sont parfois agrémentées d’exemples ; d’étymologies, malheureusement non sourcées ; de leur registre de langue ou de leur origine ; d’aide à la prononciation.
Une œuvre amusante à lire, et à compléter absolument par les textes variés (théâtre, poésie, récit) qui accompagnent ce dictionnaire et mettent en application ce langage. Une belle démonstration d’écriture sous contrainte, et peut-être précurseur d’un futur wikiprojet ?
Extraits choisis :
Ah ! Ah ! (ton ascendant) : Confirmation d’un fait que l’on soupçonnait. Ex. « Le Grand Pan est mort ! » Réponse : « Ah ! Ah ! ».
Cui-cui : Chant des oiseaux. Ex. « Le cui-cui des fifis est mimi. » (Le chant des oiseaux est plaisant.)
Gugusse : de « Auguste », clown célèbre. Personne qui veut amuser la galerie en faisant le pitre. « Qualis gugus pereo ! » (Néron mourant.)
Machin : Masculin de « chose ».
Ouais ! : Nasalisation de « oui ». (Le nasal bémolise et biaise. Il ajoute donc un élément dubitatif et ironique à l’affirmation.)
Zizi, ou zibi : Parties sexuelles de l’individu mâle (mot d’origine africaine).
— une chronique par Dara
LexiSession sur le vol aérien
Impulsé par le Fantastique Groupe d’utilisateurs de Wiktionnaire, les LexiSessions visent à proposer des thèmes mensuels pour dynamiser l’ensemble des Wiktionnaires simultanément. Les thèmes sont suggérés en amont sur Meta et annoncé chaque mois sur la Wikidémie, l’espace principal de discussion.
La LexiSession de juillet était sur le vocabulaire du vol aérien et a permis la création du thésaurus du vol aérien qui permet de retrouver le vocabulaire lié à ce type de déplacement. Notons également plusieurs améliorations dans la version anglophone du projet autour de ce thème. Beaucoup de mots pourraient encore y être réunis, alors n’hésitez pas à y contribuer à l’avenir !
Pour le mois d’août, le thème proposé est le cirque !
En vidéo
Cette rubrique vous propose de faire une revue des vidéos sur la linguistique et la langue française du mois, n’hésitez pas à ajouter les vidéos et les chaînes que vous trouvez !
- Elles comme Linguistes : Ce mois-ci, elles font le point sur l’hypothèse Sapir-Whorf, c’est-à-dire l’influence de la langue sur la façon de penser.
- Linguisticae : Il présente cette fois un peu de variation régionale autour de la schneck, ou du pain aux raisins, c’est selon, donc.
- Le monde des langues : Une chaîne sur les langues dont nous n’avons pas encore parlé, qui propose de nombreuses vidéos, surtout sur l’apprentissage des langues !
Réflexions
Pour faire suite à la discussion concernant la création d’une catégorie Lemmes, voici quelques éléments permettant de cerner la difficulté qu’il y a à tout simplement savoir quels mots intégrer dans un dictionnaire dans le cas des langues polysynthétiques comme par exemple les langues inuites ou yupikes. Dans celles-ci, les mots — au sens d’unités lexicales porteuses d’un sens propre et séparées à l’oral par une pause et à l’écrit par des espaces ou des signes de ponctuation — les mots donc, peuvent correspondre à un syntagme, une proposition voire même à une phrase entière dans une autre langue, comme le français.
La question se pose donc de savoir quoi mettre dans un dictionnaire, que peut-on considérer être une forme canonique d’un mot pour ce type de langues ?
Le mode de constitution de ces mots consiste en une dérivation partant d’une racine à laquelle sont attachés différents suffixes. Il est clair qu’on ne pourra intégrer tous les mots puisque, par définition, il y en a une infinité et que, par ailleurs l’intérêt est quasiment nul pour un lecteur.
Qui irait mettre dans un dictionnaire français : on dirait le bruit d’un avion (en inuktitut « qangatasuuvvaluktuq ») ?
On pourrait penser ne mettre que les racines. Mais elles sont très peu nombreuses et, par exemple, nous n’aurions pas le mot avion (« qangatasuuq ») qui est lui-même dérivé de la racine qangata- (« s’élever en l’air ») et du suffixe -suuq (« quelque chose qui a l’habitude de ou est capable de »).
Le linguiste Steven A. Jacobson a proposé les règles suivantes à ce sujet (Yup’ik eskimo dictionary, ANLC, 2012, volume 1, page 16) : (les exemples sont en yupik central) :
- Seront considérées comme entrées principales
- les racines (bien évidemment),
- les dérivés dont la constitution et/ou la signification est facilement prévisible si la forme est significativement différente de celle du mot parent. Ex. acir- (« nommer ») sera intégré bien qu’il dérive de ateq (« nom ») car le lien entre at- à ac- n’est pas évident,
- les dérivés dont la signification peut être donnée par un mot dans la langue cible (dans un dictionnaire bilingue). Ex: calissuun, littéralement (« instrument pour travailler ») qui correspond en fait à (« outil »),
- les dérivés qui, bien que facilement prévisibles, sont d’un usage courant. Ex: maqivik (« bain de vapeur »), dérivé de maki- (« prendre un bain de vapeur »).
Ces quelques réflexions n’ont pour seul objectif que d’inciter à être prudent lorsque, dans le Wiktionnaire, on envisage d’étendre à toutes les langues certaines notions initialement prévues pour le français. — une chronique par Unsui
Anciens numéros
- 2015 : avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2016 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2017 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2018 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2019 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2020 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2021 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2022 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2023 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2024 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, brouillon du prochain numéro