Wiktionnaire:Actualités/016-juillet-2016
Wiktionnaire:Actualités est un journal mensuel sur le Wiktionnaire, les dictionnaires et les mots. Il est publié en ligne depuis avril 2015. Son écriture est ouverte à toutes les bonnes volontés. Vous pouvez recevoir un avis lors de la publication des prochains numéros, consulter les anciens numéros et participer au brouillon de la prochaine édition. Vous pouvez lire aussi les Regards sur l’actualité de la Wikimedia. Pour les commentaires, critiques ou suggestions, voir la page de discussion.
Brèves
[modifier le wikicode]- Le darwinisme et le langage est la dernière émission radiophonique de La Tronche en biais, duo de scientifiques et zététiciens qui ont invité Linguisticae, un youtubeur régulièrement mentionné dans la chronique mensuelle des vidéos des Actualités. Durant ces deux heures de discussions vulgarisées, il est notamment fait mention du Wiktionnaire avec une critique tout à fait justifiée et conforme aux mises en garde sur le contenu notamment étymologique : Il ne faut jamais croire une étymologie non-sourcée. L’invité identifie clairement le problème de la contribution ouverte à tous au sein de tout projet collaboratif visant la connaissance.
- Mésestimé et souvent complètement absent des dictionnaires généraux, le français des Antilles dispose de particularismes aussi variés que les autres français régionaux. Le blog Le français de nos régions qui a souvent été cité ici rapporte une étude sur le français de cette région, ainsi que des mots locaux pour désigner les billes : marbre, tit-marbre, canique…
- Revenons en Suisse romande et aux zones frontalières françaises, Le français de nos régions proposes des cartes des dénominations de la flore avec tout un vocabulaire associé : doucette, rampon, ramponnet, trochette/tronchette et salade de blé pour la mâche ; cramias/cramiats, dent-de-lion, cramaillot et baraban pour le pissenlit ; et enfin, cynorhodon/cynorrhodon, gratte-à-cul et gousson pour le gratte-cul. N’hésitez pas à créer les entrées si vous disposez d’attestations de leurs usages !
Le Wiktionnaire dans une base de données ?
[modifier le wikicode]Ce mois-ci, un petit dossier spécial en trois parties sur le futur du Wiktionnaire, par Noé.
Faire évoluer le Wiktionnaire[modifier le wikicode]Durant le mois écoulé, de nombreuses discussions se sont tenues sur l’évolution technologique du Wiktionnaire, localement, grâce à la traduction des discussions déjà tenues sur Wikidata et avec une nouvelle tentative de synthèse. Les discussions portent sur les possibilités de rendre les données contenues dans le Wiktionnaire plus facile à exploiter par des machines, et plus connectées aux données présentes dans les autres projets collaboratifs en ligne. Le spectre du changement[modifier le wikicode]Jusqu’à récemment, ce thème attirait surtout des personnes intéressées par les bases de données et très peu les aventuriers lexicographes contributeurs aux Wiktionnaires (toutes langues confondues). Il est apparu des lignes de tension entre l’exploitation par une machine et le plaisir pris à contribuer, entre les personnes souhaitant transformer et réexploiter les données et les personnes enrichissant les données par leur travail de réflexion et de rédaction. Une évolution technologique du Wiktionnaire, bien que souhaitable dans l’idée, devait se faire dans la concertation et sans entraver les habitudes de contributions des piliers qui portent le projet depuis ses débuts. Une problématique complexe dans un archipel multilingue de projets plus ou moins avancés. Il semblait également que l’efficacité des contributions puisse pâtir d’un changement abrupt de méthode de saisie qui ne laisserait plus de place à l’existant. La connexion entre le Wiktionnaire et Wikidata s’envisage via un éditeur visuel et il est apparu crucial qu’un développement conjoint soit envisagé. Si le développement d’une exploitation massive des données est retardé, l’accent pourra être mis sur l’enrichissement et l’amélioration des contributions. Deux dynamiques se lient alors : le désir d’être lisible par une machine et le désir d’être lisible par un être humain. Une solution commune est encore en réflexion, et la solution pourrait prendre des années avant de voir le jour. Mais ça existe déjà ![modifier le wikicode]Les Actualités d’août 2015 avaient déjà fait mention des travaux de Nabil Hathout et Franck Sajous sur une exploitation des données du Wiktionnaire portant le nom de GLAWI. Une conférence donnée cette année leur a permis de présenter à nouveau la puissance de leur outil et d’écrire un résumé en huit pages qui met en avant énormément de données positives extraites du Wiktionnaire grâce à leur traitement automatisé. Mentionnons par exemple le tableau 3 qui donne le classement des 20 langues les plus citées dans les paragraphes d’étymologie (latin, grec, anglais, occitan, ancien français,…). Ils indiquent également que 94% de leurs entrées disposent d’une indication de la prononciation, ce qui est largement supérieur à toutes les autres bases de données lexicales en ligne. Enfin, ils insistent sur le fait que leur base est la seule base de données lexicales qui donnent des définitions ! Leur outil est fonctionnel et montre que le passage dans une base de données est possible, pour l’exploitation en tout cas.
À cette même conférence était présent un autre groupe qui développe UniMorph, une exploitation des données de différentes versions linguistiques des Wiktionnaires pour générer des paradigmes morphologiques, c’est-à-dire des listes de flexions, comme les conjugaisons des verbes, des formes déclinées pour les langues à cas et bien d’autres choses. Il s’agit d’une exploitation transversale et un peu moins fine que pour GLAWI, dans la mesure où il s’agit de lecture des données affichées et non de la création d’une base de données. Pour autant, le résultat est intéressant et amène des résultats exploitables malgré les spécificités de présentation propres à chaque Wiktionnaire. Ainsi, les divergences de présentations ne sont pas un obstacle infranchissable à leurs réexploitations.
|
Statistiques
[modifier le wikicode]- Début juin à mi-juillet (du 01/06/2016 au 20/07/2016) (Attention deux mises à jour de statistiques sont accumulées)
- Le français gagne 20 515 entrées et 4 527 citations. Il est désormais à 331 114 lemmes, 483 917 définitions et 298 977 citations d’illustration.
- Les trois autres langues qui ont le plus avancé sont le same du Nord (+ 3 063 entrées), l’italien (+ 469 entrées) et le russe (+ 414 entrées).
- Les nouvelles langues dans le projet sont : le haut ta’oih (+3), le bariba (+2), le pimbwe (+2), le bru de l’Ouest (+2), le kataang (+2), le ngeq (+2), le katu (+1), le bamoun (+1), le kuy (+1), le ong (+1), le júma (+1), le sô (+1), le nyakyusa-ngonde (+1), le rungwa (+1), le safwa (+1), le konongo (+1) et le dusun central (+1).
- Cette période a vu l’enrichissement de 18 484 pages pour au moins 83 langues !
- Les nouveaux codes de langues dans le Wiktionnaire sont : le proto-katuique (code : proto-katuique), le bru de l’Ouest (code : brv), le kataang (code : kgd), le katu (code : kuf), le ngadjuri (code : ngadjuri), le haut ta’oih (code : tth), le dusun central (code : dtp), l’angevin (code : angevin), le bourbonnais (code : bourbonnais), le francilien (code : francilien), le mayennais (code : mayennais), le percheron (code : percheron), le sarthois (code : sarthois) et le tourangeau (code : tourangeau). De plus, le code bru ne désigne plus le bru oriental mais le bru de l’Est.
- Le Wiktionnaire dispose maintenant de 3 999 langues !
- Autres
- Le Wiktionnaire fait partie des 100 sites qui ont le plus progressé en score de visibilité SEO au deuxième trimestre 2016, d’après une étude de l’éditeur français Yooda. Étonnamment, le Wiktionnaire est le seul projet collaboratif en ligne à figurer dans ce classement.
- Dictionnaire illustré, le Wiktionnaire propose actuellement 26 406 images dans ses entrées, 615 de plus que le mois dernier.
Nouveautés de qualité
[modifier le wikicode]En juillet, l’en-tête de la Wikidémie a été rafraîchie pour y mettre un peu de couleur et surtout ajouter des liens vers deux dynamiques en plein essor !
D’abord créée pour mettre en avant les coopérations au sein de projets ou avec des institutions, cette page accueille dorénavant des discussions sur les collaborations possibles avec les autres projets collaboratifs en ligne. Les premières réflexions amènent déjà de belles idées, telles qu’une recherche facilitée de citations de livres de Wikisource afin de les ajouter comme citations d’attestations dans le Wiktionnaire ! Les Actualités proposeront chaque mois un résumé des discussions ! | |
Coopérations | |
Après trois ans de discussion, la prise de décision votée en décembre a finalement été mise en place. Il s’agit de permettre à tous les contributeurs d’ajouter librement les entrées qu’ils trouvent de qualité à la catégorie Bonnes entrées en français , en l’indiquant sur la page communautaire Wiktionnaire:Évaluation. Un jugement peut être apporté a posteriori, comme c’est habituellement pratiqué sur le Wiktionnaire. Il est possible également de promouvoir collectivement des entrées d’encore meilleure qualité qui iront dans la catégorie Très bonnes entrées en français | |
Évaluation qualitative |
Le Fantastique Groupe du Wiktionnaire
[modifier le wikicode]Il n’y a pas que le Wiktionnaire francophone qui bouge ces temps-ci ! Grâce à la conférence à la Wikimania en juin, des contributeurs de plusieurs pays se sont rencontrés et organisés pour donner naissance le 20 juillet à un espace conjoint sur Meta, le wiki consacré aux discussions entre contributeurs. Il s’agit du Fantastique Groupe du Wiktionnaire !
Ce groupe porte un nom différent selon les langues, mais il est globalement fantastique ! Il se propose de mettre en commun les connaissances et les productions des uns et des autres, mais aussi d’avancer conjointement dans les réflexions sur le futur du projet et d’organiser des LexiSessions, c’est-à-dire des contributions thématiques sur des thèmes qui permettent d’enrichir plusieurs thésaurus en même temps ! Au mois d’août débutera la première LexiSession sur le thème du chat !
Bilan et avancées du groupe au prochain numéro d’Actualités !
Le dico du mois
[modifier le wikicode]- Bruno Fuligni, Tour du monde des terres oubliées françaises, Éditions du Trésor, 2014-2016
Pour être honnête, le dictionnaire n’est pas toujours là où l'on trouve les petits trésors lexicographiques. Et la richesse du Wiktionnaire est de pouvoir les recueillir et les mettre en avant sans avoir à faire de tri comme les autres dictionnaires. Et grâce à GaAs, nous avons découvert ce mois-ci le taafien, vocabulaire des TAAF, ou Terres Australes et Antarctiques Françaises au sein d’un petit lexique extrait d’une de ses lectures : le Tour du monde des terres oubliées françaises de Bruno Fuligni. En ce temps de vacances nous vous proposons donc de visiter ces terres de l’autre bout du monde au travers de leur vocabulaire. Bon voyage ! --— Lyokoï (Parlons ) 29 juillet 2016 à 18:04 (UTC)
Wikiconvention francophone en août !
[modifier le wikicode]Trois conférences sur le Wiktionnaire : | Deux temps forts : |
|
|
En vidéo
[modifier le wikicode]Cette rubrique vous propose de faire une revue des vidéos sur la linguistique et la langue française du mois, n’hésitez pas à ajouter les vidéos et les chaînes que vous trouvez !
- Linguisticae : Ce mois-ci, le deuxième épisode de Lingua Franca sur la langue inventée par Brenna et Andrew Byrd pour le jeu vidéo Far Cry Primal, le Wenja. Dans une autre courte vidéo de vlog, il donne son actualité.
- Langue de Cha’ nous propose ce mois-ci de parler de la théorie des actes de langage de John L. Austin.
- Extrêmement rare sur Youtube, cette semaine est sorti dans le plus grand des silences une vidéo amateure d’un conte raconté en nivernais (un dialecte berrichon) : "Sabiots ronds et sabiots plats". N'hésitez pas à aller les encourager en leur mettant un petit mot !
- Insanus : Une nouvelle page du Wiktionnaire lue sobrement, à propos de l’expression avoir un balai dans le cul.
- La chaîne du Debunker des étoiles se lance avec une première vidéo sur les complotistes et une deuxième vidéo très intéressante sur le vocabulaire des complotistes.
- La chaîne PILOTE la chronique série consacre sa dernière vidéo aux termes clés pour parler de séries télés.
Les mots du mois qui précède
[modifier le wikicode]Les statistiques permettent de connaître les mots modifiés par le plus de monde au cours d’un mois. Voici donc les mots les plus modifiés de juin 2016 ! En exposant, le nombre de participants différents :
- dé à cent faces4 (créé en juin et amélioré par plusieurs personnes successivement)
- Ironman4
- laborer4
- nucléi4 (un pluriel qui a été discuté par trois contributeurs)
- Brexit4
- cunette4
- fiotte4 (principalement des modifications destructrices (du vandalisme))
- hooligan4 (à propos de l’étymologie controversée)
- tuer4
- friquet4 (qui a changé du tout au tout grâce à une petite question sur les moineaux)
- charbon4 (qui était déjà dans le classement le mois précédent)
- maïs4
- dur4
Ce mois-ci, un peu plus de mots, car ils sont en réalité tous à égalité ! Pour chacun de ces mots, quatre contributeurs différents se sont succédé. Pas d’effet d’emballement à noter en juin, donc. Les raisons des modifications sont cependant plus variées que les mois précédents.
Curiosités
[modifier le wikicode]Nombreuses sont les langues où le parler des hommes diffère pour certains mots de celui des femmes. Il s’agit le plus souvent d’une différence lexicale : certains mots sont l’apanage des hommes et d’autres celui des femmes, par exemple des noms pour les animaux dans de nombreuses langues d’Amazonie. Mais il arrive quelque fois que la différence porte sur la prononciation. Ainsi, en tchouktche, langue paléo-sibérienne, le phonème /r/ est prononcé [c] par les femmes. Les mots comprenant ce phonème auront donc deux prononciations différentes en fonction du sexe du locuteur. Ces mêmes femmes n’ont pourtant aucune difficulté à le prononcer /r/ lorsqu’elles rapportent les propos d’un homme !
Anciens numéros
[modifier le wikicode]- 2015 : avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2016 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2017 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2018 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2019 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2020 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2021 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2022 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2023 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2024 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, brouillon du prochain numéro