Aller au contenu

Wiktionnaire:Actualités/016-juillet-2016

Définition, traduction, prononciation, anagramme et synonyme sur le dictionnaire libre Wiktionnaire.

Wiktionnaire:Actualités est un journal mensuel sur le Wiktionnaire, les dictionnaires et les mots. Il est publié en ligne depuis avril 2015. Son écriture est ouverte à toutes les bonnes volontés. Vous pouvez recevoir un avis lors de la publication des prochains numéros, consulter les anciens numéros et participer au brouillon de la prochaine édition. Vous pouvez lire aussi les Regards sur l’actualité de la Wikimedia. Pour les commentaires, critiques ou suggestions, voir la page de discussion.

Actualités - Numéro 16 - juillet 2016

Le Wiktionnaire dans une base de données ?

[modifier le wikicode]
Ce mois-ci, un petit dossier spécial en trois parties sur le futur du Wiktionnaire, par Noé.

Faire évoluer le Wiktionnaire

[modifier le wikicode]

Durant le mois écoulé, de nombreuses discussions se sont tenues sur l’évolution technologique du Wiktionnaire, localement, grâce à la traduction des discussions déjà tenues sur Wikidata et avec une nouvelle tentative de synthèse. Les discussions portent sur les possibilités de rendre les données contenues dans le Wiktionnaire plus facile à exploiter par des machines, et plus connectées aux données présentes dans les autres projets collaboratifs en ligne.

Le spectre du changement

[modifier le wikicode]

Jusqu’à récemment, ce thème attirait surtout des personnes intéressées par les bases de données et très peu les aventuriers lexicographes contributeurs aux Wiktionnaires (toutes langues confondues). Il est apparu des lignes de tension entre l’exploitation par une machine et le plaisir pris à contribuer, entre les personnes souhaitant transformer et réexploiter les données et les personnes enrichissant les données par leur travail de réflexion et de rédaction. Une évolution technologique du Wiktionnaire, bien que souhaitable dans l’idée, devait se faire dans la concertation et sans entraver les habitudes de contributions des piliers qui portent le projet depuis ses débuts. Une problématique complexe dans un archipel multilingue de projets plus ou moins avancés.

Il semblait également que l’efficacité des contributions puisse pâtir d’un changement abrupt de méthode de saisie qui ne laisserait plus de place à l’existant. La connexion entre le Wiktionnaire et Wikidata s’envisage via un éditeur visuel et il est apparu crucial qu’un développement conjoint soit envisagé. Si le développement d’une exploitation massive des données est retardé, l’accent pourra être mis sur l’enrichissement et l’amélioration des contributions. Deux dynamiques se lient alors : le désir d’être lisible par une machine et le désir d’être lisible par un être humain. Une solution commune est encore en réflexion, et la solution pourrait prendre des années avant de voir le jour.

Mais ça existe déjà !

[modifier le wikicode]

Les Actualités d’août 2015 avaient déjà fait mention des travaux de Nabil Hathout et Franck Sajous sur une exploitation des données du Wiktionnaire portant le nom de GLAWI. Une conférence donnée cette année leur a permis de présenter à nouveau la puissance de leur outil et d’écrire un résumé en huit pages qui met en avant énormément de données positives extraites du Wiktionnaire grâce à leur traitement automatisé. Mentionnons par exemple le tableau 3 qui donne le classement des 20 langues les plus citées dans les paragraphes d’étymologie (latin, grec, anglais, occitan, ancien français,…). Ils indiquent également que 94% de leurs entrées disposent d’une indication de la prononciation, ce qui est largement supérieur à toutes les autres bases de données lexicales en ligne. Enfin, ils insistent sur le fait que leur base est la seule base de données lexicales qui donnent des définitions ! Leur outil est fonctionnel et montre que le passage dans une base de données est possible, pour l’exploitation en tout cas.

À cette même conférence était présent un autre groupe qui développe UniMorph, une exploitation des données de différentes versions linguistiques des Wiktionnaires pour générer des paradigmes morphologiques, c’est-à-dire des listes de flexions, comme les conjugaisons des verbes, des formes déclinées pour les langues à cas et bien d’autres choses. Il s’agit d’une exploitation transversale et un peu moins fine que pour GLAWI, dans la mesure où il s’agit de lecture des données affichées et non de la création d’une base de données. Pour autant, le résultat est intéressant et amène des résultats exploitables malgré les spécificités de présentation propres à chaque Wiktionnaire. Ainsi, les divergences de présentations ne sont pas un obstacle infranchissable à leurs réexploitations.

Dessin d’avion décollant depuis une plateforme volante.
Décollage vers le futur !

Statistiques

[modifier le wikicode]
Début juin à mi-juillet (du 01/06/2016 au 20/07/2016) (Attention deux mises à jour de statistiques sont accumulées)
Autres

Nouveautés de qualité

[modifier le wikicode]

En juillet, l’en-tête de la Wikidémie a été rafraîchie pour y mettre un peu de couleur et surtout ajouter des liens vers deux dynamiques en plein essor !

D’abord créée pour mettre en avant les coopérations au sein de projets ou avec des institutions, cette page accueille dorénavant des discussions sur les collaborations possibles avec les autres projets collaboratifs en ligne. Les premières réflexions amènent déjà de belles idées, telles qu’une recherche facilitée de citations de livres de Wikisource afin de les ajouter comme citations d’attestations dans le Wiktionnaire ! Les Actualités proposeront chaque mois un résumé des discussions !
Coopérations
Après trois ans de discussion, la prise de décision votée en décembre a finalement été mise en place. Il s’agit de permettre à tous les contributeurs d’ajouter librement les entrées qu’ils trouvent de qualité à la catégorie Bonnes entrées en français Bonnes entrées en français, en l’indiquant sur la page communautaire Wiktionnaire:Évaluation. Un jugement peut être apporté a posteriori, comme c’est habituellement pratiqué sur le Wiktionnaire. Il est possible également de promouvoir collectivement des entrées d’encore meilleure qualité qui iront dans la catégorie Très bonnes entrées en français Très bonnes entrées en français
Évaluation qualitative

Le Fantastique Groupe du Wiktionnaire

[modifier le wikicode]
Le groupe en devenir ne dispose pas encore de logo.

Il n’y a pas que le Wiktionnaire francophone qui bouge ces temps-ci ! Grâce à la conférence à la Wikimania en juin, des contributeurs de plusieurs pays se sont rencontrés et organisés pour donner naissance le 20 juillet à un espace conjoint sur Meta, le wiki consacré aux discussions entre contributeurs. Il s’agit du Fantastique Groupe du Wiktionnaire !

Ce groupe porte un nom différent selon les langues, mais il est globalement fantastique ! Il se propose de mettre en commun les connaissances et les productions des uns et des autres, mais aussi d’avancer conjointement dans les réflexions sur le futur du projet et d’organiser des LexiSessions, c’est-à-dire des contributions thématiques sur des thèmes qui permettent d’enrichir plusieurs thésaurus en même temps ! Au mois d’août débutera la première LexiSession sur le thème du chat !

Bilan et avancées du groupe au prochain numéro d’Actualités !

Le dico du mois

[modifier le wikicode]
Le mont des Deux Frères au Kerguelen.
Bruno Fuligni, Tour du monde des terres oubliées françaises, Éditions du Trésor, 2014-2016

Pour être honnête, le dictionnaire n’est pas toujours là où l'on trouve les petits trésors lexicographiques. Et la richesse du Wiktionnaire est de pouvoir les recueillir et les mettre en avant sans avoir à faire de tri comme les autres dictionnaires. Et grâce à GaAs, nous avons découvert ce mois-ci le taafien, vocabulaire des TAAF, ou Terres Australes et Antarctiques Françaises au sein d’un petit lexique extrait d’une de ses lectures : le Tour du monde des terres oubliées françaises de Bruno Fuligni. En ce temps de vacances nous vous proposons donc de visiter ces terres de l’autre bout du monde au travers de leur vocabulaire. Bon voyage ! --— Lyokoï (Parlons Mort de rire) 29 juillet 2016 à 18:04 (UTC)[répondre]

Wikiconvention francophone en août !

[modifier le wikicode]
On rappelle la première WikiConvention francophone à Paris du 19 au 21 août 2016 !
Trois conférences sur le Wiktionnaire : Deux temps forts :

Cette rubrique vous propose de faire une revue des vidéos sur la linguistique et la langue française du mois, n’hésitez pas à ajouter les vidéos et les chaînes que vous trouvez !

Les mots du mois qui précède

[modifier le wikicode]
Photographie d’un petit oiseau.
Un friquet.

Les statistiques permettent de connaître les mots modifiés par le plus de monde au cours d’un mois. Voici donc les mots les plus modifiés de juin 2016 ! En exposant, le nombre de participants différents :

  1. dé à cent faces4 (créé en juin et amélioré par plusieurs personnes successivement)
  2. Ironman4
  3. laborer4
  4. nucléi4 (un pluriel qui a été discuté par trois contributeurs)
  5. Brexit4
  6. cunette4
  7. fiotte4 (principalement des modifications destructrices (du vandalisme))
  8. hooligan4 (à propos de l’étymologie controversée)
  9. tuer4
  10. friquet4 (qui a changé du tout au tout grâce à une petite question sur les moineaux)
  11. charbon4 (qui était déjà dans le classement le mois précédent)
  12. maïs4
  13. dur4

Ce mois-ci, un peu plus de mots, car ils sont en réalité tous à égalité ! Pour chacun de ces mots, quatre contributeurs différents se sont succédé. Pas d’effet d’emballement à noter en juin, donc. Les raisons des modifications sont cependant plus variées que les mois précédents.

Nombreuses sont les langues où le parler des hommes diffère pour certains mots de celui des femmes. Il s’agit le plus souvent d’une différence lexicale : certains mots sont l’apanage des hommes et d’autres celui des femmes, par exemple des noms pour les animaux dans de nombreuses langues d’Amazonie. Mais il arrive quelque fois que la différence porte sur la prononciation. Ainsi, en tchouktche, langue paléo-sibérienne, le phonème /r/ est prononcé [c] par les femmes. Les mots comprenant ce phonème auront donc deux prononciations différentes en fonction du sexe du locuteur. Ces mêmes femmes n’ont pourtant aucune difficulté à le prononcer /r/ lorsqu’elles rapportent les propos d’un homme !

Anciens numéros

[modifier le wikicode]