Wiktionnaire:Questions techniques/décembre 2022
Page mensuelle des questions techniques posées en décembre 2022. Page précédente : novembre 2022 — Page suivante : janvier 2023 — Modifier ce cadre
Participez à la Cérémonie 2022 des outils les plus cools, le vendredi 16 décembre à 17 h UTC
[modifier le wikicode]La quatrième Cérémonie des outils les plus cools de Wikimedia se déroulera en ligne le vendredi 16 décembre 2022 à 17 h UTC.
Cette cérémonie met en valeur les outils logiciels qui ont été sélectionnés par les contributrices et contributeurs des projets Wikimédia. La cérémonie est un moment sympathique visant à remercier les personnes qui développent ces outils, et peut-être découvrir de nouveaux outils !
En savoir plus sur la diffusion en direct et les canaux de discussion.
Merci de votre participation ! — Komla
MediaWiki message delivery 5 décembre 2022 à 18:53 (UTC)
Préparation de 'bot
[modifier le wikicode]Bonjour à tous,
Pour préparer la création automatique des formes conjuguées arabes, qui apparaissent par exemple dans Conjugaison:arabe/إِسْتَصْنَعَ générée automatiquement par {{ar-conjugaison}}
à partir d'un certain nombre de paramètres, j'ai créé quatre modèles :
{{ar-conjugaison/nom d'action/forme}}
qui à partir des mêmes paramètres donne le nom de l'entrée à créer ;{{ar-conjugaison/nom d'action}}
qui à partir des mêmes paramètres donne le contenu de l'entrée à créer ;{{ar-conjugaison/nom d'action/squelette/forme}}
et{{ar-conjugaison/nom d'action/squelette}}
qui font la même chose pour la forme "squelette" du terme, c'est-à-dire sans diacritique.
Comme exemple de création de ces modèles, à partir de Conjugaison:arabe/إِسْتَصْنَعَ on a l'entrée إِسْتِصْنَاعٌ (avec diacritiques) et l'entrée استصناع (sans diacritiques).
S'il faut créer automatiquement ces formes, l'idée est (après que j'aie créé les 228 autres modèles pour les différentes formes conjuguées...) de créer automatiquement ces formes pour chaque appel de {{ar-conjugaison}}
(=pages liées).
- Si la page n'existe pas, il suffit de la créer avec le sous-modèle associé. Si la page n'a pas de section :ar on peut l'insérer directement au bon endroit.
- Si la page existe ça peut être plus compliquer d'insérer une information à partir du découpage de ce que donne le modèle : si la page est une page de "squelette" (sachant qu'un même squelette peut correspondre à plusieurs mots, voire plusieurs racines, voir la structure de بار (bAr)) il faut voir si la racine y a une entrée, puis insérer le mot sous sa racine s'il est absent de la page. Si la page avec diacritiques existe, il n'y a rien à faire (le traitement d'éventuels homographes serait bien trop compliqué).
- Il y a une subtilité supplémentaire sur les "squelettes" qui peuvent donner lieu à deux pages différentes suivant qu'on retient ou pas la version hamzée dans les "variantes orthographiques" (voir بار (bAr) qui est dans ce cas) - mais glissons pour l'instant.
Potentiellement, ~1260 x ~228 = ~300_000 formes de "liens rouges" à créer... Questions, avant que je n'aille plus loin :
- La structure des données est-elle adaptée à un traitement par 'bot?
- Vaut-il mieux lancer une grande campagne de traitement, ou le faire à la petite semaine au fur et à mesure de la création de sous-pages dans Catégorie:Conjugaison en arabe ?
Merci de vos éclairages, Micheletb (discussion) 23 décembre 2022 à 11:01 (UTC)