Utilisateur:Koxinga/ménage
En ce moment, je fais tourner des programmes sur les dumps pour voir les pages suspectes. Il y en a beaucoup ! Ne vous décourager pas de tout de suite, on rattrape quatre ans d'étourderies, de fautes de frappe, de changement de conventions. Les nouvelles erreurs vont arriver beaucoup moins nombreuses !
Si des wikignomes veulent m'aider à les corriger, n'hésitez pas ! (mais enlevez les listes une fois finies) ...
Allez voir sur Wiktionnaire:Maintenance et nettoyage la version maintenue
Résultats
[modifier le wikicode]Langue sans type grammatical
[modifier le wikicode]Une liste des pages ayant des sections de langue ne contenant aucune sous-section grammaticale. C'est embêtant ;o)
- Utilisateur:Koxinga/ménage/pas de type de mot
- 473 lignes sur le dump du 28/11/08
Problèmes de syntaxe des modèles
[modifier le wikicode]Une liste des pages ayant des problèmes de modèles mal tapés. Principalement des fautes de frappe sur les accolades. Très facile à corriger et très utile, n'hésitez pas à en faire quelques pages !
- Utilisateur:Koxinga/ménage/syntaxe modèles
- plus que 38 lignes, environ 70 sur le dump du 28/11/08
Pages comportant deux modèles {{clef de tri}}
[modifier le wikicode]Lorsqu'il y a deux modèles {{clef de tri}}
et qu'elles sont différentes, un message écrit en rouge agressif et incompréhensible saute aux yeux du lecteur. C'est le cas dans certaines de ces pages, c'est vraiment le genre de choses à éviter. Ici je ne liste que les pages ayant deux modèles {{clef de tri}}
avec des arguments différents, il existe aussi une centaine de cles de tri en double mais identique, qui ne sont pas gênantes et pourront être enlevées par un bot qui a du temps.
- Utilisateur:Koxinga/ménage/doubleClesDeTri
- 69 lignes sur le dump du 28/11/08
- Quelle est la clé de tri de "høvel" ?
Sections n'utilisant pas de modèle
[modifier le wikicode]Une liste des sections qui ne sont pas insérées par des modèles comme {{-nom-}}
. C'est un peu gênant pour les catégorisation, c'est surtout gênant si le titre n'est pas standard. 932 pages, mais beaucoup pour la prononciation du japonais, que l'on pourra traiter plus tard.
- Utilisateur:Koxinga/ménage/titre section sans modèle
- 932 lignes sur le dump du 28/11/08
Doublons de titre de niveau 3
[modifier le wikicode]Considérés à l'intérieur d'une même langue.
- Utilisateur:Koxinga/ménage/h3 doublon
- 1326 lignes sur le dump du 28/11/08
Doublons de titre de niveau 4
[modifier le wikicode]Considérés à l'intérieur d'une même section de niveau 3.
- Utilisateur:Koxinga/ménage/h4 doublon
- 144 lignes sur le dump du 28/11/08
Modèles de section non documentés
[modifier le wikicode]Une liste des modèles donnant des titres de sections non documentés dans la page Convention:Structure des pages.
- Utilisateur:Koxinga/ménage/h4 non documentés
- 10 lignes sur le dump du 28/11/08
Incohérences de langues
[modifier le wikicode]Incohérences entre les sections de langue et les argument servant à catégoriser dans les modèles {{-nom-}}
, {{-adj-}}
, etc. Parfois c'est que la section de langue n'est carrément pas présente, ce qui est plus grave. Et encore, je vous fais grâce de tous ceux qui sont dans la catégorie : Catégorie:Wiktionnaire:Codes langue manquants
- Utilisateur:Koxinga/ménage/incohérences de langues
- 748 lignes sur le dump du 28/11/08
Problèmes de hiérarchie
[modifier le wikicode]Je suis un peu moins sûr de celui-là. J'ai considéré que les titres de Header3Formes (voir les listes ci-dessous) pouvaient avoir toutes les sous-sections Header4, sauf "homo" et "paro" qui vont avec "pron". À part "pron", les titres de Headers3Rens n'ont pas à avoir de niveau 4. Ce n'est qu'un premier jet pour mettre ne place le système, n'hésitez pas à me dire si je me trompe.
- Utilisateur:Koxinga/ménage/hiérarchie sections
- 1350 lignes sur le dump du 28/11/08
Modèle trad avec trois arguments non nommés
[modifier le wikicode]Le troisième argument non nommé a joué le rôle de l'argument dif mais ce n'est plus le cas actuellement
- utilisateur:Koxinga/ménage/trad argument caché
- 985 lignes (hébreu ancien) sur le dump du 28/11/08
- 23 lignes (hébreu) sur le dump du 28/11/08
- 12 lignes (arabe) sur le dump du 28/11/08
- 184 lignes (autres langues) sur le dump du 28/11/08
Début d'article suspect
[modifier le wikicode]C'est-à-dire les pages ne commençant pas par un modèle de section de langue,une fois que l'on a enlevé un éventuel modèle {{voir}}
.
- Utilisateur:Koxinga/ménage/début suspect
- 231 lignes sur le dump du 28/11/08, les plus grossières. Cela étant à peu près réglé, je tenterai un parsing plus sévère au prochain dump.
Autres
[modifier le wikicode]- Il y a aussi 27276 pages pour lesquelles l'ordre des langues n'est pas respecté, mais ce sont beaucoup des sinogrammes et c'est moins important donc on verra plus tard ...
Problèmes réglés
[modifier le wikicode]Pour les problème suivants, toutes les pages détectées ont été corrigées. Au moins jusqu'au prochain dump ;o)
Doublons de sections de langues (FAIT)
[modifier le wikicode]- Utilisateur:Koxinga/ménage/sections langues
- 60 lignes sur le dump du 28/11/08
- vidée par Béotien lambda
Modèles de sections avec des paramètres non valides (FAIT)
[modifier le wikicode]- Utilisateur:Koxinga/ménage/section param invalide
- 211 lignes sur le dump du 28/11/08
- Les articles de la liste ont été corrigés. Stéphane8888 discuter 22 décembre 2008 à 17:24 (UTC)
Modèles de sections non valides (FAIT)
[modifier le wikicode]- Utilisateur:Koxinga/ménage/h4 invalide
- 211 lignes sur le dump du 28/11/08
- Les articles de la liste ont été corrigés. [Les modèles
{{-hist-}}
et{{-conjug-}}
semblent corrects.] Stéphane8888 discuter 22 décembre 2008 à 17:13 (UTC)- Ah, c'est ma faute alors, je les met dans la liste du dessus. Bravo pour avoir fait toute la liste ! Koxinga 22 décembre 2008 à 17:21 (UTC)
- Remarque : je ne les connaissais pas non plus. Stéphane8888 discuter 22 décembre 2008 à 17:25 (UTC)
- Ah, c'est ma faute alors, je les met dans la liste du dessus. Bravo pour avoir fait toute la liste ! Koxinga 22 décembre 2008 à 17:21 (UTC)
Méthode
[modifier le wikicode]Listes de référence
[modifier le wikicode]- listeHeader3Rens=["étym","réf","anagr","voir","pron"]
- listeHeader4=["ortho-alt","abrév","syn","ant",'compos','drv','apr','drv-int','exp','dial','trad','hyper','hypo','holo','méro','tropo','homo','paro']
- listeHeader3Formes=['nom','loc-nom','nom-pr','prénom','nom-fam','nom-sciences','nom-verb','verb','loc-verb','verb-pr','adj','loc-adj','adv','loc-adv','adv-pron','aux','nom-ni','nom-nn','nom-npl','nom-nu','flex-adj','flex-adv','flex-art','flex-art-déf','flex-art-indéf','flex-art-part','flex-conj','flex-interj','flex-loc-adj','flex-loc-nom','flex-loc-verb','flex-nom','flex-nom-fam','flex-nom-pr','flex-prép','flex-pronom','flex-pronom-int','flex-pronom-pers','flex-pronom-rel','flex-suf','flex-verb','art-déf','art-indéf','art-part','art','adj-dém','adj-excl','adj-indéf','adj-int','adj-num','adj-pos','pronom-dém','pronom-indéf','pronom-int','pronom-pos','pronom-pers','pronom-pers-comp','pronom-rel','pronom-réfl','pronom','loc-pronom','conj','loc-conj','conj-coord','prép','loc-prép','interj','loc-interj','onoma','prov','loc','loc-post','loc-phr','aff','class','cont','corrélatif','copule','erreur','inf','lettre','part','post','préf','radical','suf','symb','note']
TODO
[modifier le wikicode]- Améliorer l'expression régulière pour les débuts d'article
- Faire des listes de modèles par langue et détecter quand ils sont utilisés dans la mauvaise section de langue
- Faire une liste des pages ayant une section traduction mais pas de modèles trad.
- Faire une liste des langues nécessitant des romanisations
- Faire une liste des pages ayant des traductions dans ces langues sans romanisation