Wiktionnaire:Actualités/027-June-2017
Wiktionnaire:Actualités is a monthly periodical about French Wiktionary, dictionaries and words, published online since April 2015. Everyone is welcome to contribute to it. You can sign in to be noticed of future issues, read old issues and participate to the draft of the next edition. You can also have a look at Regards sur l’actualité de la Wikimedia. If you have any comments, critics or suggestions, our talk page is open!
Highlights
- In our last edition, we mentioned Guarani, a language spoken in Paraguay, and this month fall an announcement: an album of Malfada is translated in Guarani! This comic strips is translated for the 27th time and for the first time in an indigenous language of the continent where she grew up!
- Occasionally, after an accident involving the brain, the victim wakes up by speaking a language he has not spoken for years or has a different accent, this is what is called the foreign accent syndrome. An article in Apprise_113407 Sciences et avenir explains in a simple way this rare phenomenon. Foreign accent syndrome on Wikipedia also offers an article on this topic.
- The pa'umotu academy is currently Html making the first Pa'umotu-French dictionary. This young academy of Tahiti wants to make its language accessible to the greatest number in order to preserve it and it has to be written for that. It is clear that the Wiktionary is looking forward to this new source on this language to participate in this goal.
- In the June issue of Pour la science, Julien Meyer, a CNRS linguist and bioacoustician at the GIPSA-lab in Grenoble, wrote an article about whistled language.
- Romain Jeanticou, journalist at Télérama, wrote an article on the words that disappear from the French language (Les mots se cachent-ils pour mourir ? (Do words hide to die?)). He describes the approaches of the Robert and Larousse editions and mentions some words that have disappear (essuie-plume, cache-corset). Interestingly, he queries Carine Girac-Marinier from Larousse, who says that there are only 200,000 words in the French language, 63,000 of which are in his dictionary. There are many ways to count the words used, depending on the time, geographic expansion and which speciality is taken into account, but the French-speaking Wiktionary already defines more than two and a half times the proposed figure!
Statistics
From mid-Mai to mid-June (from 05/20/2017 to 06/20/2017)
- French entries increased by 2,057 and quotations increased by 1,668. There are now 353,193 lemmas, 525,047 definitions and 324,118 quotations or examples.
- The three other languages which progressed the most are Northern Sami (+ 5,960 entries), Italian (+ 1,154 entries) and Spanish (+ 966 entries).
- Nine languages were added in the project (here with French names): blaan de Sarangani (+1), ngadha (+1), konjo de la côte (+1), kaulong (+1), port Sandwich (+1), sassak (+1), isnag (+1), wolio (+1) and fidjien de l’Ouest (+1).
- In June 11,892 entries were created for 105 languages!
- New lexicons
- la catégorie Énallages en français has been created.
- verbes de parole en français has been created.
- Last month's words
Statistics pages give some insight of the evolution of the project:
- Pages the most viewed
- Pages modified by the most people (and largely first: embouteillage, modified by 19 people!)
- More improvement
- There are 31,980 illustrations (images and videos) in Wiktionary entries, so 303 were added since last month.
- June 30th, the French Wiktionary offers 273 thesauri for French! Only one new thesaurus this month: concert.
- Qualité du Wiktionnaire : the entries sérendipité and volcanhave been proposed as good content.
- The Wiktionnaire:Questions sur les mots page [Questions on words] received 112 questions, compared to 166 in May, 148 in April, 207 in March, 221 in February and 230 in January. There are less question, nut the ones that are clearly off-topic are now systematically deleted.
Language namesIn the journal Language Documentation & Conservation, Martin Haspelmath, who is participating in the Glottolog.org website that is presented besides, published an article entitled Some principles for language names. The purpose of the article is to describe how to choose the best name for a language. The author relies on several principles which can be adapted to all languages:
Like the names of cities, language names are part of the vocabulary of the language and should not be seen as a foreign word in the middle of a sentence. French, Spanish appear as English words to all English speakers; this is probably not the case with "Xârâcùù".
In connection with the previous and next points, all languages, including minority languages, must have a name in English, without exception.
Pour les cas que les linguistes considèrent comme une seule langue comme le serbe et le croate, l’auteur recommande d’appeler cette langue « serbe-croate ». Même chose avec « hindi-ourdou ». Dans la mesure du possible, un nom de langue ne doit désigner qu’une seule langue. D’après l’auteur c’est faisable pour une région du monde donnée mais il peut y avoir deux langues avec le même nom dans deux régions différentes comme le buru, une langue du Nigeria et une autre langue parlée en Indonésie.
L’auteur remarque que des auteurs proposent de nouveaux noms par rapport aux études précédentes portant sur une langue donnée. Pour qu’un nouveau nom soit adopté, afin d’éviter au maximum les confusions, il faut avoir de bonnes raisons, comme le fait que les locuteurs d’une langue ne se reconnaissent pas dans l’appellation en vigueur, sinon le conservatisme prévaut et l’ancien nom est préféré.
En lien avec le nom précédent, il ne faut pas utiliser des noms de langues qui ne sont pas acceptés par les locuteurs de ces langues. Par exemple same est à préférer à lapon. Les locuteurs d’une langue n’ont pas forcément d’opinion sur le nom donné à leur langue en français mais ils peuvent avoir un avis sur le nom donné dans une grande langue avec laquelle ils sont plus familier (russe, chinois, espagnol, anglais). Dans ce cas, le nom en français doit s’adapter au plus près du nom donné dans cette grande langue.
L’auteur recommande d’utiliser uniquement les 26 lettres de l’alphabet latin utilisé pour écrire l’anglais (a-z) auxquelles les lettres à diacritique du français (à, â, é, è, ê, î, ô, ù, û, ç), de l’espagnol (ñ, á, í, ó, ú), du portugais (ã, õ) et de l’allemand (ä, ö, ü) sont acceptables. De manière général, les lettres compréhensibles par une grande part de lecteur sont acceptables. Les caractères issus de l’API ne sont pas acceptable tout comme les autres lettres avec diacritiques. Les coups de glotte ne devraient pas être utilisés dans les noms de langues car peu de locuteurs savent comment les interpréter et conformément au point 1, ça ne donne pas un air très « français » au mot.
L’auteur donne l’exemple de la lettre v qui ne doit pas être utilisée pour représenter une voyelle, de la lettre x qui ne doit pas être utilisée pour représenter le son Code langue manquant ! que l’on peut noter par « kh ». Pour le cas du français, on peut se poser la question de la lettre « u » utilisée pour écrire le son Code langue manquant ! au lieu de la suite de lettres « ou ».
Certains noms de langues peuvent ne pas être prononçables par des locuteurs francophones car les sons ne sont pas présents dans leur langue. Cela ne doit pas être le cas du nom de la langue en français. Ainsi on écrira kazakh que l’on prononcera Code langue manquant ! alors qu’en kazakh, cette graphie se prononce Code langue manquant ! (on écrira donc « kazakh » en français et pas « kazax »).
Lorsque plusieurs noms sont en circulation, il est préférable de choisir celui utilisé par le linguiste le plus influent sur cette langue car il a plus de chance de faire imposer ce nom. Il faut bien sûr que le nom proposé soit conforme aux points précédents. Certains de ces principes sont déjà suivis par les contributeurs du Wiktionnaire pour déterminer les noms de langues à utiliser, mais leur formation s’est faite par l’expérimentation et la discussion. Note de Lmaltier : le Wiktionnaire a pour politique de privilégier le nom le plus fréquemment utilisé, quand il en existe clairement un. Cet article vient participer à la formation lexicographique avec le regard d’une personne qui s’est retrouvée confrontée aux mêmes problématiques. — une chronique par Pamputt |
Glottolog
Glottolog is a indispensable tool for any people looking for languages. It is an online catalog of languages around the world, listing the documents that describe them. The goal for this research team is to index document precisely but also to offer a structure of languages guided by the most recent studies. Geographical positions of language communities, alternative names used for each languages and phylogenetic trees of languages are references, and all this is often update. This website is not editable directly but the people in charge are very easy to contact and answer to any comments let by readers, whoever they are. Plus, they add regularly new dictionaries, new grammars and correction from all over the globe. All the website is free, without registration and under Creative Commons BY licence, only forcing to mention the name, but allowing to re-use freely and to diffuse it with another compatible licence, such as the one use by Wiktionary or other project aiming a diffusion free knowledge. In the same spirit of open science, all the sources of the website are freely available on GitHub. The only small damper is that Glottolog is a website by scholars for scholar: the interface is only in English and documents are not directly accessible, but only listed, with option to integrate references to a personal bibliography. Despite this spot, the interface is ergonomic, light and not fulled by jargon. The main idea is languoid which regroup languages, dialects and language families, and it is well-documented in the website. A glossary is also provided to help newcomers to explore the database easily. Glottolog is became a reference in only few years, for linguists, lexicographers and for any person interested in languages who can find the specific documentation one was looking for. — a chronicle by Noé |
LexiSession on concert
Impulsé par le Fantastique Groupe d’utilisateurs de Wiktionnaire, les LexiSessions visent à proposer des thèmes mensuels pour dynamiser l’ensemble des Wiktionnaires simultanément. Les thèmes sont suggérés en amont sur Meta et annoncé chaque mois sur la Wikidémie, l’espace principal de discussion.
La LexiSession de juin était sur le vocabulaire du concert et a permis la création du thésaurus du concert qui permet de retrouver le vocabulaire lié à ce type de rassemblement particulier. Beaucoup de mots pourraient encore y être réunis, alors n’hésitez pas à y contribuer à l’avenir !
Pour le mois de juillet, le thème proposé est le vol dans les airs !
VideoCette rubrique vous propose de faire une revue des vidéos sur la linguistique et la langue française du mois, n’hésitez pas à ajouter les vidéos et les chaînes que vous trouvez !
|
Fun factsLes mots oiseaux, chouchou et anchois sont actuellement les mots les plus long recensés en français sur le Wiktionnaire dont aucune lettre ne se prononce comme elle se prononcerait seule. Les digrammes et les règles de prononciation du positionnement du s ainsi que les lettres finales muettes font que beaucoup de mots entrent dans la liste des mots qu’on ne prononce pas comme on les écrit. N’hésitez pas à allonger la liste sur l’annexe des curiosités linguistiques du français ! |
Anciens numéros
- 2015 : avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2016 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2017 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2018 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2019 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2020 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2021 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2022 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2023 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, décembre
- 2024 : janvier, février, mars, avril, mai, juin, juillet, août, septembre, octobre, novembre, brouillon du prochain numéro