French Part-of-speech Tag Set

For tagging the French part of the Text+Berg corpus we have trained the TreeTagger on the French Le Monde treebank (see Abeillé et al. 2003) and have derived the following PoS tag set from this treebank.

Anne Göhring, Martin Volk; 8. November 2010

PoS tag part-of-speech subcategory example
A adjective not specified *  
A_card   cardinal Ces deux voies
A_ind   indefinite de tels itinéraires
A_ord   ordinal ses premiers balbutiements
A_qual   qualificative une politesse exquise
ADV adverb   Aujourd'hui, heureusement, tout va bien .
ADV_excl   exclamative Comme j'aimerais que ... !
ADV_int   interrogative nous savons comment attaquer un tel passage
CL clitic   nous laissons derrière nous
C conjunction not specified *  
C_C   coordination L'air est frais, mais le soleil invite ...
C_S   subordination Quel déluge ce serait si les eaux ...
D determiner not specified *  
D_card   cardinal l'altitude de 1200 mètres
D_def   definite l'attention sur les rochers
D_dem   demonstrative Toute cette ferraille
D_excl   exclamative Quel déluge ce serait
D_ind   indefinite j'aperçois des hommes
D_int   interrogative qui sait de quel tissu
D_part   partitive du café
D_poss   possessive son long trajet
ET foreign material   Vivant amici montium!
I interjection   «Salut, mon vieux », dis-je
N noun not specified *  
N_card   cardinal depuis 1863
N_C   common L'escalade de tels itinéraires
N_P   proper les rochers des Préalpes
P preposition   L'escalade de tels itinéraires
PCT punctuation not specified *  
PCT_S   strong ( Vivent les amis de la montagne ! )
PCT_W   weak ( Vivent les amis de la montagne! )
PREF prefix   plus de 200 pseudo- alpinistes
PRO pronoun   nous laissons derrière nous
PRO_card   cardinal belle récolte de sommets : six d'un coup
PRO_dem   demonstrative tous les bipèdes, même ceux à plumes
PRO_ind   indefinite l'une de ces courses
PRO_int   interrogative Mais que nous reste-t-il
PRO_poss   possessive la nôtre n'est pas épargnée
PRO_rel   relative cette montagne que les alpinistes gravissent
V verb   Nous continuons à grimper en nous élevant

* The PoS tags that are marked with an asterisk are the result of inconsistencies in the training corpus (based on omissions of the PoS subcategory). These tags occur in our corpus but their use is discouraged.

Reference

Anne Abeillé, Lionel Clément and Francois Toussenel (2003). Building a Treebank for French. In: Building and Using Parsed Corpora. Text, Speech and Language Technology. 20(10), p.165-187, Kluwer, Dordrecht.