Documentation de l’Api de pylexique¶
Référence de l’API pour les classes de pylexique.pylexique.py¶
Module principal de pylexique.
-
class
pylexique.pylexique.
Lexique383
(lexique_path: Optional[str] = None, parser_type: str = 'csv')[source]¶ Bases :
object
C’est la classe qui gère la base de données lexicale. Elle fournit des méthodes pour interagir avec la base de données lexicale et récupérer les éléments lexicaux. Tous les éléments lexicaux sont ensuite stockés dans un Dict ordonné.
- Paramètres
lexique_path – string. Chemin vers le fichier lexique.
parser_type – string. « pandas_csv » et » csv » sont des valeurs valides. La valeur par défaut est « csv ».
- Variables
lexique – Dictionnaire contenant tous les objets LexicalItem indexés par orthographe.
lemmes – Dictionnaire contenant tous les objets LexicalItem indexés par lemme.
anagrams – Dictionnaire contenant tous les objets LexicalItem indexés par forme d’anagramme.
-
static
_parse_csv
(lexique_path: str) → Generator[list, Any, None][source]¶ - Paramètres
lexique_path – string. Chemin vers le fichier lexique.
- Renvoie
générateur de lignes : Contenu de la base de données Lexique38x.
-
_parse_lexique
(lexique_path: str, parser_type: str) → None[source]¶ - Analyse le fichier lexique donné et crée 2 tables de hachage pour stocker les données.
- Paramètres
lexique_path – string. Chemin vers le fichier lexique.
parser_type – string. Peut être “csv” ou “pandas_csv”.
- Renvoie
-
_create_db
(lexicon: Generator[list, Any, None]) → None[source]¶ - Crée 2 tables de hachage remplies avec les entrées de lexique si celui-ci n’existe pas encore.Une table de hachage contient les LexItems, l’autre contient les mêmes données mais regroupées par lemme pour donner accès à toutes les formes lexicales d’un mot.
- Paramètres
lexicon – Iterable. Iterable contenant les entrées du lexique383.
- Renvoie
-
_convert_entries
(row_fields: Union[List[str], List[Union[str, float, int, bool]]]) → Tuple[str, str, str, str, str, str, float, float, float, float, str, int, int, bool, int, int, str, str, int, int, int, int, str, int, str, str, str, str, str, float, int, float, float, str, int][source]¶ - Convertit les entrées de strings en int, bool ou float et génèreune nouvelle liste avec des entrées typées.
- Paramètres
row_fields – Liste d’entrées de colonnes représentant une ligne.
- Renvoie
ConvertedRow : Liste d’entrées de colonnes typées représentant une ligne typée.
-
get_lex
(words: Union[Tuple[str, …], str]) → Dict[str, Union[pylexique.pylexique.LexItem, List[pylexique.pylexique.LexItem]]][source]¶ Récupère les entrées lexicales pour les mots de la séquence
- Paramètres
words – Une chaîne de caractères ou un tuple de plusieurs chaînes de caractères pour obtenir les LexItems de plusieurs mots.
- Renvoie
Dictionnaire de LexItems.
- Raises
TypeError.
-
get_all_forms
(word: str) → List[pylexique.pylexique.LexItem][source]¶ Récupère toutes les formes lexicales d’un mot donné.
- Paramètres
word – String.
- Renvoie
Liste d’objets LexItem partageant le même lemme racine.
- Raises
ValueError.
- Raises
TypeError.
-
get_anagrams
(word: str) → List[pylexique.pylexique.LexItem][source]¶ Récupère toutes les formes lexicales d’un mot donné.
- Paramètres
word – String.
- Renvoie
Liste des objets LexItem qui sont des anagrammes du mot donné.
- Raises
ValueError.
- Raises
TypeError.
-
static
_save_errors
(errors: Union[List[Tuple[List[Union[str, float, int, bool]], List[str]]], List[DefaultDict[str, List[Dict[str, str]]]]], errors_path: str) → None[source]¶ Sauvegarde les clés/valeurs non concordantes dans Lexique383 en se basant sur la coercition de type.
- Paramètres
errors – Liste des erreurs rencontrées lors de l’analyse du Lexique38x
errors_path – Chemin pour sauvegarder les erreurs.
- Renvoie
-
class
pylexique.pylexique.
LexItem
(ortho: str, phon: str, lemme: str, cgram: str, genre: str, nombre: str, freqlemfilms2: float, freqlemlivres: float, freqfilms2: float, freqlivres: float, infover: str, nbhomogr: int, nbhomoph: int, islem: bool, nblettres: int, nbphons: int, cvcv: str, p_cvcv: str, voisorth: int, voisphon: int, puorth: int, puphon: int, syll: str, nbsyll: int, cv_cv: str, orthrenv: str, phonrenv: str, orthosyll: str, cgramortho: str, deflem: float, defobs: int, old20: float, pld20: float, morphoder: str, nbmorph: int)[source]¶ Bases :
pylexique.pylexique.LexEntryTypes
Cette classe définit les éléments lexicaux dans Lexique383.Elle utilise les “slots” pour optimiser l’utilisation de la mémoire.
-
class
pylexique.pylexique.
LexEntryTypes
(ortho: str, phon: str, lemme: str, cgram: str, genre: str, nombre: str, freqlemfilms2: float, freqlemlivres: float, freqfilms2: float, freqlivres: float, infover: str, nbhomogr: int, nbhomoph: int, islem: bool, nblettres: int, nbphons: int, cvcv: str, p_cvcv: str, voisorth: int, voisphon: int, puorth: int, puphon: int, syll: str, nbsyll: int, cv_cv: str, orthrenv: str, phonrenv: str, orthosyll: str, cgramortho: str, deflem: float, defobs: int, old20: float, pld20: float, morphoder: str, nbmorph: int)[source]¶ Bases :
object
Informations sur le type de tous les attributs lexicaux d’un objet LexItem.