Documentation de l’Api de pylexique

Référence de l’API pour les classes de pylexique.pylexique.py

Module principal de pylexique.

class pylexique.pylexique.Lexique383(lexique_path: Optional[str] = None, parser_type: str = 'csv')[source]

Bases : object

C’est la classe qui gère la base de données lexicale. Elle fournit des méthodes pour interagir avec la base de données lexicale et récupérer les éléments lexicaux. Tous les éléments lexicaux sont ensuite stockés dans un Dict ordonné.

Paramètres
  • lexique_path – string. Chemin vers le fichier lexique.

  • parser_type – string. « pandas_csv  » et  » csv  » sont des valeurs valides. La valeur par défaut est « csv ».

Variables
  • lexique – Dictionnaire contenant tous les objets LexicalItem indexés par orthographe.

  • lemmes – Dictionnaire contenant tous les objets LexicalItem indexés par lemme.

  • anagrams – Dictionnaire contenant tous les objets LexicalItem indexés par forme d’anagramme.

static _parse_csv(lexique_path: str)Generator[list, Any, None][source]
Paramètres

lexique_path – string. Chemin vers le fichier lexique.

Renvoie

générateur de lignes : Contenu de la base de données Lexique38x.

_parse_lexique(lexique_path: str, parser_type: str)None[source]
Analyse le fichier lexique donné et crée 2 tables de hachage pour stocker les données.
Paramètres
  • lexique_path – string. Chemin vers le fichier lexique.

  • parser_type – string. Peut être “csv” ou “pandas_csv”.

Renvoie

_create_db(lexicon: Generator[list, Any, None])None[source]
Crée 2 tables de hachage remplies avec les entrées de lexique si celui-ci n’existe pas encore.
Une table de hachage contient les LexItems, l’autre contient les mêmes données mais regroupées par lemme pour donner accès à toutes les formes lexicales d’un mot.
Paramètres

lexicon – Iterable. Iterable contenant les entrées du lexique383.

Renvoie

_convert_entries(row_fields: Union[List[str], List[Union[str, float, int, bool]]])Tuple[str, str, str, str, str, str, float, float, float, float, str, int, int, bool, int, int, str, str, int, int, int, int, str, int, str, str, str, str, str, float, int, float, float, str, int][source]
Convertit les entrées de strings en int, bool ou float et génère
une nouvelle liste avec des entrées typées.
Paramètres

row_fields – Liste d’entrées de colonnes représentant une ligne.

Renvoie

ConvertedRow : Liste d’entrées de colonnes typées représentant une ligne typée.

get_lex(words: Union[Tuple[str, ], str])Dict[str, Union[pylexique.pylexique.LexItem, List[pylexique.pylexique.LexItem]]][source]

Récupère les entrées lexicales pour les mots de la séquence

Paramètres

words – Une chaîne de caractères ou un tuple de plusieurs chaînes de caractères pour obtenir les LexItems de plusieurs mots.

Renvoie

Dictionnaire de LexItems.

Raises

TypeError.

get_all_forms(word: str)List[pylexique.pylexique.LexItem][source]

Récupère toutes les formes lexicales d’un mot donné.

Paramètres

word – String.

Renvoie

Liste d’objets LexItem partageant le même lemme racine.

Raises

ValueError.

Raises

TypeError.

get_anagrams(word: str)List[pylexique.pylexique.LexItem][source]

Récupère toutes les formes lexicales d’un mot donné.

Paramètres

word – String.

Renvoie

Liste des objets LexItem qui sont des anagrammes du mot donné.

Raises

ValueError.

Raises

TypeError.

static _save_errors(errors: Union[List[Tuple[List[Union[str, float, int, bool]], List[str]]], List[DefaultDict[str, List[Dict[str, str]]]]], errors_path: str)None[source]

Sauvegarde les clés/valeurs non concordantes dans Lexique383 en se basant sur la coercition de type.

Paramètres
  • errors – Liste des erreurs rencontrées lors de l’analyse du Lexique38x

  • errors_path – Chemin pour sauvegarder les erreurs.

Renvoie

class pylexique.pylexique.LexItem(ortho: str, phon: str, lemme: str, cgram: str, genre: str, nombre: str, freqlemfilms2: float, freqlemlivres: float, freqfilms2: float, freqlivres: float, infover: str, nbhomogr: int, nbhomoph: int, islem: bool, nblettres: int, nbphons: int, cvcv: str, p_cvcv: str, voisorth: int, voisphon: int, puorth: int, puphon: int, syll: str, nbsyll: int, cv_cv: str, orthrenv: str, phonrenv: str, orthosyll: str, cgramortho: str, deflem: float, defobs: int, old20: float, pld20: float, morphoder: str, nbmorph: int)[source]

Bases : pylexique.pylexique.LexEntryTypes

Cette classe définit les éléments lexicaux dans Lexique383.
Elle utilise les “slots” pour optimiser l’utilisation de la mémoire.
to_dict()Dict[str, Union[str, float, int, bool]][source]
Convertit le LexItem en un dict contenant ses attributs et leurs valeurs
Renvoie

OrderedDict. Dictionnaire avec correspondance clé/valeur avec les objets LexItem.

Raises

AttributeError.

class pylexique.pylexique.LexEntryTypes(ortho: str, phon: str, lemme: str, cgram: str, genre: str, nombre: str, freqlemfilms2: float, freqlemlivres: float, freqfilms2: float, freqlivres: float, infover: str, nbhomogr: int, nbhomoph: int, islem: bool, nblettres: int, nbphons: int, cvcv: str, p_cvcv: str, voisorth: int, voisphon: int, puorth: int, puphon: int, syll: str, nbsyll: int, cv_cv: str, orthrenv: str, phonrenv: str, orthosyll: str, cgramortho: str, deflem: float, defobs: int, old20: float, pld20: float, morphoder: str, nbmorph: int)[source]

Bases : object

Informations sur le type de tous les attributs lexicaux d’un objet LexItem.

Référence d’API pour les classes dans pylexique.utils.py