
Nous vous rappelons dans les 24 heures.
Ou bien nous appeler
au: (514) 461 1666
au: (514) 461 1666
Champs d’expertise
Data Management
- Accès aux fichiers texte en format fixe ou délimité, Excel, SPSS…
- Accès natif aux principales bases de données : Oracle, DB2, Sybase, SAS monoposte ou SAS Server, SQL Server… Accès ODBC aux autres bases de données,
- Accès simultané à plusieurs sources de données,
- Typage automatique des variables, gestion des données manquantes,
- Requêtes SQL sur bases de données
- Ajout, insertion et mise à jour de tables dans une base de données
- Jointure, empilement, juxtaposition de tables, dédoublonnage, tri
- Agrégation, transposition, verticalisation, horizontalisation, agrégation par tableaux croisés
- Bibliothèque complète de fonctions de transformation pour la création de nouvelles variables en mode assisté
- Langage de programmation Python
- Recodages statistiques : mise en classes, regroupements de modalités, croisement de plusieurs variables, binarisation, standardisation, transformation en rangs…
- Gestion des libellés, bibliothèque de formats
- Redressement (méthode RAS)
- Archivage des prédictions (score, régression, segmentation, typologies)
- Archivage d’un modèle prédictif, industrialisation de modèles
Statistiques descriptives
Analyses descriptives
Analyses factorielles
Typologies
Amado
- Tris à plat, histogrammes, tableaux croisés, analyse bivariée
- Galerie Graphique : histogrammes, secteurs, box plots, biplot, graphiques 2D et 3D, courbes de concentration
- Caractérisations automatiques de variables privilégiées (continue ou nominale) par le reste de l'information
- Marquage sémantique : puissante alternative aux arbres de décision
Analyses factorielles
- Analyse en composantes principales (ACP)
- Analyse des correspondances simples (AFC)
- Analyse des correspondances multiples (ACM)
- Variables actives/illustratives, individus actifs/illustratifs
- Aide à l'interprétation des axes factoriels
- Éditeur de graphiques factoriels, mappings, puissant et interactif
Typologies
- Classification ascendante hiérarchique (CAH), directe ou sur facteurs
- Classification mixte : Centres Mobiles + CAH
- Editeur graphique de l'arbre et des indices de niveaux
- Recherche des partitions optimales
- Description automatique des classes des typologies par les variables et/ou individus actifs/illustratifs
- Marquage sémantique des classes de la typologie
- Affectation des individus aux classes de la typologie
- Représentations graphiques de la typologie, ellipses de concentration
Amado
- Module de traitement graphique des données basé sur la complémentarité des techniques d'analyses factorielles et des méthodes graphiques de J. Bertin
Modélisation
Modèles prédictifs
Model Mining
Fonctions de score
- Régressions simples et multiples
- Analyse de variance et de la covariance (ANOVA et ANCOVA)
- Modèle linéaire général
- Régression PLS
- Régression logistique
- Analyse discriminante sur variables quantitatives
- Analyse discriminante sur facteurs principaux
- Analyse discriminante sur variables qualitatives (DISQUAL)
- Réseaux de neurones (perceptron multi-couches)
Model Mining
- Régressions multiples optimales (Furnival et Wilson)
- Discriminantes optimales (Furnival et Wilson),
- Modèles log-linéaires : recherche combinatoire de toutes les interactions et évaluation systématique des modèles avec le critère de Akaike
Fonctions de score
- Echelle des scores définie par l'utilisateur
- Modèle additif simple, intelligible et modifiable par l'expert métier
- Optimal Scoring Pilot : choix visuel et interactif des seuils de score (refus, indécision, acceptation)
- Courbe de gains (lift), courbe de Roc, comparaison de modèles
Segmentation
Discriminantes et régressions par arbres de décision interactifs
Typologies par arbres de décision avec ICT
- Méthodes CART, CHAID, C4.5
- Critères d'arrêt : nombres de niveaux de l'arbre, effectif minimum pour diviser un segment, seuil de spécialisation
- Analyse automatique ou interactive
- Elagage manuel de l'arbre, choix des variables de coupure, réduction ou agrandissement de l'arbre par niveau, regroupement de modalités, valeur-seuil d'une variable continue,
- Vue d'ensemble de l'arbre avec zoom avant/arrière
- Exploration locale d'un segment et comparaison graphique avec l'ensemble de la population
- Caractéristiques générales de l'arbre et matrice de confusion
- Edition d'un rapport général sur l'arbre au format html
- Edition des règles de décision en mode “Select” ou “Update” au format SQL selon le SGBD (Oracle, Access…)
Typologies par arbres de décision avec ICT
- Classification descendante hiérarchique utilisant conjointement les propriétés des analyses factorielles et des arbres de décision
- Résultats et interface graphique analogues aux arbres de décision
Règles d’association
- Recherches d’associations au sein de données transactionnelles (tickets de caisse)
- Recherche des associations de modalités dans un tableau individus x variables
Tableaux Multiples
AFM : Analyse Factorielle Multiple
STATIS
- Exploration des données au delà des analyses de données classiques en exploitant la notion de 'groupes de variables'
- Groupes de variables actives/illustratives, nominales ou continues
- Analyses partielles et analyse globale,
- Editeur graphique puissant et interactif
STATIS
- Méthodes STATIS, STATIS Duale et Triadique de Jaffrenou
- Groupes de variables continues actives
- Editeur graphique puissant et interactif
Text Mining
- Traitement simultané d'une ou plusieurs variables textuelles
- Construction du vocabulaire : mots et segments répétés (suite de mots)
- Modification du vocabulaire avec un lemmatiseur semiautomatique
- Edition des statistiques sur les mots et segments répétés
- Edition des contextes de mots
- Caractérisation de sous populations par un vocabulaire spécifique : mots et phrases caractéristiques
- Création d'un tableau lexical de contingence,
- Analyse des correspondances simples sur tableau lexical et classification
- Création d'une base SPAD comprenant les Variables initiales, les mots et les segments en colonnes
Question
- Création de questionnaires, utilisation de bibliothèques de questions
- Création automatique de masques de saisie avec contrôles de cohérence
- Définition des enchaînements de questions par filtres multicritères
- Définition de plans de tri pour l'automatisation d'enquêtes récurrentes
- Tris à plat et tris croisés complets avec édition automatique de tableaux et graphiques dans Excel, Word, HTML
- Bilans d'image avec la méthode SATIMIX
- Fusion des fichiers et fichiers hiérarchisés
PLS Path Modeling
- Modélisation d’équations structurelles sur variables latentes
- Définition manuelle ou graphique du modèle
- Mode d’estimation interne : structurel, factoriel, centroïde
- Régression classique ou PLS entre variables latentes
- Gestion des données manquantes : moyennes, NIPALS
- Normalisation des données et des poids (au choix)
- Estimation des intervalles de confiance par bootstrap, jacknife
- Validation du modèle global
- Visualisation graphique des résultats des modèles interne et externe