Cours et ressources SPSS pour l’exploration statistique de données

Extrait du cours ressources SPSS

….
– L’analyse factorielle des correspondances
C’est l’application de l’Analyse en composantes principales à des données de comptages présentées sous forme de tableau croisé. Cette application se fait par le choix d’une métrique convenable qui sera à la base des calculs des coordonnées de chaque point du nuage et de la détermination des facteurs et plans principaux. Un document qui présente parfaitement le sujet peut être consulté à l’adresse suivante:
http://www.mapageweb.umontreal.ca/durandc/Enseignemen
t/MethodesQuantitatives/corresp1.htm
De plus il établit des liens utiles.
Par ailleurs, à l’instar de l’ACP, pour l’AFC aussi, l’article de Dominique Desbois est très clair et insiste particulièrement sur l’utilisation de la méthode dans SPSS, on peut trouver cet article dans les archives de la revue MODULAD à l’adresse :
http://www-rocq.inria.fr/axis/modulad/archives/numero18/desbois-18/uneintroduction.pdf
Il est également intéressant de lire sur l’acp et l’afc dans le chapitre
consacré aux méthodes factorielles de Tufféry :
http://data.mining.free.fr/cours/Factorielle.pdf
VII) Les séries temporelles
Un document consacré au traitement des séries temporelles par SPSS est développé par Dominique Desbois sous le titre « Une introduction à la méthodologie de Box et Jenkins: l’utilisation de modèles ARIMA avec SPSS », paru dans la revue MODULAD Numéro 18, décembre 2007(p.13-36) et peut être téléchargé à partir de l’adresse suivante :
http://www-rocq.inria.fr/axis/modulad/archivesdetail.htm#18
VIII) Les développements
1) le traitement des cartes géographiques
Le traitement des cartes géographiques par SPSS se présente comme une option supplémentaire. Une présentation de ces possibilités se trouve dans le chapitre 12 de [3] .
On s’aperçoit qu’un certains nombre d’outils complémentaires doivent être intégrés à SPSS, notamment GEOSET MANAGER pour une meilleure exploitation des cartes géographiques. Un autre document plus complet sur les Maps de SPSS est [12].
Par ailleurs, la modélisation statistique des données spatiales est pour le moment absente de SPSS. Cette branche qui trouve ses principales applications en géologie (géostatistique), mais aussi en agronomie et dans les problèmes de l’environnement en général, traite de la modélisation de la variabilité spatiale de variables régionalisées (où les coordonnées dans l’espace sont prises en compte dans l’analyse).
Un document qui présente ce sujet est intitulé « modélisation Géostatistique » par David Causeur, il est à l’adresse :
http://www.agrocampusrennes.fr/math/causeu /PDF/PolyGeostatistique.pdf
Par contre pour le traitement informatique de données spatiales on peut avoir des logiciels libres à l’adresse:
http://www.aigeostats.org/index.php?id=freeware
2) Le data mining et le texte minig
Appelé aussi « fouille des données », le data mining s’est développé pour répondre au foisonnement des méga bases de données qui se sont constituées par accumulation de données dans une multitude d’institutions. Le data mining intègre la globalité des méthodes de traitement et d’exploration, comme en témoigne le site de Tufféry, http://data.mining.free.fr/ . Des documents de synthèse qui présentent bien le sujet intitulés Modélisation statistique et apprentissage ; ainsi que Statistique exploratoire multidimensionnelle sont disponibles sur le site
…..

Sommaire: Ressources SPSS

Introduction :
I) Initiation au logiciel
– présentation du logiciel SPSS
– découverte de SPSS, manipulation de données : compute,
recode
– traitement des sorties : Tableaux , Graphiques
II) Premières analyses : statistique descriptive
– l’histogramme
– la boîte à moustaches
– Présentations et résumés
III) Les tests d’hypothèses statistiques
– Etude d’un échantillon : one sample
– comparaison de deux moyennes
– Analyse de la variance : anova – F test
– tableaux croisés : tests du Chi2
IV) Les méthodes statistiques explicatives : essais de
modélisation
– régression simple
– régression multiple
– régression logistique
V) Ecarts aux hypothèses du modèle linéaire :
– asymétrie,
– points aberrants,…
– données non normales (GLM)
VI) L’exploration multivariée
– ACP
– Classification
– Analyse discriminante
– AFC
VII) Les séries temporelles
VIII) Les développements
– Les données géographiques et la commande Maps
– Le Data mining et le texte mining
IX) Conclusions
Bibliographie

……

Si le lien ne fonctionne pas correctement, veuillez nous contacter (mentionner le lien dans votre message)
Cours et ressources SPSS pour l’exploration statistique de données (204 KO) (Cours PDF)
Ressources SPSS

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *