lundi 31 mars 2008

Ciblage démographique pour les statistiques YouTube


Quelle popularité pour quel public? Une question à laquelle chaque utilisateur de YouTube pourra désormais répondre. La plateforme de diffusion et de partage de vidéo vient en effet d’annoncer, sur le blog officiel de Google, l’ajout de nouvelles fonctionnalités à son service de statistique. Dans YouTube Insight, l’utilisateur peut désormais connaître combien de fois une vidéo a été vue en fonction des différentes régions géographiques. Les résultats détaillés s’accompagnent de données statistiques et d’un graphique, tout deux complétés par une carte permettant de visualiser les zones géographiques où la vidéo a été le plus consulté. Elle peut même faire l’objet d’un suivi de popularité, afin d’en étudier l’impact sur de longues durées [...]

[link: AllPackard]

jeudi 27 mars 2008

UNdata, monde de données


L'ONU, a récemment ouvert UNdata, sa base de données. Concrètement, il s'agit d'une base de données de statistiques et de chiffres sur notre planète : l'éducation, le commerce, la population, etc.
Imaginez que vous faites un exposé sur l'évolution de la population de tel ou tel pays de telle à telle année, votre réflexe sera sans doute d'utiliser Google et peut-être la célèbre encyclopédie en ligne, Wikipédia. Or la fiabilité de ces sources est de plus en plus controversée, elles sont souvent inexactes.
Et c'est là qu'intervient la base de données de l'ONU, qui est en fait un moteur de recherche, vous entrez votre requête, vous validez le formulaire et vous avez vos résultats : ils sont fiables. À noter que vous avez juste en dessous les requêtes les plus populaires [...]

[link: Le Site du Zér0]

samedi 8 mars 2008

Journées d'Etudes en Statistique 2008


SOCIÉTÉ FRANCAISE DE STATISTIQUE
JOURNÉES D'ÉTUDE EN STATISTIQUE
C.I.R.M. MARSEILLE 8-12 DECEMBRE 2008


MODELES A VARIABLES LATENTES ET MODELES DE MELANGE

OBJECTIF DES JOURNÉES

Le but des Journées est de se consacrer pendant une semaine à l'approfondissement d'un thème bien défini, dans un cadre favorisant rencontres et discussions.Dans cette optique, le nombre de participants est limité à 45.
Les orientations principales sont :
- acquisition de notions de base - développements les plus importants et les plus récents - perspectives futures et applications.
Ces journées sont ouvertes à un public de statisticiens non nécessairement spécialistes du sujet traité.
Dans ce contexte, les Journées 2008 sont consacrées aux modèles à variables latentes et aux modèles de mélange avec pour objectif de faire le point sur la théorie et les applications par des spécialistes de divers horizons.

Les modèles statistiques à variables latentes postulent l’existence de variables inobservables, causes de phénomènes qui eux peuvent s’observer directement.
Ces modèles sont à l’origine de nombreuses méthodes utilisées dans des domaines très divers de la statistique : mentionnons l’analyse factorielle, l’analyse en classes latentes, les modèles structurels où des blocs de variables sont expliqués chacun par des variables latentes , elles-mêmes reliées entre elles par un graphe de causalité etc. Les modèles de mélange (« finite mixture distributions » ) correspondent au cas particulier d’un modèle où la variable latente est catégorielle à k modalités, où k représente le nombre de composants du mélange. Ces modèles sont essentiels pour obtenir des modèles locaux dans le cas d’hétérogénéité non observée. Les modèles de mélange fournissent également le cadre théorique des méthodes de classification.

Les modèles de mélange conduisent à des problèmes d’identifiabilité, de détection du nombre de composants et d’estimation. La recherche de modèles parcimonieux se base sur des approches de vraisemblance pénalisée. L’estimation par le maximum de vraisemblance a conduit à des développements théoriques et pratiques autour des algorithmes EM, SEM, CEM etc. Dans le domaine des modèles à équations simultanées, l’estimation par le maximum de vraisemblance (LISREL) est concurrencée par la méthode des moindres carrés partiels (PLS) moins exigeante sur les hypothèses.

Depuis 1995, il y a eu plus d’ouvrages publiés sur les modèles de classes latentes et les modèles de mélange que pour toute autre catégorie de modèles statistiques. Ces journées se proposent de faire le point sur les fondements méthodologiques et les développements les plus récents avec cinq spécialistes internationalement reconnus qui présenteront également des applications dans des domaines variés (sciences humaines, finance etc.).

Les exposés font l'objet d'un document distribué aux participants



Ces journées sont réservées aux membres de la SFdS à jour de leur cotisation 2008. Le formulaire d’adhésion est disponible sur le site de la SFdS http://www.sfds.asso.fr

vendredi 7 mars 2008

Les Systèmes Entreprise de STATISTICA 8


Les Systèmes Entreprise de STATISTICA combinent les techniques ultra-performantes d'accès aux données et d'intégration de systèmes, à la puissance analytique incomparable et à la convivialité de STATISTICA. Ces solutions offrent des options puissantes pour requêter, exploiter et fouiller vos bases de données, réaliser vos analyses de façon automatique ou interactive, et répondre produire des réponses analytiques automatiques ou spécifiques aux événements qui peuvent survenir. En outre, la fonctionnalité "groupware" qui est proposée dans les Systèmes Entreprise de STATISTICA permet d'améliorer considérablement la communication interne grâce à une riche sélection d'outils pour analyser, partager, réagir et poster des données de manière automatique [...].

[link:
statsoft]

mercredi 5 mars 2008

Many Eyes; visualisation de données


Un outil très innovant et intéressant à signaler, à la fois réseau social, outil de text mining et de visualisation de données : il s'agit de Many Eyes, développé par IBM (eh oui, il n'y a pas que les start-up du web 2.0 capables d'innovation et Big Blue peut encore nous étonner !).

En simple consultation (choix : Visualizations), il donne à voir déjà d'innombrables représentations de toutes sortes de données, sur tous les sujets possibles : le nombre d'élus aux Etats-Unis, l'utilisation des chemins de fer en Europe, un graphique sur le nombre d'abonnés au téléphone mobile en Amérique du Sud, ou l'analyse, sous forme de nuage de tags, du numéro 50-51 de la revue Esquisse sur la maîtrise de l'information, réalisée par votre serviteur [...].

[link: urfist Info]

mardi 4 mars 2008

Track-n-Graph - Graphique web 2.0


Le paysage du Web 2.0 est plein des sites Web de la communauté, bilans en ligne, et les outils qui sont visés au cheminement spécifique a besoin, comme de la perte de poids, du régime et de l´exercice, développement de bébé, économiser financier, buts de ventes, site Web visite, des comptes d´ami -- vous l´appelez et vous pouvez le trouver probablement [...].

[link: killerstartups]