Synthèse

« Précédent | Synthèse focus: enjeux technologiques focus: enjeux économiques | Suivant »

Publié le 06/11/2009, modifié le 06/11/2009


1 / Contexte : les pratiques actuelles des analyses de mouvements dans les vidéos

Les logiciels d’analyse de vidéos comportementales sont centrés sur quelques applications illustratives touchant les secteurs suivants :

  • Médias
    Des analyseurs vocaux permettent à des sites comme Voxalead et 2424actu.fr de proposer de la fouille de données dans des vidéos, s'appuyant sur un partenariat avec le projet de recherche ;
  • Publicité et du marketing
    Quividi propose de réaliser des analyses d’impact de vidéos publicitaires en suivant la direction du regard des passants ;
  • Sport
    Sportstec ou Kinovea se concentrent sur les analyses de performances des sportifs par la décomposition de leurs mouvements. La danse chorégraphique est également étudiée de façon extensive par l'université d'Ohio ;
  • Sécurité
    Evitech décrit la même tendance dans le domaine de la vidéo-surveillance, limitant dans ce cas la détection de mouvements aux environnements extérieurs complexes, ce qui comprend à la fois l’analyse dans de mauvaises conditions climatiques et l’identification de comportements individuels simples basée sur le repérage de gestes brusques, pour par exemple reconnaître des individus nerveux dans une foule.

En définitive, peu d’outils sont donc disponibles pour l’apprentissage individuel passant par l’analyse comportementale sur des vidéos. Lorsque c’est effectivement le cas, les dispositifs se concentrent sur des restitutions de mesures biomécaniques : optimisation d’une posture pour exécuter un exercice, mesure de vitesse d’un mouvement, tracé d’une trajectoire etc.

2 / Problématique : l'automatisation et les niveaux du discours

Les applications commerciales actuelles s'intéressent peu à l'analyse du discours dans les vidéos

Dans la plupart des cas évoqués précédemment, il s’agit bien d’analyses d’expressions corporelles, mais jamais de celles qui servent de support de signification lors d'une discussion ou d'une performance d’acteur.

L'importance du sens non-verbal

Le langage non-verbal joue alors un rôle de premier plan, passant aussi bien par les mouvements des mains et les expressions du visage que par les intonations vocales. À ces deux formes de signifiant, s'ajoute un troisième et dernier mode d'expression qui passe par les mots choisis et la structure des phrases, autrement dit la partie « intrinsèque » de l’énonciation.

L'analyse de la structure du discours commence tout juste à s'automatiser

Cette partie « intrinsèque » peut être analysée de façon semi-automatique, a posteriori, avec des outils comme lignes de temps. Elle l’est en revanche plus difficilement de façon automatique et a fortiori en temps réel. Il faut pour cela, dans un premier temps employer un logiciel de reconnaissance vocale. Une fois cette opération effectuée, on est ramené à un problème de traitement automatique des langues naturelles avec une limitation technique due aux ressources de calcul disponibles. Le programme Quaero va aussi dans ce sens.

Les indices de contextualisation du discours sont mal maîtrisiés par les automates

Les intonations vocales sont des indices linguistiques et paralinguistiques (ton, débit, intensité) mais aussi non verbaux (rires, souffles, etc.). Tout comme les mouvements des mains et les expressions du visage, elles peuvent être interprétées selon deux points de vue : comme des expressions intentionnelles ou sous-influence des émotions. Pourtant, quelque soit le rôle de la volonté aboutissant à l'énonciation, les informations perçues peuvent être valorisées par l'énonciateur aussi bien que par son auditoire. L'effet est toujours d’adjoindre du sens au propos initial, et d'élargir les interprétations possibles en fournissant un contexte plus riche. Cette partie du discours étant relative au contexte et sujette à interprétation, son automatisation soulève des problématiques complexes.


« Précédent | Synthèse focus: enjeux technologiques focus: enjeux économiques | Suivant »

Publié le 06/11/2009, modifié le 06/11/2009