Nous utilisons des cookies pour améliorer votre expérience. Pour nous conformer à la nouvelle directive sur la vie privée, nous devons demander votre consentement à l’utilisation de ces cookies. En savoir plus.
Reconnaissance Multimodale des Flux d'Actions/Langue de Signes Humaine
Univ Europeenne - EAN : 9786202277358
Édition papier
EAN : 9786202277358
Paru le : 1 avr. 2018
64,90 €
61,52 €
Disponible
Pour connaître votre prix et commander, identifiez-vous
Notre engagement qualité
-
Livraison gratuite
en France sans minimum
de commande -
Manquants maintenus
en commande
automatiquement -
Un interlocuteur
unique pour toutes
vos commandes -
Toutes les licences
numériques du marché
au tarif éditeur -
Assistance téléphonique
personalisée sur le
numérique -
Service client
Du Lundi au vendredi
de 9h à 18h
- EAN13 : 9786202277358
- Réf. éditeur : 4489780
- Editeur : Univ Europeenne
- Date Parution : 1 avr. 2018
- Disponibilite : Disponible
- Barème de remise : NS
- Nombre de pages : 168
- Format : H:220 mm L:150 mm E:10 mm
- Poids : 256gr
- Interdit de retour : Retour interdit
- Résumé : Ce travail de recherche cible l'extraction et la reconnaissance des actions humaines depuis des flux continus multimodaux et plus précisément ceux de la langue des signes depuis le capteur Kinect. Les principales contributions sont:(1) La proposition de descripteurs en échelles locales en Contextes Augmentés de Jointures et en Histogrammes de Déplacements, en plus du raffinement des représentations en vecteurs de Fisher sous échelles globales.(2) La proposition de deux approches de Segmentation Temporelle des actions. Une heuristique optimisée à l'extraction temps-réel. L'autre est par apprentissage de caractéristiques et groupement des labels obtenus.(3) La troisième contribution, la principale, concerne la proposition d'un schéma de fusion hybride combinant la concaténation des caractéristiques multimodales avec la pondération des scores de décisions issus de modèles SVM multi-résolutions. La robustesse de l'approche a été prouvée sur les benchmark publiques CGC-2014 et CAD-60. Une base de données baptisée KiFaEx dédiée aux expressions faciales RGB-D depuis Kinect a été aussi proposée.
- Biographie : Technologue en informatique à ISET Sousse, Bassem Seddik est docteur en vision par ordinateur de L'ENIS-Tunisie. Ses travaux de recherche concernent la reconnaissance des actions humaines, des expressions faciales ainsi que la langue des signes. Il est membre du laboratoire LATIS ENISo-Tunisie et se spécialise dans les matières multimédia 2D/3D.