Extraction de connaissances spatiales à partir d'émissions d'athlétisme pour l'estimation monoculaire de la pose humaine en 3D

Rapports scientifiques volume 13, Numéro d'article : 14031 (2023) Citer cet article

Détails des métriques

La collecte de grands ensembles de données pour des enquêtes sur la locomotion humaine est un processus coûteux et laborieux. Les méthodes d'estimation de la pose humaine en 3D dans la nature deviennent de plus en plus précises et pourraient bientôt suffire à faciliter la collecte d'ensembles de données pour l'analyse de la cinématique de fonctionnement à partir de données de diffusion télévisée. Dans le domaine de la recherche biomécanique, les petites différences dans les angles 3D jouent un rôle important. Plus précisément, les marges d’erreur du processus de collecte de données doivent être inférieures à la variation attendue entre athlètes. Dans ce travail, nous proposons une méthode pour déduire la géométrie globale des enregistrements de stades d'athlétisme à l'aide de démarcations de voies. En projetant des squelettes 3D estimés dans l'image à l'aide de cette géométrie globale, nous montrons que les méthodes actuelles d'estimation de la pose humaine en 3D ne sont pas (encore) suffisamment précises pour être utilisées dans la recherche cinématique.

L’application de l’estimation de la pose humaine (HPE) dans le sport gagne régulièrement en popularité. Une étude récente montre une multitude d'applications possibles1. Celles-ci vont de l’estimation des paramètres typiques de la démarche2, à la détection des « mauvaises poses »3 jusqu’à l’entraînement aux arts martiaux4. Bien qu'il existe un certain nombre de publications démontrant des performances remarquables dans la reconnaissance d'actions spécifiques, peu de recherches ont été menées sur l'application de ces méthodes d'acquisition de données à la recherche en sciences du sport. Par exemple, en utilisant de grandes quantités de données cinématiques provenant de coureurs de classe mondiale, nous pourrions travailler à répondre à des questions telles que : Quelles sont les caractéristiques d’une bonne forme de course ? Cette question apparemment fondamentale n’a pas encore reçu de réponse complète5, car des recherches supplémentaires sur les schémas de mouvements de l’ensemble du corps lors de la course sont nécessaires.

Il existe une grande diversité dans la locomotion humaine et il n’existe pas une seule forme ou technique de course correcte5,6. Néanmoins, il a été démontré que la cinématique de la course représente jusqu'à 94 % de la variance de l'économie de course7 pour les athlètes novices. Jusqu'à présent, il n'existe pas de modèle unifié pour déterminer l'efficacité de la course et évaluer la cinématique de la course. La littérature traite plutôt d’aspects isolés de la forme de course, comme la vitesse du talon ou l’angle d’extension de la cuisse8. Pour faire des déclarations plus généralisées et construire un modèle de course plus holistique, nous aurions besoin de grands ensembles de données très détaillés sur la cinématique de course. La configuration conventionnelle du laboratoire cinématique est très coûteuse et prend beaucoup de temps9. Il utilise des marqueurs attachés à l’athlète et des caméras à très haut débit et de haute précision. Bien qu'il existe des approches pour valider les systèmes de vision en laboratoire10, les limites du laboratoire demeurent : il est difficile de recruter des athlètes de classe mondiale pour se soumettre à ces investigations et pratiquement impossible de collecter un ensemble de données suffisamment important pour tenir compte de toute la variabilité possible entre les athlètes.

D’un autre côté, une approche purement basée sur la vision pour collecter les mêmes données pourrait constituer une alternative peu coûteuse et hautement évolutive. Une telle approche devrait cependant être validée par rapport à des mesures de référence. S’il est suffisamment fiable, il permettrait d’exploiter les enregistrements existants d’émissions télévisées pour collecter des ensembles de données à grande échelle. En raison de l’historique dense des enregistrements, il serait possible d’effectuer des études à long terme sur des athlètes individuels pour suivre leurs changements cinématiques au fil du temps ainsi qu’au cours d’une seule course. Il deviendra possible d'étudier des facteurs tels que la fatigue, associés au rythme et à la stratégie de course, qui ne sont pas accessibles en laboratoire.

Afin de valider et d'utiliser l'estimation de la pose humaine en 3D dans la nature comme outil de recherche pour la science du sport, il existe heureusement un large sous-ensemble d'événements de course à pied qui devrait permettre de dériver des informations supplémentaires à partir d'images existantes : les courses dans un stade d'athlétisme. Les démarcations des voies, ainsi que les marqueurs supplémentaires du bloc de départ et de la ligne d'arrivée, sont standardisés entre les sites. Grâce à ces repères, il est possible de trianguler la caméra dans le stade et ainsi de reconstituer la scène intégrale en 3D.