Schweizerischer Nationalfonds / Fonds national suisse

FNS: Image du mois janvier 2009: Gestion de l'information

FNS: Image du mois janvier 2009: Gestion de l'information
Alessando Vinciarelli, Maël Guillemot et Jean-Marc Odobez effectuent une démonstration de leur logiciel. ©Alain Herzog/FNS

    Bern (ots) -

    - Indication: Des images peuvent être téléchargées sous:
        http://www.presseportal.ch/fr/pm/100002863 -

    Une solution innovante pour l'archivage de conférence

    Des chercheurs de l'Idiap ont développé, dans le cadre du Pôle de recherche national IM2, une solution innovante pour l'archivage de conférence. La combinaison de plusieurs technologies leur a permis d'obtenir un système fiable et simple d'utilisation. Les scientifiques ont passé le cap de la commercialisation en fondant la société Klewel. Des clients de renom ont déjà fait appel à ses services.

    Conférences professionnelles et réunions de travail sont une mine d'informations pour les entreprises et organisations. Comment les transmettre aux collaborateurs à l'étranger ? Comment les archiver ? Et surtout, comment accéder facilement à l'information recherchée ?

    Dans le cadre du Pôle de recherche national IM2, des scientifiques de l'Institut de Recherche Idiap se sont penchés sur ces questions. La combinaison de technologies issues de plusieurs projets de recherche leur a permis de développer une solution d'archivage et de recherche de contenu innovante, fiable et simple d'utilisation. Afin de la lancer sur le marché, ils ont fondé la société Klewel. Signe de la qualité du produit proposé, Klewel compte au nombre de ses clients le géant de l'organisation de conférences spécialisées ACM, ainsi que Nestlé et l'Unicef. Un beau parcours pour une technologie issue de la recherche fondamentale !

    Lire des images Le concept est simple. Lors d'une présentation, une caméra filme l'orateur et un micro enregistre ses propos sur un simple ordinateur. Parallèlement, le même ordinateur capture automatiquement les diapositives projetées. Ces trois sources d'informations sont alors synchronisées. Une fois la présentation archivée, un logiciel de type moteur de recherche permet d'effectuer une recherche de contenu - par mot clé, comme sur Google - dans les diapositives. Le logiciel « lit » alors les diapositives et trie celles où apparaît le mot clé. L'utilisateur peut ensuite visionner les séquences audio-vidéo correspondantes.

    La particularité du logiciel développé à l'Idiap est sa capacité à « lire » les diapositives, qu'il analyse comme une image - soit un ensemble de pixels indépendants. Il a en effet  appris à reconnaître du texte. Il est donc capable de détecter et de localiser des éléments de texte dans une image, puis d'en extraire et lire  les mots. Il peut ainsi reconnaître ces derniers tant dans un texte, qu'une illustration ou encore un graphique incorporés à la diapositive. La recherche d'information n'en est que plus performante car elle se fait directement dans l'ensemble du contenu, et non pas uniquement sur des mots clés indexés à ce contenu par l'utilisateur.

    Combiner des technologies existantes L'archivage de conférences est une longue tradition à l'Idiap. Cet institut a notamment développé une salle de réunion intelligente (« smart meeting room »). Bien que très performante, celle-ci nécessite un équipement important et complexe, et présente l'inconvénient majeur d'être fixe.

    C'est début 2004 qu'Alessandro Vinciarelli s'intéresse à simplifier la « smart meeting room ». A cet effet, il choisit d'en combiner les éléments clés aux travaux de son collègue Jean-Marc Odobez. Ce dernier travaille alors sur l'analyse et l'extraction d'informations à partir de séquences vidéo - apprendre à un ordinateur à reconnaître un visage, un paysage, ou encore un texte, dans des images.

    Les diapositives, squelette d'une présentation Le principal souci des deux chercheurs est alors de développer un système simple d'utilisation, peu encombrant, fiable et non perturbant pour l'orateur. En réfléchissant au contenu et au déroulement d'une présentation, ils constatent que bien souvent les diapositives sont un squelette où l'information apparaît de manière synthétique et réduite - sous forme de mots clés par exemple. Si une grande partie du message et de ses subtilités se trouvent dans le langage verbal et non-verbal de l'orateur, l'information contenue dans les diapositives suffit à indexer les présentations.

    Un autre aspect important du développement de ce projet est  la création d'une interface  conviviale. C'est Maël Guillemot, ingénieur de recherche enthousiasmé par ce projet, qui s'attache à ce travail essentiel dans l'optique d'une commercialisation du produit. Ses ascendances bretonnes se retrouvent d'ailleurs dans le nom de la société que les chercheurs ont créée : Klewel est une contraction de deux mots bretons signifiant audio-visuel.

    Reconnaissance vocale Les chercheurs de l'Idiap s'intéressent également à intégrer la reconnaissance vocale dans leur système. Si la technologie existe déjà, le principal problème consiste à l'intégrer dans l'environnement particulier d'une salle de conférence: changement fréquent d'orateur (alors que ces systèmes ont souvent besoin d'une période d'apprentissage pour chaque utilisateur), bruit de fond... Ils effectuent donc en ce moment des tests dans le cadre plus facilement contrôlable d'une salle de cours.

    Pour visionner une démonstration du logiciel développé par les chercheurs : http://www.klewel.ch/demo_en.php

    Les textes et les images de ce rapport peuvent être téléchargés sur le site Internet du Fonds national suisse: www.snf.ch > F > Médias > Image du mois

Contact: Institut de recherche Idiap Centre du Parc, Rue Marconi 19 CP592 - CH1920 Martigny

Dr Alessandro Vinciarelli Phone: +41 (0) 27 721 77 24 Fax: +41 (0) 27 721 77 12 e-mail: vincia@idiap.ch

Maël Guillemot Phone: +41 (0) 27 721 77 64 Fax: +41 (0) 27 721 77 12 e-mail:  mael.guillemot@idiap.ch