Projets

Press Index met en oeuvre une indexation des contenus vidéos eux-mêmes

Le spécialiste de la veille média et d'e-réputation Press Index a opté pour un nouveau moteur de recherche mettant notamment en oeuvre la transcription des voix avant indexation.

PublicitéPress Index indexe plus de 50 000 sources de presse écrite, radio, télévisuelle, ou web en France, au Royaume-Uni, en Italie et en Espagne ainsi que des flux issus des médias sociaux, y compris You Tube. Il permet ainsi à ses clients de réaliser une veille média et d'e-réputation. Trois millions de documents sont ainsi indexés chaque jour.

Pour améliorer la prise en compte de sources aussi diverses, notamment en terme de type de médias, l'entreprise a mis en place un nouveau moteur d'indexation et de recherche baptisé Pickanews. Celui-ci doit notamment indexer les contenus vidéos sans se contenter des méta-données, souvent insuffisantes. L'objectif est de repérer dans une vidéo éventuellement longue le moment où apparaît le terme recherché.

Pour cela, Pickanews utilise une technologie dite « speech to text », c'est à dire de transcription en texte des voix présentes dans les vidéos. Cette transcription, qui intègre le positionnement temporel, est ensuite indexée de manière traditionnelle. La recherche d'un terme apparaissant dans une vidéo permet ainsi de lancer un lecteur multimédia qui va se positionner au bon moment.

Pickanews se base sur les technologies d'Antidot comme Antidot Information Factory pour l'enrichissement des données, Antidot Finder Suite pour la recherche elle-même et Antidot Collaboration Services pour délivrer des alertes.
Le coût du projet n'a pas été dévoilé.

Partager cet article

Commentaire

Avatar
Envoyer
Ecrire un commentaire...

INFORMATION

Vous devez être connecté à votre compte CIO pour poster un commentaire.

Cliquez ici pour vous connecter
Pas encore inscrit ? s'inscrire

    Publicité

    Abonnez-vous à la newsletter CIO

    Recevez notre newsletter tous les lundis et jeudis

    La question du moment
    En matière de monitoring, avez-vous déployé des outils d’observabilité offrant une meilleure visibilité sur les environnements hybrides ?