ClearView

ClearView - Les systèmes d'analyse de la vidéo


Ajouter article au devis

 

ClearView c'est l'ultime solution de test et de mesure dédiée à la vérification de la qualité Audio/Vidéo; visualisation subjective pour l'analyse de la qualité, enregistrement de séquences en vidéo HD/SD non compressées, et lecture de séquences HD/SD et DVI.

La prolifération des moyens d'information digitale ne cessent d'augmenter et d'évoluer. C'est la convergence de trois médias, TV, PC, mobiles qui permettent en trois types d'écrans d'échanger - télévision, informatique (PC), et voix.
Les formats de compression eux aussi ont changé, du mJPEG on est passé au MPEG et puis à l'AVC. La pluralité des formats a augmenté la nécessité d'avoir des outils d'analyse de leur qualité.

Les médias digitaux peuvent être reproduits à toutes les résolutions permettant leur stockage et la définition de leur bande passante selon les critères désirés. D'un certain point, le niveau de résolution constaté après digitalisation d'un signal peut être si bon qu'il est souvent impossible de distinguer, dans la limitation de la perception humaine, la copie de l'original.

La tâche la plus significative faite par les broadcasters est de calculer combien de flux ils vont faire passer dans un débit donné avant que la qualité ne devienne critiquable.

C'est à ce point que l'analyse perceptible doit être réalisée pour juger de la qualité. Il y a deux manières pour réaliser cette analyse :
- Réaliser une analyse en profondeur sur les flux problématiques et difficiles pour juger de la vidéo perçue (celle réellement reçue par le téléspectateur par exemple).
- Réaliser des tests de longue durée (24/48 heures) en recherchant les drops et la dégradation de la qualité A/V

L'analyse « en profondeur » de la qualité A/V est une notion subjective. La manière la plus précise serait de réunir des observateurs humains pour le faire. C'est une méthode onéreuse, et une approche inconsistante car les observateurs devraient être triés pour leur capacité – savoir si leur vue est bonne, qu'ils distinguent toutes les couleurs, etc. Pour enfin collecter leurs jugements sur la qualité de ce qu'ils visionnent et entendent.
A la fin de l'évaluation, les scores sont informatiquement calculés pour chaque test (MOS). Les détails de ces tests subjectifs sont décrits dans la Recommandation ITU-R BT.500-12 – Norme qui décrit la méthodologie d'analyse pour l'évaluation subjective de la qualité des images de télévision.

Un nombre d'algorithmes a été développé pour estimer la qualité reçue d'une manière précise. Les résultats de ces algorithmes sont confrontés aux données subjectives collectées. Le résultat est la mesure perceptible de la qualité subjective.

Les algorithmes sont divisés en trois catégories générales :

  • Celles dites de référence intégrale qui comparent les séquences de références (originales) et les séquences recalculées (reçues)
  • Celles sans analyse d'algorithme de référence pour les séquences recalculées
  • Celles avec des informations spécifiques réduites obtenues du flux de référence et utilisées pour analyser le flux recalculé.

ClearView inclut des outils permettant d'utiliser les mesures limitées d'algorithmes sans référence et ceux dotés d'informations spécifiques réduites, mais il permet surtout l'analyse par flux comparés de référence intégrale. ClearView inclut deux échelles d'annotation :
 
  • DMOS: La différence des scores de l'évaluation entre les séquences de références et les séquences recalculées.
  • JND: Le nombre d'observateurs humains réunis dans leurs observations dont 1 au moins doit considérer la séquence recalculée aussi bonne, pour lui, que la séquence originale. (just noticeable differences).

ClearView est doté de nombreux outils pour effectuer des tests subjectifs, il fournit les algorithmes pour évaluer la qualité visuellement perceptible. Pour commencer nous allons explorer les nombreux outils subjectifs (Page 3) et nous nous déplacerons vers les outils perceptibles.

Subjective Viewing Modes

L'une des manières les plus faciles d'analyser subjectivement deux séquences différentes est de les regarder sur le même écran. Vouloir les visionner à partir de deux écrans différents pose des problèmes de calibrations précises. C'est pour cela que ClearView offre différentes options de visualisation : côte à côte, séparées, en miroir, affichées par moitié. En mode split de l'image complète, une partie de l'image est celle du flux de référence, l'autre partie provient du flux recalculé. ClearView permet de choisir arbitrairement la ligne qui sépare les deux images qui formeront l'image entière.

ClearView peut, bien sûr, envoyer les deux séquences vers deux écrans séparés. Il suffit d'utiliser la commande dédiée à la visualisation multi-écran. Il est même possible de les synchroniser pour visualiser des sorties en 3D.

L'interface utilisateur de ClearView, (GUI page 10), permet de choisir, dans une PlayList ou en définissant soi-même son choix, le mode d'affichage retenu:
 
  • Côte à côte ou (l'un au dessus de l'autre)
  • Séparé dans la même image (Seamless Split )
  • Séparé en miroir (Split Mirror, Papillon)
  • A moins B (avec seuil minimum)
  • Plein écran (chaque séquence vers un écran différent ou un à la fois).


Ces séquences peuvent être analysées visuellement en
 
  • Regardant les trames individuellement
  • Zoomant jusqu'à 16x
  • Scannant et en naviguant dans l'image.
  • Affichant les valeurs de pixels individuellement



Il est souvent plus facile de visualiser les différences entre deux images. ClearView appelle cela A moins B. Une soustraction directe entre deux images va demander à l'écran d'affichage de résoudre des différences d'intensité d'un niveau de 1 pixel. Cela est souvent impossible. Pour cela ClearView inclut dans la différence A-B des seuils de valeurs. Les différences dans les coins de l'images ont tendance à être exclues dans ce mode.



L'interface utilisateur de ClearView inclut un mode de représentation visuelle « Decimated » qui ne sera pas utilisé pour les analyses subjectives. Le mode plein écran utilise les sorties hardware
- Sorties :SDI, HDMI, Composante, Composite, S-Video (Broadcast/YUV)
- Sortie DVI (PC/RGB)

Perceptual & Objective Scoring

Les analyses les plus utilisées sont métriques : PSNR (Peak Signal-to-Noise Ratio) (Rapport signal/bruit ou MSE (Mean Squared Error) (Erreur moyenne de blocs)
Ces deux types de mesures comparent les erreurs entre l'entrée et la sortie. PSNR exprime le résultat comme un ratio des signaux de peak en dB. PSNR et MSE sont reconnus comme de piètres moyens d'analyses, mais ils jouent quand même un rôle important. A l'instar des mesures perceptibles (visuelles) , les analyses PSNR et MSE sont des mesures objectives métriques. Elles mesurent la différence absolue entre deux signaux, ce qui est complètement quantifiable. Ceci est très important dans l'évaluation de la qualité (QA) et de monitoring où la qualité perçues a déjà été mesurée dans un laboratoire, il ne reste plus qu'à définir l'indicateur d'acceptation ou de rejet. La valeur PSNR pour une qualité considérée comme bonne est de 35dB.

Les méthodes de notation traditionnelles de la qualité de la vidéo perçue sont basées sur une approche ascendante qui tente de simuler les fonctions des systèmes visuels (HVS) et auditifs (HAS) du cerveau humain.

Ces méthodes impliquent :

  • Alignement Audio/Vidéo
  • Filtre Low pass (Simulation de l'œil – vidéo seule)
  • Calcul des différences qui affectent l'œil et l'oreille de l'humain
    • Erreur de blocs
    • Erreur de flou
    • Bruit
    • Manque de« Dynamic Range »
    • Perte de hautes fréquences
  • Classification des différentes distorsions.
  • Génération d'une notation pour la qualité perçue .

ClearView utilise l'algorithlme développé par Sarnoff Corporation appelé Picture Quality Ratio (PQR) ratio de la qualité des images et l'introduit dans l'échelle JND (Just Noticeable Differences), juste les différences notables.

L'approche structurelle par similarité (image originale et image traitée) fournit une voie alternative et complémentaire pour aborder le problème de l'évaluation de la qualité vidéo. Celle-ci est basée sur une hypothèse descendante que le contrôle HVS (visuel) est fortement adapté pour extraire des informations structurelles d'une scène, et par conséquent, une mesure des similarités structurelles serait une bonne approximation de la qualité de l'image perçue. L'idée est que l'œil peut reconnaître une forme même si une partie est manquante. Il a été montré qu'une simple mise en œuvre de similarité structurelle est plus performante qu'une mesure métrique, de dernière génération, pour une image perçue. Cependant, la notation SSIM donne de meilleures résultats lorsqu'elle est appliquée à l'échelle appropriée. (ex : la distance œil / écran). La calibration des paramètres, comme la distance de visualisation ou la prise en compte de résolution des images, lance un défi à cette approche.
Afin de rectifier cela, une similarité des structures a été définie (MS-SSIM). En MS-SSIM, l'image est évaluée à différentes résolutions et le résultat est une moyenne de ces étapes calibrées. Il a été démontré que la méthode MS-SSIM est plus performante qu'une simple SSIM et cela, même lorsque les calibrations et les données sont correctes.

ClearView exploite les algorithmes développés par l'université du TEXAS, connus pour être MS-SSIM, et les place sur l'échelle DMOS (Differential Mean Opinion Score). Notation calculée sur la moyenne différentielle des opinions.

Video Clarity est en recherches incessantes de nouveaux algorithmes et de nouveaux outils dans le but d'améliorer continuellement l'ensemble de ses produits ClearView et fournir des solutions et outils de contrôle qualité uniques pour les équipementiers, les fabricants, les fournisseurs de contenus et les Broadcasters.

Complete Solution for A/V Analysis

Les équipementiers et fabricants veulent accélérer leurs développements sur les algorithmes de calculs et de process. Ils voudront effectuer des comparaisons, des mesures quantitatives et subjectives et enfin obtenir des rapports détaillés de tout cela.

ClearView
  • Importe la plupart des formats de fichiers compressés et non-compressés (Voir la liste page 11)
  • Enregistre des flux vidéo « live » comme HD/SD/3G SDI, HDMI, Composante, Composite, S-Vidéo . Les fichiers sont enregistrés en YUV 4:2:2 ou RGB 4:4:4 (peu importe leur source : séquences importées sous forme de fichiers ou capturées à partir d'un flux vidéo. Ils serviront pour les traitements à venir)
  • Aligne 2 séquences spatialement et temporellement
  • Compare les 2 séquences
    • Analyse subjective en utilisant tous les modes d'affichages décrits plus haut
    • Note la qualité vidéo via une analyse perceptible en utilisant les échelles d'analyses DMOS ou JND
    • Mesure objectivement le PSNR (Rapport signal sur bruit)

Les notations d'analyses perceptibles et les mesures objectives peuvent être sauvegardées dans des fichiers de log qui contiennent toutes les informations des séquences. Ces fichiers log peuvent être importés dans Excel pour être comparés avec d'autres données. Ils peuvent être renvoyés dans l'interface utilisateur du ClearView (voir page 10) pour restaurer une session de tests.
Les fabricants d'équipements voudront certainement comparer les sorties de leurs processeurs AV
avec des tests précédemment enregistrés, et générer des tests liés à la procédure acceptation / rejet.
C'est le meilleur moyen utilisé pour vérifier qu'un changement dans une chaîne de calculs n'a pas affecté la qualité de la vidéo.




Fichiers de référence et séquences calculées


Ils voudront certainement envoyer une séquence de référence dans leur unité de processing AV, puis la décoderont pour la comparer avec celle de référence, initiale. Ceci est normalement effectué pour noter et juger la qualité vidéo post-processing. ClearView fournit de nombreuses mires de tests aux standards EBU et VQEG utilisables en séquences de référence.



Les fournisseurs de contenus veulent vérifier la qualité des vidéo après compression et packaging (audio, vidéo, données combinées dans un transport ou program stream). Pour ce faire, ils voudront comparer les sorties en fin de process (Compression/décompression) à celles du contenu original ?
 
ClearView
 
  •  Lit des séquences via les sorties HD/SD/3G SDI, HDMI, Componsantes vers l'unité de processing
  •  Enregistre simultanément du décodeur en HD/SD/3G SDI, HDMI, Composante
  •  Analyse l'alignement spatial & temporel
  •  Juge la qualité en utilisant les notations DMOS et JND
  •  Ecrit un rapport en fichier Log des résultats d'analyse. Rapport compatible Excel qui pourra être ouvert dans ClearView pour restaurer une session.


Ils voudront vérifier que le fichier après compression ait gardé sa qualité AV sur toute la durée entière et que la synchro labiale ait été maintenue. Pour, effectuer des tests dans le temps VidéoClarity a créé RTM pour (Real-Time Monitor) outil de monitoring et d'analyse longue durée.



RTM – Un système complet de référence pour le monitoring et l'analyse de la qualité AV.
 
  • Mesure la qualité audio et vidéo
  • Mesure le délai audio/video (lip-sync) , syncro labiale
  • Mesure l'intégrité des lignes de données VANC
  • Génère des alarmes et enregistre les séquences AV concernées si l'une ou plusieurs des conditions ci-dessus a chuté en dessous des seuils limites fixés de dégradation.



Comparaison entre les fichiers de référence et les fichiers processés

Les Broadcasters veulent déterminer les paramètres d'émission optimaux pour insérer le maximum de canaux (à une qualité données) dans la bande passante disponible. Ils peuvent utiliser ClearView pour lire une séquence de référence et enregistrer le retour simultanément (comme expliqué plus haut), il peuvent aussi utiliser RTM pour enregistrer « on-air » en mode de test longue durée.

RTM
 
  • Lit les séquences de référence et celles post processing via les entrées HD/SD SDI
  • Mesure la qualité audio et vidéo
  • Mesure le délai audio/video (lip-sync) , syncro labiale
  • Mesure l'intégrité des lignes de données VANC
  • Edite continuellement un rapport sur la qualité AV, sur la mesure de décalage AV, sur l'intégrité des lignes de données VANC dans un fichier de log (compatibilité avec Excel)
  • En plus, RTM peut être configuré pour générer des alarmes et enregistrer les séquences qui seraient en dessous de seuils prédéterminés comme acceptables.
  • Avec RTM, les Broadcasters peuvent déterminer des spécificités pour leurs contenus en ajustant leurs paramètres afin d'optimiser la qualité dans la durée.





ClearView

  • Enregistre 2 entrées live et importe des fichiers compressés et non-compressés, Toutes les entrées sont enregistrées en fichiers YUV 4:2:2 ou RGB 4:4:4
  • Alignement spatial et temporel
  • Mesures perceptibles avec utilisation des échelles de notation JND, DMOS, et PSNR
  • Facilite les tests subjectifs par l'analyse visuelle et auditive des séquences de différentes manières
  • Séquences de test EBU et VQEG nombreuses incluses

RTM

  • Mesure la qualité audio et vidéo
  • Mesure le décalage audio/video (lip-sync)
  • Mesure les lignes de données VANC
  • Génère des alarmes et enregistre les séquences dont l'analyse est sous un seuil de tolérance prédéfini


ClearView Operations

Contrôles

Interface utilisateur ClearView
Commandes Play List
Chargement List
Commandes fichiers Batch
  • Interface CLI

Opérations

Lecture de 2 séquences
Enregistre 2 séquences
Menus déroulants
  • Imports
  • décompresse
  • Modes de visu
  • Côte à côte
  • Un au dessous de l'autre
  • Miroir
  • A-B
  • A-B avec seuils
  • Trames seules
  • Zoom et Pan
  • Valeurs des pixels
Analyse Visuelle virtuelle
  • DMOS
  • JND
  • PSNR
  • Spatiale (Activité)
  • Temporelle (Changement)
  • Alignements

Analyse Off-line

Les fichiers log contiennent les notations objectives/perceptives et les infos sur les réglages du test

  • Import dans Excel
  • Chargeable dans ClearView pour restauration de session

Analyse visuelle virtuelle (ou perceptible)
Sarnoff JND – Cette évaluation métrique complexe est reconnue fiable à 92% en comparaison à la notation subjective
Utilisation de l'échelle de notation DMOS pour des tests MS-SSIM de l'université du Texas – Notation visuelle reconnue fiable à 94%

Analyses métriques objectives
PSNR- Rapport signal sur bruit
FREQ- Mesure des fréquences audio

Analyses sans (ou presque sans) références
Spatial- Calcul de la valeur d'activité dans l'image. Une valeur forte indique beaucoup de changements dans l'image
Temporel- Calcul des changements entre images successives. La valeur zéro indique une image gelée.

Analyses subjectives par visu réelle
Analyse réelle visuelle grâce à différents modes d'affichage comparatifs ou individuels (Trame/image, Zooms, Pan, outils de valeurs des pixels, etc...)




Serveur A/V Non-compressé

Double lecture 4:2:2, YUV, jusqu'à 1080P/60Hz /50Hz
Lecture simple 4:4:4, RGB, jusqu'à 1080P/120Hz /100Hz

Notation de la qualité A/V

Alignement Spatial/Temporel
Analyse Qualité des images par notation (JND, DMOS)

Tests de longue durée avec alertes Acceptation et Rejet

Alertes configurable
Fichiers de rapports de log avec qualité A/V, Syncro labiale A/V, intégrité des lignes de données VANC

Rapports écrits de tests subjectifs

Play List
Commandes Batch
Chargement de Listes