ClearView - Les systèmes d'analyse de la vidéo
ClearView c'est l'ultime solution de
test et de mesure dédiée à la vérification de la qualité
Audio/Vidéo; visualisation subjective pour l'analyse de la
qualité, enregistrement de séquences en vidéo HD/SD non
compressées, et lecture de séquences HD/SD et DVI.
La prolifération des moyens
d'information digitale ne cessent d'augmenter et d'évoluer. C'est la
convergence de trois médias, TV, PC, mobiles qui permettent en trois
types d'écrans d'échanger - télévision, informatique (PC), et
voix.
Les formats de compression eux aussi
ont changé, du mJPEG on est passé au MPEG et puis à l'AVC. La
pluralité des formats a augmenté la nécessité d'avoir des outils
d'analyse de leur qualité.
Les médias digitaux peuvent être
reproduits à toutes les résolutions permettant leur stockage et la
définition de leur bande passante selon les critères désirés.
D'un certain point, le niveau de résolution constaté après
digitalisation d'un signal peut être si bon qu'il est souvent
impossible de distinguer, dans la limitation de la perception
humaine, la copie de l'original.
La tâche la plus significative faite
par les broadcasters est de calculer combien de flux ils vont faire
passer dans un débit donné avant que la qualité ne devienne
critiquable.
C'est à ce point
que l'analyse perceptible doit être réalisée pour juger de la
qualité. Il y a deux manières pour réaliser cette analyse :
- Réaliser une
analyse en profondeur sur les flux problématiques et difficiles pour
juger de la vidéo perçue (celle réellement reçue par le
téléspectateur par exemple).
- Réaliser des
tests de longue durée (24/48 heures) en recherchant les drops et la
dégradation de la qualité A/V
L'analyse « en
profondeur » de la qualité A/V est une notion subjective. La
manière la plus précise serait de réunir des observateurs humains
pour le faire. C'est une méthode onéreuse, et une approche
inconsistante car les observateurs devraient être triés pour leur
capacité – savoir si leur vue est bonne, qu'ils distinguent toutes
les couleurs, etc. Pour enfin collecter leurs jugements sur la
qualité de ce qu'ils visionnent et entendent.
A la fin de
l'évaluation, les scores sont informatiquement calculés pour chaque
test (MOS). Les détails de ces tests subjectifs sont décrits dans
la Recommandation ITU-R BT.500-12 – Norme qui décrit la
méthodologie d'analyse pour l'évaluation subjective de la qualité
des images de télévision.
Un nombre
d'algorithmes a été développé pour estimer la qualité reçue
d'une manière précise. Les résultats de ces algorithmes sont
confrontés aux données subjectives collectées. Le résultat est la
mesure perceptible de la qualité subjective.
Les algorithmes
sont divisés en trois catégories générales :
-
Celles dites de
référence intégrale qui comparent les séquences de références
(originales) et les séquences recalculées (reçues)
-
Celles sans
analyse d'algorithme de référence pour les séquences recalculées
-
Celles avec des
informations spécifiques réduites obtenues du flux de référence
et utilisées pour analyser le flux recalculé.
ClearView inclut
des outils permettant d'utiliser les mesures limitées d'algorithmes
sans référence et ceux dotés d'informations spécifiques
réduites, mais il permet surtout l'analyse par flux comparés de
référence intégrale. ClearView inclut deux échelles
d'annotation :
-
DMOS: La
différence des scores de l'évaluation entre les séquences de
références et les séquences recalculées.
- JND: Le
nombre d'observateurs humains réunis dans leurs observations dont 1
au moins doit considérer la séquence recalculée aussi bonne, pour
lui, que la séquence originale. (just noticeable differences).
ClearView est doté
de nombreux outils pour effectuer des tests subjectifs, il fournit
les algorithmes pour évaluer la qualité visuellement perceptible.
Pour commencer nous allons explorer les nombreux outils subjectifs
(Page 3) et nous nous déplacerons vers les outils perceptibles.
Subjective Viewing Modes
L'une des manières
les plus faciles d'analyser subjectivement deux séquences
différentes est de les regarder sur le même écran. Vouloir les
visionner à partir de deux écrans différents pose des problèmes
de calibrations précises. C'est pour cela que ClearView offre
différentes options de visualisation : côte à côte,
séparées, en miroir, affichées par moitié. En mode split de
l'image complète, une partie de l'image est celle du flux de
référence, l'autre partie provient du flux recalculé. ClearView
permet de choisir arbitrairement la ligne qui sépare les deux images
qui formeront l'image entière.
ClearView peut,
bien sûr, envoyer les deux séquences vers deux écrans séparés.
Il suffit d'utiliser la commande dédiée à la visualisation
multi-écran. Il est même possible de les synchroniser pour
visualiser des sorties en 3D.
L'interface
utilisateur de ClearView, (GUI page 10), permet de choisir, dans une
PlayList ou en définissant soi-même son choix, le mode d'affichage
retenu:
- Côte à côte
ou (l'un au dessus de l'autre)
-
Séparé dans la
même image (Seamless Split )
-
Séparé en
miroir (Split Mirror, Papillon)
- A moins B (avec
seuil minimum)
-
Plein écran
(chaque séquence vers un écran différent ou un à la fois).
Ces séquences
peuvent être analysées visuellement en
-
Regardant les
trames individuellement
-
Zoomant jusqu'à
16x
-
Scannant et en
naviguant dans l'image.
-
Affichant les
valeurs de pixels individuellement
Il
est souvent plus facile de visualiser les différences entre deux
images. ClearView appelle cela A moins B. Une soustraction directe
entre deux images va demander à l'écran d'affichage de résoudre
des différences d'intensité d'un niveau de 1 pixel. Cela est
souvent impossible. Pour cela ClearView inclut dans la différence
A-B des seuils de valeurs. Les différences dans les coins de
l'images ont tendance à être exclues dans ce mode.
L'interface
utilisateur de ClearView inclut un mode de représentation visuelle
« Decimated » qui ne sera pas utilisé pour les analyses
subjectives. Le mode plein écran utilise les sorties hardware
-
Sorties :SDI, HDMI, Composante, Composite, S-Video (Broadcast/YUV)
-
Sortie DVI (PC/RGB)
Perceptual & Objective Scoring
Les analyses les
plus utilisées sont métriques : PSNR (Peak Signal-to-Noise
Ratio) (Rapport signal/bruit ou MSE (Mean Squared Error) (Erreur
moyenne de blocs)
Ces deux types de
mesures comparent les erreurs entre l'entrée et la sortie. PSNR
exprime le résultat comme un ratio des signaux de peak en dB. PSNR
et MSE sont reconnus comme de piètres moyens d'analyses, mais ils
jouent quand même un rôle important. A l'instar des mesures
perceptibles (visuelles) , les analyses PSNR et MSE sont des mesures
objectives métriques. Elles mesurent la différence absolue entre
deux signaux, ce qui est complètement quantifiable. Ceci est très
important dans l'évaluation de la qualité (QA) et de monitoring où
la qualité perçues a déjà été mesurée dans un laboratoire, il
ne reste plus qu'à définir l'indicateur d'acceptation ou de rejet.
La valeur PSNR pour une qualité considérée comme bonne est de
35dB.
Les méthodes de
notation traditionnelles de la qualité de la vidéo perçue sont
basées sur une approche ascendante qui tente de simuler les
fonctions des systèmes visuels (HVS) et auditifs (HAS) du cerveau
humain.
Ces méthodes
impliquent :
- Alignement Audio/Vidéo
- Filtre Low pass (Simulation de l'œil – vidéo seule)
- Calcul des différences qui affectent l'œil et l'oreille de l'humain
- Erreur de blocs
- Erreur de flou
- Bruit
- Manque de« Dynamic Range »
- Perte de hautes fréquences
- Classification des différentes distorsions.
- Génération d'une notation pour la qualité perçue .
ClearView utilise
l'algorithlme développé par Sarnoff Corporation appelé Picture
Quality Ratio (PQR) ratio de la qualité des images et l'introduit
dans l'échelle JND (Just Noticeable Differences), juste les
différences notables.
L'approche
structurelle par similarité (image originale et image traitée)
fournit une voie alternative et complémentaire pour aborder le
problème de l'évaluation de la qualité vidéo. Celle-ci est basée
sur une hypothèse descendante que le contrôle HVS (visuel) est
fortement adapté pour extraire des informations structurelles d'une
scène, et par conséquent, une mesure des similarités structurelles
serait une bonne approximation de la qualité de l'image perçue.
L'idée est que l'œil peut reconnaître une forme même si une
partie est manquante. Il a été montré qu'une simple mise en œuvre
de similarité structurelle est plus performante qu'une mesure
métrique, de dernière génération, pour une image perçue.
Cependant, la notation SSIM donne de meilleures résultats
lorsqu'elle est appliquée à l'échelle appropriée. (ex : la
distance œil / écran). La calibration des paramètres, comme la
distance de visualisation ou la prise en compte de résolution des
images, lance un défi à cette approche.
Afin de rectifier
cela, une similarité des structures a été définie (MS-SSIM). En
MS-SSIM, l'image est évaluée à différentes résolutions et le
résultat est une moyenne de ces étapes calibrées. Il a été
démontré que la méthode MS-SSIM est plus performante qu'une simple
SSIM et cela, même lorsque les calibrations et les données sont
correctes.
ClearView exploite
les algorithmes développés par l'université du TEXAS, connus pour
être MS-SSIM, et les place sur l'échelle DMOS (Differential Mean
Opinion Score). Notation calculée sur la moyenne différentielle
des opinions.
Video Clarity est
en recherches incessantes de nouveaux algorithmes et de nouveaux
outils dans le but d'améliorer continuellement l'ensemble de ses
produits ClearView et fournir des solutions et outils de contrôle
qualité uniques pour les équipementiers, les fabricants, les
fournisseurs de contenus et les Broadcasters.
Complete Solution for A/V Analysis
Les
équipementiers et fabricants veulent accélérer leurs
développements sur les algorithmes de calculs et de process. Ils
voudront effectuer des comparaisons, des mesures quantitatives et
subjectives et enfin obtenir des rapports détaillés de tout cela.
ClearView-
Importe la
plupart des formats de fichiers compressés et non-compressés (Voir
la liste page 11)
-
Enregistre des
flux vidéo « live » comme HD/SD/3G SDI, HDMI,
Composante, Composite, S-Vidéo . Les fichiers sont enregistrés en
YUV 4:2:2 ou RGB 4:4:4 (peu importe leur source : séquences
importées sous forme de fichiers ou capturées à partir d'un flux
vidéo. Ils serviront pour les traitements à venir)
-
Aligne 2
séquences spatialement et temporellement
- Compare les 2
séquences
-
- Analyse
subjective en utilisant tous les modes d'affichages décrits plus
haut
-
Note la qualité
vidéo via une analyse perceptible en utilisant les échelles
d'analyses DMOS ou JND
-
Mesure
objectivement le PSNR (Rapport signal sur bruit)
Les notations
d'analyses perceptibles et les mesures objectives peuvent être
sauvegardées dans des fichiers de log qui contiennent toutes les
informations des séquences. Ces fichiers log peuvent être importés
dans Excel pour être comparés avec d'autres données. Ils peuvent
être renvoyés dans l'interface utilisateur du ClearView (voir page
10) pour restaurer une session de tests.
Les fabricants
d'équipements voudront certainement comparer les sorties de leurs
processeurs AV
avec des tests
précédemment enregistrés, et générer des tests liés à la
procédure acceptation / rejet.
C'est le meilleur
moyen utilisé pour vérifier qu'un changement dans une chaîne de
calculs n'a pas affecté la qualité de la vidéo.
Fichiers
de référence et séquences calculées
Ils
voudront certainement envoyer une séquence de référence dans leur
unité de processing AV, puis la décoderont pour la comparer avec
celle de référence, initiale. Ceci est normalement effectué pour
noter et juger la qualité vidéo post-processing. ClearView fournit
de nombreuses mires de tests aux standards EBU et VQEG utilisables en
séquences de référence.
Les
fournisseurs de contenus veulent vérifier la qualité des
vidéo après compression et packaging (audio, vidéo, données
combinées dans un transport ou program stream). Pour ce faire, ils
voudront comparer les sorties en fin de process
(Compression/décompression) à celles du contenu original ?
ClearView - Lit
des séquences via les sorties HD/SD/3G SDI, HDMI, Componsantes vers
l'unité de processing
- Enregistre simultanément du décodeur en HD/SD/3G SDI, HDMI,
Composante
- Analyse l'alignement spatial & temporel
- Juge la qualité en utilisant les notations DMOS et JND
- Ecrit un rapport en fichier Log des résultats d'analyse. Rapport
compatible Excel qui pourra être ouvert dans ClearView pour
restaurer une session.
Ils
voudront vérifier que le fichier après compression ait gardé sa
qualité AV sur toute la durée entière et que la synchro labiale
ait été maintenue. Pour, effectuer des tests dans le temps
VidéoClarity a créé RTM pour (Real-Time Monitor) outil de
monitoring et d'analyse longue durée.
RTM –
Un système complet de référence pour le monitoring et l'analyse de
la qualité AV. -
Mesure la qualité audio et vidéo
- Mesure le délai audio/video (lip-sync) , syncro labiale
- Mesure l'intégrité des lignes de données VANC
- Génère des alarmes et enregistre les séquences AV concernées si
l'une ou plusieurs des conditions ci-dessus a chuté en dessous des
seuils limites fixés de dégradation.
Comparaison entre les fichiers de référence et les fichiers processés
Les Broadcasters veulent déterminer les paramètres d'émission optimaux
pour
insérer le maximum de
canaux (à une
qualité données) dans la bande passante disponible. Ils peuvent
utiliser ClearView pour lire une séquence de référence et
enregistrer le retour simultanément (comme expliqué plus haut), il
peuvent aussi utiliser RTM pour enregistrer « on-air » en
mode de test longue durée.
RTM - Lit
les séquences de référence et celles post processing via les
entrées HD/SD SDI
- Mesure la qualité audio et vidéo
-
Mesure le délai audio/video (lip-sync) , syncro labiale
-
Mesure l'intégrité des lignes de données VANC
-
Edite continuellement un rapport sur la qualité AV, sur la mesure de
décalage AV, sur l'intégrité des lignes de données VANC dans un
fichier de log (compatibilité avec Excel)
-
En
plus, RTM peut être configuré pour générer des alarmes et
enregistrer les séquences qui seraient en dessous de seuils
prédéterminés comme acceptables.
-
Avec
RTM, les Broadcasters peuvent déterminer des spécificités pour
leurs contenus en ajustant leurs paramètres afin d'optimiser la
qualité dans la durée.
ClearView
- Enregistre 2 entrées live et importe des fichiers compressés et
non-compressés, Toutes les entrées sont enregistrées en fichiers YUV 4:2:2 ou
RGB 4:4:4
- Alignement spatial et temporel
- Mesures perceptibles avec utilisation des échelles de notation JND, DMOS, et
PSNR
- Facilite les tests subjectifs par l'analyse visuelle et auditive des
séquences de différentes manières
- Séquences de test EBU et VQEG nombreuses incluses
RTM
- Mesure la qualité audio et vidéo
- Mesure le décalage audio/video (lip-sync)
- Mesure les lignes de données VANC
- Génère des alarmes et enregistre les séquences dont l'analyse est sous un
seuil de tolérance prédéfini
ClearView Operations
|
Contrôles
Interface
utilisateur ClearView
Commandes
Play List
Chargement
List
Commandes
fichiers Batch
Opérations
Lecture
de 2 séquences
Enregistre
2 séquences
Menus
déroulants
- Imports
- décompresse
-
Modes
de visu
-
Côte
à côte
-
Un
au dessous de l'autre
-
Miroir
-
A-B
-
A-B
avec seuils
-
Trames seules
-
Zoom et Pan
-
Valeurs des pixels
Analyse
Visuelle virtuelle
-
DMOS
-
JND
-
PSNR
-
Spatiale
(Activité)
-
Temporelle
(Changement)
-
Alignements
|
Analyse
Off-line
Les fichiers log contiennent les notations objectives/perceptives et les
infos sur les réglages du test
- Import
dans Excel
-
Chargeable
dans ClearView pour
restauration de session
Analyse
visuelle virtuelle (ou perceptible)
Sarnoff
JND – Cette évaluation métrique complexe est reconnue fiable à
92% en comparaison à la notation subjective
Utilisation
de l'échelle de notation DMOS pour des tests MS-SSIM de
l'université du Texas – Notation visuelle reconnue fiable à 94%
Analyses
métriques objectives
PSNR-
Rapport signal sur bruit
FREQ-
Mesure des fréquences audio
Analyses
sans (ou presque sans) références
Spatial-
Calcul de la valeur d'activité dans l'image. Une valeur forte
indique beaucoup de changements dans l'image
Temporel-
Calcul des changements entre images successives. La valeur zéro
indique une image gelée.
Analyses
subjectives par visu réelle
Analyse
réelle visuelle grâce à différents modes d'affichage comparatifs
ou individuels (Trame/image, Zooms, Pan, outils de valeurs des
pixels, etc...)
Serveur A/V Non-compressé
Double lecture 4:2:2, YUV, jusqu'à 1080P/60Hz /50Hz
Lecture simple 4:4:4, RGB, jusqu'à 1080P/120Hz /100Hz
Notation de la qualité A/V
Alignement Spatial/Temporel
Analyse Qualité des images par notation (JND, DMOS)
Tests de longue durée avec alertes Acceptation et Rejet
Alertes configurable
Fichiers de rapports de log avec qualité A/V, Syncro labiale A/V, intégrité des lignes de données VANC
Rapports écrits de tests subjectifs
Play List
Commandes Batch
Chargement de Listes