Verschiedene klinische Skalen finden Anwendung zur Beurteilung der Effektivität der Behandlung mimischer Falten mit Botulinumtoxin A. Bisher wurden jedoch nur sehr wenige dieser Skalen auf ihre Reproduzierbarkeit hin untersucht. Ziel dieser Arbeit war es, die Reproduzierbarkeit zweier Vier- Punkte-Skalen mit den Ausprägungen 0 bis 3 (keine bis starke Faltenbildung) zur Beurteilung periokulärer Lachfalten (Krähenfüße) zum einen bei entspannter und zum anderen bei angespannter Gesichtsmuskulatur zu untersuchen. Dazu wurde im Vorfeld einer klinisch kontrollierten Multicenter-Studie aus standardisierten Fotografien periokulärer Falten verschiedener Schweregrade im Konsensus-Verfahren ein Atlas entwickelt. Anschließend wurden neun Prüfärzte anhand des Atlas in der Anwendung der Vier-Punkte-Skalen geschult. Nach der Schulung wurden denselben neun Prüfärzten (bzw. nur acht Prüfärzten am zweiten Tag) an zwei aufeinander folgenden Tagen 97 Fotografien periokulärer Falten unterschiedlicher Ausprägung in entspanntem (n=49) und in angespanntem (n=48) Zustand in zufälliger Reihenfolge zur Beurteilung vorgelegt. Der Atlas durfte zur Beurteilung benutzt werden. Für die interindividuelle Variabilität ergab sich ein Kappa nach Fleiss von 0,60 für den entspannten und von 0,58 für den angespannten Zustand. Das ungewichtete intraindividuelle Kappa nach Cohen lag zwischen 0,47 und 0,86 für den entspannten Zustand und für den angespannten Zustand zwischen 0,63 und 0,81. Das gewichtete intraindividuelle Kappa nach Cohen erreichte Werte zwischen 0,63 und 0,91 für den entspannten Zustand und zwischen 0,71 und 0,86 für den angespannten Zustand. Die Werte der teilnehmenden Prüfärztinnen lagen tendenziell höher als die der teilnehmenden männlichen Prüfärzte. Im Anschluss an die SMILE-Studie wurden in einer zweiten Reproduzierbarkeitsstudie vier Experten, ebenfalls mit dem Atlas geschult und ihnen an zwei aufeinander folgenden Tagen 97 Fotografien periokulärer Falten unterschiedlicher Ausprägung in entspanntem (n=49) und in angespanntem (n=48) Zustand in zufälliger Reihenfolge zur Beurteilung vorgelegt. Auch sie durften dazu den Atlas benutzen. Dabei ergab sich für die interindividuelle Variabilität ein Kappa nach Fleiss von 0,63 für den entspannten Zustand und 0,50 für den angespannten Zustand. Die intraindividuelle Variabilität erreichte ungewichtete Kappa-Werte nach Cohen zwischen 0,49 und 0,75 für den entspannten Zustand und zwischen 0,35 und 0,62 für den angespannten Zustand. Das gewichtete Kappa nach Cohen lag zwischen 0,64 und 0,83 für den entspannten Zustand und zwischen 0,49 und 0,74 für den angespannten Zustand. Nach Altman sprechen Kappa-Werte zwischen 0,81 und 1,0 für eine sehr gute, Werte zwischen 0,61 und 0,8 für eine gute, Werte zwischen 0,41 und 0,6 für eine mäßige und Werte zwischen 0,21 und 0,40 für eine schlechte Variabilität. Somit wurden für die interindividuelle Variabilität bei beiden Reproduktionsstudien "mäßige" bis "gute" Werte erzielt, sowohl für den entspannten als auch für den angespannten Zustand. Die Werte für die intraindividuelle Variabilität schwankten bei den Prüfärzten zwischen "gut" und "sehr gut" und bei den Experten zwischen "mäßig" und "gut". Auch hier zeigte sich kein wesentlicher Unterschied zwischen dem entspannten und dem angespannten Zustand. Lediglich ein einziger der Prüfärzte erreichte für den entspannten Zustand nur eine "mäßige" und eine einzige der Expertinnen für den angespannten Zustand nur eine "schlechte" intraindividuelle Variabilität. Anhand der ausnahmslos höheren gewichteten Kappa-Werte zeigte sich, dass die Unterschiede in den Beurteilungen nur geringfügig waren. Insgesamt zeigte sich somit für beide Vier-Punkte-Skalen - für den entspannten und für den angespannten Zustand - eine mäßige bis gute interindividuelle und eine gute intraindividuelle Reproduzierbarkeit. Der weitere klinische Gebrauch der beiden Skalen für den entspannten und den angespannten Zustand kann folglich empfohlen werden.
Background: Several methods are used to evaluate the efficacy of botulinum toxin A in the treatment of hyperkinetic facial wrinkles. So far nearly very few have been investigated for its reproducibility. Objective: The aim of this study was to investigate the reproducibility of two widely used clinical 0 3 scales (from none to severe) for lateral canthal frown lines (crow's feet). Methods: Based on standardized photographs of the crow's feet area at rest and at maximum frown a consensus atlas depicting different severity grades was developed. Using the photographs of this atlas the investigators and experts of an upcoming clinical trial were trained. In the main study 49 photographs taken at rest and 48 photographs taken at maximum smile were shown on two consecutive days to 9 (first day) respectively 8 (both days) investigators and several months later on two consecutive days to 4 experts. The reproducibility of the scores was investigated by conventional kappa statistics. Results: The overall reproducibility for both scores was moderate to good both for the investigators and the experts. Among the investigators an unweighted kappa according to Fleiss of 0.6 at rest and of 0.58 at maximum smile for the interobserver reproducibility could be measured. For the intraobserver reproducibility the unweighted kappa according to Cohen measured between 0.47 and 0.86 for each observer at rest and between 0.63 and 0.81 for each observer at maximum smile. The weighted kappa with weights used according to Cicchetti and Allison ranged between 0.63 and 0.91 at rest and between 0.71 and 0.86 at maximum smile. Among the experts an unweighted kappa according to Fleiss of 0.63 at rest and of 0.50 at maximum smile for the interobserver reproducibility could be measured. For the intraobserver reproducibility the unweighted kappa according to Cohen measured between 0.53 and 0.75 for each observer at rest and between 0.35 and 0.62 for each observer at maximum smile. The weighted kappa with weights used according to Cicchetti and Allison ranged between 0.64 and 0.83 at rest and between 0.49 and 0.74 at maximum smile. Conclusions: The clinical 0 - 3 scores of crow's feet both at rest and at maximum smile show a moderate to good inter- and intraobserver reproducibility. As it allows a better discrimination than a single score combined for both situations the use of these scores in clinical trials can be recommended.