CIRUGÍA PLÁSTICA Y ESTÉTICA Y UNIVERSIDAD

Prof. Dr. José Mª Serra i Renom Catedrático de Cirugía Plástica y Estética Universitat Internacional de Catalunya


IX - Los niveles de evidencia en cirugía plástica, reparadora y estética

En agosto de 2010, en la ciudad de Colorado Springs, un grupo de expertos formado por representantes de distintas sociedades científicas, instituciones académicas, fundaciones y editores de las más prestigiosas revistas de nuestra especialidad, se reunió para determinar cómo integrar la Medicina Basada en la Evidencia (MBE) en la Cirugía Plástica. Desde entonces, la gran mayoría de revistas indexadas de nuestra especialidad, piden a los autores que asignen a sus trabajos un determinado nivel o grado de evidencia.

La MBE fue desarrollada en la Universidad de McMaster (Canadá) por el equipo de Guyatt (1), cuyo objetivo es el de disponer de la mejor información científica disponible para aplicarla a la práctica clínica, es decir, consiste en basar nuestras decisiones en los mejores conocimientos existentes, y no únicamente en opiniones de expertos o series de casos clínicos limitadas.

Cuando se habla de niveles de evidencia, nos referimos a las escalas que permiten jerarquizar y valorar la calidad de la evidencia disponible o de los hallazgos de una determinado estudio en virtud de la calidad metodológica y el ámbito de aplicación del mismo. No todos los conocimientos que provienen de los artículos publicados, tienen el mismo impacto o valor sobre la toma de decisiones en materia de salud; por ello, se hizo necesario evaluar y jerarquizar la información publicada clasificándola en distintos grados o niveles de evidencia, en base a los cuales se puedan realizar recomendaciones fundadas respecto a la adopción de un determinado procedimiento médico o intervención sanitaria en la práctica clínica.

Aunque no se ha consensuado a nivel internacional una única clasificación, las múltiples escalas que existen difieren muy poco unas de otras. En concreto en Cirugía Plástica se suelen utilizar las acordadas por la American Society of Plastic Surgeons (ASPS) (2), en la que encontramos los mayores niveles de evidencia (Nivel I) en los ensayos clínico aleatorizados controlados enmascarados y en revisiones sitemáticas de ensayos clínicos, mientras que la evidencia menor, correspondiente al Nivel V, viene representada por las opiniones de expertos (Tabla 1).

Sin embargo, no todos los artículos pueden ser clasificados utilizando estas escalas. Anteriores estudios han comprobado que una parte importante de los artículos publicados en revistas de nuestra especialidad no son clasificables. Entre ellos encontramos estudios preclínicos con animales, estudios anatómicos en cadáver, cartas a los editores o editoriales… En estos mismos estudios se determinó que el nivel de evidencia promedio de los artículos publicados en las cuatro revistas más importantes de Cirugía Plástica, es el nivel III y tan sólo un 2.2% de los artículos eran de nivel I (3).

Hay que entender que no son sólo útiles o importantes los artículos con mayores grados de evidencia. Cada diseño o tipo de estudio, y en consencuencia cada nivel de evidencia, tiene unas indicaciones muy concretas en función del conocimiento disponible sobre el tema que se estudie en cada momento (4). No tendría sentido empezar realizando un ensayo clínico aleatorizado (nivel I) sobre una determinada técnica quirúrgica o diagnóstica cuando no se dispone de información sobre ellas. En este caso estaría indicado empezar con case-reports, series de casos clínicos o estudios transversales que aportaran información preliminar sobre estos procedimientos, describiendo las características y la frecuencia de ciertos femómenos en el grupo de estudio o las complicaciones secundarias a dicha intervención. Son precisamente estos diseños o tipos de estudios (niveles de evidencia IV o V) los que nos aportaran información descriptiva para poder generar nuevas hipótesis de estudio, aunque tengan niveles de evidencia inferiores.

 Evidence Rating Scale for Therapeutic Studies
Level of Evidence Qualifying Studies
I High-quality, multicenter or single-center randomized controlled trial with adequate power; or systematic review of these studies
II Lesser-quality randomized controlled trial; prospective cohort study; or systematic review of these studies
III Retrospective cohort or comparative study; case-control study; or systematic review of these studies
IV Case series with pre/post test or only post test
V Expert opinion developed via consensus process; case report or clinical example; or evidence based on physiology, bench research, or “first principles”

Evidence Rating Scale for Diagnostic Studies
Level of Evidence Qualifying Studies
I High-quality, multicenter or single-center cohort study validating a diagnostic test (with “gold” standard as reference) in a series of consecutive patients; or a systematic review of these studies
II Exploratory cohort study developing diagnostic criteria (with “gold” standard as reference) in a series of consecutive patients; or a systematic review of these studies
III Diagnostic study in nonconsecutive patients (without consistently applied “gold” standard as reference); or a systematic review of these studies
IV Case-control study; or any of the above diagnostic studies in the absence of a universally accepted “gold” standard
V Expert opinion developed via consensus process; case report or clinical example; or evidence based on physiology, bench research, or “first principles”

Evidence Rating Scale for Prognostic/Risk Studies
Level of Evidence Qualifying Studies
I High-quality, multicenter or single-center prospective cohort or comparative study with adequate power; or a systematic review of these studies
II Lesser-quality prospective cohort or comparative study; retrospective cohort or comparative study; untreated controls from a randomized controlled trial; or a systematic review of these studies
III Case-control study; or systematic review of these studies
IV Case series with pre/post test or only post test
V Expert opinion developed via consensus process; case report or clinical example; or evidence based on physiology, bench research, or “first principles”

Por ejemplo, tras comprobar en estudios in vitro y en animales los efectos de la fracción estromal vascular sobre la grasa (diseños no clasificables en niveles de evidencia), se decide realizar case-reports o series de casos que estudian la retención de volumen en un grupo de 25 pacientes a los que se les aplica lipofilling con fracción estromal vascular (FEV) y se describe la pérdida de volumen y el número de complicaciones. Otro ejemplo sería la relación entre linfoma e implantes mamarios.  Esta hipótesis fue en un inicio advertida por case-reports que describieron la coexistencia de ambos y llamaron la atención a la comunidad científica para verificar una posible relación causal.

Al analizar estos datos descriptivos (niveles de evidencia IV-V), el investigador se puede preguntar por las razones que conducen a cualquier diferencia observada y genera hipótesis científicas que intentará confirmar o rechazar. Sin embargo, llegados a este punto no tendría sentido seguir realizando estudios descriptivos, ya que lo que se necesita es planificar un diseño más robusto que permita rechazar o aceptar las hipótesis planteadas por la información obtenida de los estudios descriptivos, reduciendo al máximo el riesgo de sesgos. Estos estudios, llamados analíticos, buscan responder de un modo directo una pregunta de tipo etiológico, es decir, permiten establecer relaciones de causa-efecto entre una determinada exposición y la enfermedad (siguiendo con los ejemplos anteriores: 1. ¿es la FEV la responsable del aumento de supervivencia de la grasa inyectada?; 2. ¿existe una relación causal entre ser portadora de implantes mamarios y sufrir cáncer?).

Llegados a este punto de conocimiento sobre el tema y la generación de hipótesis, se necesita realizar un diseño basado en un grupo “control” y otro que sea el grupo “de estudio”. Este tipo de estudios analíticos los podemos dividir en analíticos- observacionales (nivel de evidencia III), entre los que cabe destacar los estudios de cohortes y aquellos de casos y controles, y en analíticos- experimentales (nivel de evidencia I-II), cuyo principal exponente es el ensayo clínico o las revisiones sistemáticas de estos estudios.

Un ejemplo seria comparar a dos grupos de pacientes, en los que a unos se les aplica sólo grasa y al otro grasa + FEV, o el realizar cohortes retrospectivas de largo periodo de duración para controlar una posible relación entre el linfoma y el implante mamario. En este último caso, al ser un evento raro sería muy costoso en tiempo y recursos plantear un ensayo prospectivo tipo ensayo clínico ya que el evento de interés, en este caso el linfoma secundario a las prótesis, es muy poco frecuente; en estos casos el tipo de estudio indicado es una cohorte retrospectiva. De hecho fueron las revisiones sitematicas de varias cohortes retrospectivas las que perimtieron hace unos años rechazar una posible relación entre linfoma y prótesis de mama.

Como ven es de gran importancia antes de iniciar cualquier investigación, conocer las indicaciones de cada tipo de estudio con exactitud para poder resolver nuestras preguntas de una forma más exacta, tema que se desarrollará en los próximos números de la revista. Por otro lado, los niveles de evidencia científica son útiles para valorar el método con el que se desarrolla un estudio, aunque todos los niveles de evidencia aportan información útil e importante para nuestra práctica clínica. Cuando un cirujano plástico emite una opinión cualificada sobre un tema de máximo interés, esta publicación es muy útil aunque sea de nivel V. Cuando se describa una técnica quirúrgica novedosa sobre un tema en el que existan muchas otras técnicas y sea difícil establecer un grupo control, también es interesante su publicación en una serie de casos demostrando su eficacia y esta publicación que puede ser de gran relevancia será de nivel IV. Cuando podamos comparar una técnica o un tratamiento con un grupo control ya será de nivel III.  A partir de aquí si se realiza un ensayo clínico aleatorizado y se realiza el enmascaramiento de los grupos para evitar sesgos, entonces podrá llegar a ser de nivel II o incluso de nivel I.

PIE DE FIGURA
Tabla 1: American Society of Plastic Surgeons Rating Levels of Evidence and Grading Recommendations.

Bibliografía:
1. Guyatt G, Rennie D. The evidence-based medicine working group Users' guides to the medical literature. Essentials of evidence-based clinical practice. Chicago: American Medical Association, 2002.
2. American Society of Plastic Surgeons Rating Levels of Evidence and Grading Recommendations: http://www.plasticsurgery.org/for-medical-professionals/legislation-and-advocacy/health-policy-resources/evidence-based-guidelinespractice-parameters/description-and-development-of-evidence-based-practice-guidelines.html [Consulta: 12-04-2014]
3. Sinno H, Neel O, Lutfy J, et al. Level of Evidence in Plastic Surgery Research. Plast Reconstr Surg. 2011;127(2):974-80.
4. http://www.equator-network.org [Consulta: 12-04-2014]