Entwicklung und Evaluierung eines Scoring-Systems zur Beurteilung von Schnitten in der Laserchirurgie

Nachricht

HeimHeim / Nachricht / Entwicklung und Evaluierung eines Scoring-Systems zur Beurteilung von Schnitten in der Laserchirurgie

Nov 21, 2023

Entwicklung und Evaluierung eines Scoring-Systems zur Beurteilung von Schnitten in der Laserchirurgie

Wissenschaftliche Berichte Band 12,

Wissenschaftliche Berichte Band 12, Artikelnummer: 14741 (2022) Diesen Artikel zitieren

887 Zugriffe

Details zu den Metriken

Die Idee der Laserchirurgie ist fast so alt wie der Laser selbst. Von den ersten Versuchen bis hin zu modernen Laserchirurgiesystemen war und ist es das Ziel, das Gewebe im Fokuspunkt gezielt zu schneiden, ohne die umliegenden Strukturen zu schädigen. Dies ist nur möglich, wenn die richtigen Parameter für den chirurgischen Laser gewählt werden. Dies erfolgt in der Regel durch Parameterstudien. Das konkrete Bewertungsschema unterscheidet sich jedoch häufig zwischen den Gruppen und präzisere Ansätze erfordern eine Färbung und mikroskopische Bewertung. Um diese Probleme zu lösen, wird ein makroskopisches Bewertungssystem vorgestellt und bewertet. Es zeigt sich, dass das Bewertungssystem gut funktioniert und ein Laserschnitt somit innerhalb weniger Sekunden beurteilt werden kann. Dabei wird die gesamte Schnittfront berücksichtigt. Das vorgestellte Bewertungssystem wird anhand der Intra-Class-Korrelation (ICC) bewertet. Die endgültige Übereinstimmung zwischen verschiedenen Bewertern beträgt mehr als 0,7. Daher kann das Punktesystem zur Optimierung und Bewertung des Schneidprozesses eingesetzt werden und sollte sich zum Vergleich der Ergebnisse zwischen verschiedenen Gruppen eignen. Es kann auf jeden Fall zur Bewertung innerhalb einer Gruppe eingesetzt werden, um beispielsweise eine tiefgreifende statistische Analyse für eine Parameterstudie zu ermöglichen.

Es ist bekannt, dass sich die Laserchirurgie zu einem allgemein anerkannten Instrument in verschiedenen chirurgischen Bereichen entwickelt hat1, da der Einsatz von Lasern in Krankenhäusern zunimmt2. Bei der Laserchirurgie liefern Laser vergleichbare Ergebnisse wie konventionelle Chirurgie und ermöglichen gleichzeitig eine minimale Invasivität3,4. Es gibt viele weitere Vorteile wie ein großes Heilungspotenzial, weniger postoperative Entzündungen und Schwellungen5 und die gleichzeitige Koagulation kleiner Blutgefäße ermöglicht ein trockenes Operationsfeld und eine bessere Sicht6. Neben der klassischen Laserchirurgie entstehen neue Technologien, die auf lokaler Erwärmung des Gewebes basieren, wie etwa die monopolare Koagulation oder die Plasmastrahlkoagulation7.

Obwohl die Laserchirurgie und andere Modalitäten viele Vorteile bieten, gibt es im Vergleich zur herkömmlichen Arbeit mit chirurgischen Instrumenten kein haptisches Feedback. Daher besteht bei jedem berührungslosen Gerät das Risiko einer Gewebeschädigung lebenswichtiger Strukturen. Daher ist es für jede chirurgische Laseranwendung von größter Bedeutung, den Gewebeschaden zu kennen (z. B. Schadenstiefe, verschiedene Schadenszonen, reversibler Schaden gegenüber irreversiblem Schaden). Insbesondere bei chirurgischen Eingriffen in unmittelbarer Nähe sensibler anatomischer Strukturen, die erhalten bleiben müssen (Nerven, große Blutgefäße, Speichelgänge, Harnwege,...) sind genaue Parameter der Laserschädigung des Gewebes unbedingt erforderlich, um eine minimale Schädigung zu gewährleisten der Patient.

Zum besseren Verständnis des thermischen Schadens sollte die Wärmeverteilung berücksichtigt werden. Im Allgemeinen wird bei der Laserchirurgie die Energie des Lasers absorbiert, was zu einer Erhöhung der Gewebetemperatur führt. Die steigende Temperatur führt zum gewünschten Abtrag des Materials. Der Wärmetransport hat jedoch den unerwünschten Nebeneffekt, dass die Umgebung geschädigt wird. Hierzu untersuchten Lévesque et al.8 verschiedene Wärmetransportmodelle auf Knochen zwischen 20 und 320 °C. Es finden Wärmeleitung, Wärmekonvektion und Wärmestrahlung statt. Bereits ab 125 °C dominiert die Wärmestrahlung8 mit Abhängigkeit von \(T^4\). Somit führt ein kleiner Temperaturanstieg zu einem großen Anstieg der transportierten Wärmemenge. Bei niedrigen Temperaturen im Bereich von 20 bis 50 °C dominiert die Wärmeleitung8,9. Basierend auf der erreichten Temperatur in der Umgebung können Denaturierung, Karbonisierung und thermomechanische Ablation dominieren. Dieser Effekt wurde bereits von McKenzie10 gezeigt.

Dennoch ist nicht nur das Verständnis der Schadensursache von entscheidender Bedeutung, auch die Schadensbewertung ist für die praktische Anwendung von großer Bedeutung. Ursprünglich wird die Hämatoxylin-Eosin (HE)-Färbung zur Beurteilung der thermischen Schädigung eingesetzt11. Später untersuchte Goertz12 verschiedene histologische Färbungen auf Denaturierung. Es konnte gezeigt werden, dass die Hinshaw-Pearse-Färbung die Visualisierung thermischer Einflüsse ermöglicht. Später verwendeten Vescovi et al.13 eine Punkteskala für histologische Proben. Ihre Bewertung basiert auf der Morphologie des Schnitts sowie der Veränderung von Gefäßen und Zellstrukturen; Zur Färbung wird die Standard-HE-Färbung verwendet. Magdy et al.14 verglichen die Wirksamkeit und den Schaden von Dissektion-Ligation, monopolarer Elektrokauterisation und Laser-Tonsillektomien. Zur Schadensbeurteilung kommt die HE-Färbung zum Einsatz, wenn thermisch geschädigte Stellen eine dunkle Farbe aufweisen. Cercadillo-Ibarguren et al.15 hatten die eleganteste Lösung, indem sie die Masson-Trichromat-Färbung hinzufügten, um falsch positive Ergebnisse durch die HE-Färbung zu maskieren. Cercadillo-Ibarguren et al.15 haben auch die Dicke des thermisch geschädigten Gewebes gemessen und diese als Quantifizierung für den Vergleich verschiedener Methoden verwendet.

Abgesehen von der Methode von Cercadillo-Ibarguren et al.15 ist den Autoren bisher keine Möglichkeit bekannt, den Schaden durch Laserchirurgie zuverlässig zu quantifizieren. Während die Methoden von Cercadillo-Ibarguren et al.15 und Vescovi et al.13 bereits einen großen Fortschritt darstellen, haben sie große Nachteile: Erstens ist eine große Menge an Messungen erforderlich, da statistisch zuverlässige Ergebnisse generiert werden sollen. Da der Prozess der Färbung und mikroskopischen Analyse viel Zeit in Anspruch nimmt, ist dies keine optimale Lösung. Zweitens können mikroskopische Ansätze nur einen kleinen Abschnitt des zu bewertenden Schnitts analysieren. Es ist wahrscheinlich, dass dies keine zuverlässige Darstellung des vom Laser oder anderen Werkzeugen durchgeführten Schnitts ist und daher nicht optimal für die statistische Auswertung geeignet ist.

Daher wird in dieser Studie ein makroskopisches Bewertungssystem vorgeschlagen, das diese Probleme überwindet: Ein Bewertungssystem wird verwendet, um Krankheitsbilder oder Verletzungsmuster zu klassifizieren sowie Diagnosen zu stellen und unterschiedliche Patientenzustände in einer einheitlichen Nomenklatur beschreiben zu können. Das Bewertungssystem kann von einem geschulten Wissenschaftler innerhalb weniger Sekunden durchgeführt werden, was vergleichsweise schnell ist und für die praktische Anwendung von Vorteil ist. Im Vergleich dazu besteht die HE-Färbung aus mehreren Schritten, zu denen das Kryoschneiden der Probe, die Gewebevorbereitung und der Färbeprozess selbst gehören. Während die Färbezeit allein auf wenige Minuten der Reagenzienexposition beschränkt ist, dauert der gesamte Prozess der Gewebevorbereitung, Färbung und Vorbereitung der Probe für die mikroskopische Untersuchung mehrere Stunden. Somit können viele Proben mit dem vorgeschlagenen Bewertungssystem problemlos innerhalb der für die HE-Färbung erforderlichen Zeit bewertet werden. Ein weiterer Vorteil besteht darin, dass die gesamte Schnittfront berücksichtigt wird, sodass die Ritzung die Qualität des Gesamtschnitts widerspiegelt.

Voraussetzung für ein gutes Scoring-System ist dessen Verlässlichkeit, also die Tatsache, dass unterschiedliche Bewerter gleiche oder zumindest ähnliche Scores vergeben. Da dieser Teil der wesentlichste Teil ist, ist diese Bewertung der Hauptteil dieser Studie. Um das Ergebnis noch weiter zu verallgemeinern, werden die Ergebnisse von ausgebildeten und ungeschulten Wissenschaftlern ausgewertet und verglichen. Die Übereinstimmung zwischen den Bewertern wird durch Intra-Class-Korrelation (ICC)16 bewertet, der modernsten statistischen Bewertungstechnik für die Übereinstimmung und Konsistenz der Bewerter.

Der Abschnitt „Materialien und Methoden“ besteht aus zwei Teilen. Im ersten Teil wird das Punktesystem vorgestellt und erklärt. Im zweiten Teil werden die Methoden zur Bewertung des Punktesystems aufgezeigt. Alle Schnitte werden mit einem CO\(_2\)-Laser mit unterschiedlichen Parametern am Muskelgewebe von frisch geschlachteten Schweinen durchgeführt, die bei einem örtlichen Metzger gekauft wurden. Diese Parameter werden nicht im Detail erläutert, da viele Parameter variiert wurden und gleichzeitig die Laserparameter für diese Studie nicht relevant sind. Die Parameterstudie wird in einer Folgestudie mit Hilfe des vorgestellten Punktesystems durchgeführt.

Das zentrale Ziel des in dieser Studie vorgestellten Bewertungssystems besteht darin, schnell zu sein, um die Auswertung vieler Schnitte für eine zuverlässige statistische Interpretation der Schnitte zu ermöglichen. Mit Hilfe des ICC kann beurteilt werden, ob das Scoring-System diese verlässlichen Ergebnisse liefert. Dies erfolgt durch die Auswertung der Bewertung derselben Stichproben durch verschiedene Bewerter.

Wenn ein Standardschnitt berücksichtigt wird, gibt es zwei mögliche sichtbare Teile, die zum Ritzen verwendet werden können: die Schnittfläche (CA) und die Schneidkante (CE). Beide Teile sind in Abb. 1 dargestellt. Der CA ist definiert als die Fläche der neuen Oberfläche, die durch den Schneidvorgang entsteht und durch die blauen Schraffurlinien in Abb. 1 markiert ist. Der CE ist definiert als der feine Rand zwischen den geschnittene und die ungeschnittene Oberfläche des Gewebes. Dies ist in Abb. 1 durch die schwarze Linie gekennzeichnet. Die Unterscheidung zwischen CA und CE erfolgt aus folgenden Gründen: Der größte potenzielle Schaden entsteht auf der CA. Daher sollte es mehr Informationen über den Schaden durch den Schnitt enthalten. In der Praxis kann es jedoch sein, dass es nicht zugänglich ist, da das Öffnen des Schnitts zu weiteren Schäden führen könnte. Der CE ist immer zugänglich, kann jedoch durch die Wechselwirkung der heißen Dämpfe und des abgetragenen Materials aus dem Ablationsprozess nur indirekte Informationen über den Schneidbereich übertragen. Aus dem Bereich der Lasermaterialbearbeitung ist bekannt, dass das abgetragene Material relevante Informationen über den Wechselwirkungsprozess des Lasers mit dem Substrat trägt17. Daher wird erwartet, dass die CE für eine zuverlässige Bewertung des Laserchirurgieprozesses verwendet werden kann. Zusammenfassend lässt sich sagen, dass von der CA im Vergleich zur CE eine präzisere und einfachere Bewertung erwartet wird; Eine Bewertung ist jedoch möglicherweise nicht immer möglich.

Vorbildlicher Schnitt ohne große Gewebeschädigung. Die beiden Bewertungsmethoden sind die Schneidkante (CE); blaue Ritzung des Schnittbereichs (CA).

Es gibt zwei mögliche Merkmale, die zur Beurteilung der Bewertung des Laserchirurgievorgangs (im Sinne von CA und CE) herangezogen werden können: die Farbe des Gewebes und der bedeckte Bereich mit verfärbtem Gewebe. Grundsätzlich können fünf Gewebefarben auftreten: Schwarz, Dunkelbraun, Hellbraun, Weiß und Rosa. Die Farben Schwarz, Dunkelbraun und Hellbraun stellen den Karbonisierungsgrad des Gewebes dar. Die Farbe Weiß weist auf Koagulationseffekte hin, während Rosa hauptsächlich auf unbeschädigtes Gewebe hinweist. Diese unterschiedlichen Farben würden bereits zu einem möglichen Punktesystem führen. Um zusätzliche Informationen hinzuzufügen, wird die Größe der beschädigten Fläche berücksichtigt.

Es können verschiedene Bereiche der Farbabdunklung definiert werden. In dieser Studie werden folgende Bereiche gewählt: 80 %+, 50 %+, 30 %+, unter 30 % und keine oder nahezu keine Verdunkelung des Gewebes. Diese Zahlen werden gewählt, da sie eine Optimierung der Parameterstudien im Hinblick auf qualitativ hochwertige Schnitte ermöglichen. Wie bereits erwähnt, lässt sich auch die Gewebefarbe bei der Laserchirurgie grob in fünf Kategorien einteilen (schwarz, dunkelbraun, hellbraun, weiß, rosa/natürliche Farbe). Daher ist es sinnvoll, dass das Bewertungssystem fünf Bewertungsvariablen umfasst. Da eine einzelne Farbe nicht isoliert erscheint, sollte jede Partitur eine Reihe von Verfärbungen abdecken. Mit anderen Worten: Eine statistische Analyse macht nur dann Sinn, wenn der Unterschied zwischen vollständiger Verkokung und teilweiser Verkokung unterschieden werden kann. Anhand der unterschiedlichen Anteile brauner/schwarzer Gewebe und ihrer Farbe kann die Karbonisierung beurteilt werden.

Die endgültigen Bewertungsparameter sind in Abb. 2 dargestellt. Das Bewertungssystem ist auf einen Bereich von 1 Punkt bis 5 Punkten eingestellt, wobei 5 die geringste Verdunkelung darstellt (die als die beste gilt):

Die Ergebnisse zeigen eine starke Karbonisierung. Das Gewebe ist fast überall dunkel (80 %+) und die Farbe ist meist dunkelbraun bis schwarz.

Die Karbonisierung ist immer noch vorhanden, aber geringer als bei der vorherigen Bewertung. Mehr als die Hälfte des Gewebes (50 %+) ist dunkel. Im Gegensatz zur Note „1“ ist eine hellbraune Gewebefärbung vorhanden. Manchmal können dennoch schwarze Bereiche auftreten.

Die Karbonisierung ist leicht. Normalerweise sollte kein schwarzes Gewebe erscheinen. Typischerweise führt die Karbonisierung zu einer hellbraunen und dunkelbraunen Gewebefärbung. Insgesamt sind etwa 30–50 % des Gewebes verdunkelt.

Weniger als 30 % des Gewebes sind dunkel. Es können rosafarbene Bereiche auftreten, normalerweise sollte nur hellbraunes Gewebe zu sehen sein. Bei Ex-vivo-Experimenten ist ein Flimmern möglich, das durch vorhandenes Wasser verursacht wird. Normalerweise ist ein großer Teil des Gewebes aufgrund der Koagulation weiß.

Außer dem Schnitt selbst gibt es nahezu keine Gewebeschädigung. Es sollte keine oder nahezu keine Verdunkelung des Gewebes auftreten. Die vorherrschenden Gewebefarben sind rosa und weiß.

Beispiel für das Bewertungssystem: Die Spalten stellen die Punkte im Bewertungssystem dar, während die Zeilen die Bewertung für die Schneide (CE) bzw. den Bereich innerhalb des Schnitts (Schnittbereich) darstellen.

Für das Punktesystem müssen einige allgemeine Überlegungen berücksichtigt werden. Erstens gibt es derzeit keinen Goldstandard für die Bewertung von Laserchirurgie, mit dem das Bewertungssystem verglichen werden könnte. Dies ist ein ähnliches Problem, mit dem Wissenschaftler auf dem Gebiet der Psychologie konfrontiert sind, da es für viele psychische Erkrankungen keinen objektiven Goldstandard gibt. Dennoch wäre ein Bewertungssystem für diese Krankheiten hilfreich. Dieses Problem kann gelöst werden, indem beurteilt wird, wie ähnlich unabhängige Personen denselben Patienten bewerten. Im Rahmen dieser Studie wird überprüft, wie unterschiedliche Personen unabhängig voneinander die gleichen Laserschnitte bewerten. Für die Analyse eines neuen Bewertungssystems ist der ICC der Stand der Technik zur Analyse der Interrater-Reliabilität18. In einer vereinfachten Erklärung prüft der ICC, wie ähnlich verschiedene Bewerter jede Stichprobe bewerten. Wenn die unterschiedlichen Bewerter ähnlich bewerten, ist der ICC hoch und das Bewertungssystem funktioniert gut. Darüber hinaus können die Ergebnisse des ICC mit einer Korrelation verglichen werden, da die korrekte Bewertung nicht a priori bekannt ist.

Für die Bewertung des Bewertungssystems werden zwei unterschiedliche Einstellungen untersucht, wie in Abb. 3 dargestellt: Zunächst wird eine Gruppe von sechs Wissenschaftlern gebeten, 115 Schnitte nur mit der in Abb. 2 gezeigten Erklärung zu bewerten. Alle für die Analyse verwendeten Bilder in Diese Studie finden Sie in den „Ergänzenden Materialien“. Dieses Experiment soll zeigen, dass das Bewertungssystem bereits für ungeübte Wissenschaftler zuverlässig ist und sich daher für die Bewertung der laserchirurgischen Schnitte eignet. Zweitens wird eine Gruppe von sechs verschiedenen Wissenschaftlern gebeten, dieselbe Bewertung noch einmal durchzuführen. In diesem Teil werden die zusätzlichen Informationen in Abb. 1 bereitgestellt und die ersten 25 Beispiele als Trainingseinheit mit regelmäßigem Feedback verwendet. Hierzu werden die Gutachter gebeten, die ersten fünf Schnitte zu bewerten. Anschließend wird die Lösung gemäß dem Erstautor der vorliegenden Studie vorgestellt und diskutiert. Dies wird für die nächsten 20 Schnitte mit der gleichen Vorgehensweise wiederholt, wie in Abb. 3 auf dem rechten Pfad dargestellt. Es ist zu beachten, dass der wichtige Teil der Schulungszeit die Diskussion ist, in der Fragen der Bewerter auftauchen. Für den Test der geschulten Bewerter wurde die Reihenfolge der Bilder zur Auswertung leicht verändert. Dadurch wurde sichergestellt, dass von allen Schnittqualitäten in den ersten 25 Proben mindestens 3 Exemplare vorhanden sind.

Bewertung des Punktesystems. In der ersten Einstellung erfolgt die Bewertung für ungeschulte Bewerter (links) und in der zweiten Einstellung für geschulte Bewerter (rechts).

Insgesamt sind alle 12 Gutachter Wissenschaftler auf dem Gebiet der Optik. Keiner von ihnen hat Erfahrung auf dem Gebiet der Laserchirurgie. Nur zwei der Wissenschaftler haben Erfahrung in der Biophotonik. Beide Wissenschaftler gehören zur Gruppe der ungeschulten Bewerter. Der Rest der Wissenschaftler arbeitet im Bereich der Lasermaterialbearbeitung mit mindestens einem der folgenden Fachgebiete: Schweißen/Schneiden mit Lasern, Additive Fertigung mit Metallen, Simulation der Lasermaterialbearbeitung und Sensorik für die Lasermaterialbearbeitung.

Die Übereinstimmung der Rater wird von ICC16 in Python mit dem Pingouin-Framework19 mit dem Befehl „intraclass-corr“ ausgewertet. Der ICC ist eine deskriptive Statistik, die verwendet werden kann, wenn Einheiten (die Qualität des Schnitts) in Gruppen quantitativer Messungen (Scores) organisiert werden. Es wird als Rahmen für Zufallseffektmodelle angesehen. Der ICC beschreibt, wie sehr Einheiten derselben Gruppe einander ähneln. Es wird verwendet, um den Grad zu quantifizieren, in dem verschiedene Beobachter (in dieser Studie: Bewerter) konsistent sind oder die gleichen Ergebnisse reproduzieren. Zur Erinnerung: Der ICC kann als eine ausgefeiltere Version einer Korrelation wie der Pearson-Korrelation angesehen werden. Während typische Korrelationen nur paarweise korrelieren, korreliert der ICC alle Ergebnisse auf einmal. Dies führt zu zwei Schlussfolgerungen: Der ICC ist zu bevorzugen und kann ähnlich wie ein Standardkorrelationskoeffizient interpretiert werden. Der ICC reicht von null bis eins und je höher der ICC, desto besser ist das Punktesystem. Laut Koo et al.18 ist ein ICC zwischen 0,50 und 0,75 moderat, zwischen 0,75 und 0,90 gut und höhere Werte bedeuten ausgezeichnet. Andere Autoren sprechen von einer hohen Übereinstimmung, wenn der ICC größer als 0,720 ist. Generell wird die Bandbreite eines optimalen Ergebnisses für den ICC noch diskutiert.

Sowohl die ungeschulten als auch die geschulten Bewerter werden vom ICC für die Gesamtdaten sowohl für die CE als auch für die CA ausgewertet. Für die CA wird eine anspruchsvollere Analyse durchgeführt, indem der ICC für das erste und letzte Drittel der bewerteten Schnitte verwendet wird. Durch diese Informationen kann die Auswirkung der Lernerfahrung auf das Bewertungssystem erfasst werden. Der Trainingseffekt wird gemessen, indem die Ergebnisse des ICC aus dem ersten Drittel und dem letzten Drittel der bewerteten Proben verglichen werden. Für den ICC werden sechs Werte berechnet19:

ICC1: Jedes Ziel wird von einem anderen Bewerter bewertet. Die Bewerter werden nach dem Zufallsprinzip ausgewählt. Für die Berechnung wird ein einfaktorielles Anova-Fixed-Effects-Modell verwendet. Der ICC1 reagiert empfindlich auf Unterschiede in den Mittelwerten zwischen Bewertern.

ICC2: Eine Zufallsstichprobe wird von k Bewertern bewertet und die absolute Übereinstimmung gemessen. Der ICC2 reagiert empfindlich auf Wechselwirkungen. Die Bewerter werden nach dem Zufallsprinzip ausgewählt.

ICC3: Eine feste Gruppe von k Bewertern bewertet jedes Ziel. Daher gibt es keine Verallgemeinerung auf eine größere Population von Bewertern. Der ICC3 reagiert empfindlich auf Interaktionen. Die Auswahl der Prüfer erfolgt z. B. aufgrund von Fähigkeiten oder besonderer Vorbildung.

ICC1k: Wie ICC1, jedoch wird die Zuverlässigkeit für den Mittelwert von k Bewertern geschätzt. Die Ergebnisse ähneln der nach Spearman Brown angepassten Zuverlässigkeit oder Cornbachs Alpha.

ICC2k: Wie ICC2, jedoch wird die Zuverlässigkeit für den Mittelwert von k Bewertern geschätzt. Die Ergebnisse ähneln der nach Spearman Brown angepassten Zuverlässigkeit oder Cornbachs Alpha.

ICC3k: Wie ICC3, jedoch wird die Zuverlässigkeit für den Mittelwert von k Bewertern geschätzt. Die Ergebnisse ähneln der nach Spearman Brown angepassten Zuverlässigkeit oder Cornbachs Alpha.

Daraus lässt sich schließen, dass ICC3 in dieser Studie analysiert werden muss, da als Bewerter feste Bewerter (d. h. Wissenschaftler auf dem Gebiet der Optik) ausgewählt werden. Es können zwei verschiedene Tests durchgeführt werden: die Konsistenz oder relative Übereinstimmung im Vergleich zur absoluten Übereinstimmung. Während Letzteres beschreibt, wie ähnlich die Bewerter die Bewertung vornehmen, beschreibt Ersteres die Ähnlichkeit der Tendenz. Das heißt, wenn einige Bewerter die Stichproben immer niedriger bewerten, ist die Konsistenz hoch. Allerdings wird die Einigung gering ausfallen.

Da das Modell testen soll, wie gut sich die Ergebnisse mit verschiedenen Gruppen vergleichen lassen, wird die absolute Übereinstimmung berechnet. Dabei ist zu beachten, dass die absolute Übereinstimmung immer kleiner oder gleich der Konsistenz ist. Wenn also die absolute Übereinstimmung hoch ist, ist die relative Übereinstimmung (Konsistenz) sogar noch höher. Somit eignet sich das vorgeschlagene Bewertungssystem auch für Parameterstudien.

Darüber hinaus wird die Spearman-Korrelation berechnet, da sie möglicherweise mehr Lesern bekannt ist. Es misst die lineare Korrelation zwischen zwei Bewertern. Da jedoch nur eine paarweise Korrelation durchgeführt werden kann, wird der ICC bevorzugt. Als Ergebnis wird somit die gemittelte Spearman-Korrelation für CA und CE dargestellt. Dies sollte ähnliche Werte wie der ICC liefern. Darüber hinaus wird die gemittelte Spearman-Korrelation zwischen CA und CE dargestellt, um die Ähnlichkeit zwischen beiden zu zeigen, und es wird mithilfe des Wilcoxon-Signed-Rank-Tests getestet, ob CE und CA die gleichen Werte aufweisen. Dieser Test wird gewählt, da die Punktzahl nicht gaußverteilt ist und die Stichproben miteinander in Beziehung stehen (gleiche Stichprobe).

In diesem Abschnitt wird die Bewertung der Bewertungsmethode vorgestellt.

Tabelle 1 zeigt die Ergebnisse für ungeschulte Bewerter des ICC für CE bzw. CA. Darüber hinaus stellt „CI 95 %“ das Konfidenzintervall dar, in dem mit 95 % Wahrscheinlichkeit der endgültige ICC zu finden ist. Es ist ersichtlich, dass der ICC für die CA höher ist. Das Feedback der Bewerter deutet darauf hin, dass die Bewertung des CE schwieriger ist als die Bewertung des CA. Dies steht im Einklang mit den Ergebnissen von CE und CA. Obwohl für die Bewertung die CA für ungeschulte Bewerter vorzuziehen ist, ist sie nicht immer sichtbar und verfügbar. In diesem Fall muss das CE verwendet werden. Allerdings ist die Verteilung der Ergebnisse der Bewerter von CA und CE deutlich unterschiedlich (\(p \ll 1 \times 10^{-3}\)), was bedeutet, dass CE und CA etwas anderes testen. Dennoch führen beide bei guten Schnitten zu ähnlichen Ergebnissen, beide sind also gültig. Die Spearman-Korrelation zeigt einen ähnlichen Trend. Die durchschnittliche Spearman-Korrelation zwischen CA und CE beträgt 0,41. Daher deutet dies auch darauf hin, dass CE und CA teilweise unabhängige Parameter sind. Die durchschnittliche Spearman-Korrelation für CE und CA beträgt 0,62 bzw. 0,70. Diese Ergebnisse sind mit den Ergebnissen des ICC vergleichbar.

Tabelle 2 zeigt die Ergebnisse des ICC für das erste und letzte Drittel der CA. Es ist deutlich zu erkennen, dass es einen Lerneffekt bei den Bewertern gibt. Der ICC erhöht sich um etwa 0,2. Daher wird dringend empfohlen, dass neue Bewerter mit ein oder zweihundert Proben üben, bevor sie den endgültigen Datensatz bewerten.

Tabelle 3 zeigt die Ergebnisse für geschulte Bewerter des ICC für CE bzw. CA. Es ist ersichtlich, dass die absolute Übereinstimmung für CE höher ist als für die ungeschulten Bewerter in Tabelle 1. Das Training scheint die Ergebnisse für CE leicht zu verbessern, während der Effekt für CA sehr gering ist. Es wird erwartet, dass der geringfügige Rückgang bei der CA durch Zufall verursacht werden könnte, durch den Effekt, dass kein Wissenschaftler mit Erfahrung in der Biophotonik die Bewertung mit geschulten Bewertern vorgenommen hat und/oder durch die Änderung der Reihenfolge der Bilder. Aus unserer Sicht ist die erste Erklärung die wahrscheinlichste, da der Unterschied beim ICC minimal ist. Auch hier deuten die Rückmeldungen der Bewerter darauf hin, dass die Bewertung des CE schwieriger ist als die Bewertung des CA. Generell lässt sich sagen, dass die Ausbildung gerade für das CE wichtig ist.

Tabelle 4 zeigt die Ergebnisse des ICC für das erste und letzte Drittel des CE für geschulte Bewerter. Der Lerneffekt nimmt im Vergleich zu den ungeschulten Bewertern ab. Es ist jedoch immer noch vorhanden. Daher ist eine lange Übung erforderlich, um eine größere Übereinstimmung zwischen den verschiedenen Bewertern zu erreichen. Allerdings ist der Trainingseffekt bei geschulten Ratern geringer.

Im ersten Absatz werden die Grenzen der Bewertung des Punktesystems diskutiert. Anschließend werden die Grenzen des Bewertungssystems selbst dargestellt und im letzten Absatz die Grenzen dieser Studie aufgezeigt.

Derzeit gibt es eine Einschränkung bei der Auswertung des Punktesystems. Aufgrund der Tatsache, dass viele Menschen das Bewertungssystem bewerten sollten, erfolgte die Bewertung anhand von Bildern des Schnitts und nicht anhand frischer Schnitte. Dies kann jedoch auch in einen Vorteil umgewandelt werden: Es bietet anderen Forschern die Möglichkeit, ihre eigenen Bewertungsergebnisse oder sogar ein modifiziertes Bewertungssystem mit dem in dieser Studie zu vergleichen, da die Bilder in den „Ergänzenden Materialien“ verfügbar sind.

Eine Einschränkung des vorgestellten Bewertungssystems besteht in der Übertragbarkeit der Bewertungsergebnisse in klinische Umgebungen, da nur Ex-vivo-Gewebe von Schweinen verwendet wurde. Aus diesem Grund werden Effekte wie Perfusion nicht berücksichtigt. Nach derzeitigem Stand lässt sich das klinische Ergebnis der Laserchirurgie anhand der angegebenen Scores nicht vorhersagen; Weitere Studien sind erforderlich, um zu untersuchen, ob beispielsweise Effekte wie verzögerte Wundheilung oder Narbenbildung mit den Werten in Zusammenhang stehen können. Darüber hinaus wird noch nicht berücksichtigt, dass verschiedene Gewebetypen wie Haut oder Stimmband unterschiedlich starke thermische Schäden tolerieren können. Dies lässt sich jedoch leicht beheben: Bei empfindlichen Gewebetypen kann der schlechteste Wert auf eine geringere thermische Schädigung gesetzt werden. Abschließend ist hervorzuheben, dass die Verwendung des vorgestellten Bewertungssystems zumindest ex vivo eine schnelle und effiziente Möglichkeit für eine Parameterstudie für die Laserchirurgie ermöglicht. Dies soll in einer Folgestudie für Schnitte mit einem CO\(_2\)-Laser gezeigt werden.

Die Einschränkungen der aktuellen Studie sind folgende: Erstens wurden alle Auswertungen für jeden Schnitt an einem einzigen Bild durchgeführt. Daher beeinflussen Parameter wie der Winkel oder die Qualität des Bildes die Bewertung. Zweitens war keiner der Bewerter ein Experte für Laserchirurgie. Daher ist mehr Arbeit erforderlich, um festzustellen, ob eine bestimmte Unterklasse von Bewertern konsistenter bewertet als eine andere. Darüber hinaus kann die Leistung des Bewertungssystems auch dann abweichen, wenn frisches Gewebe direkt nach dem Schnitt beurteilt wird. Trotz dieser Einschränkungen erreicht das Bewertungssystem immer noch einen ICC von 0,71.

Mit dem vorgestellten Bewertungssystem ist es möglich, Laserschnitte einfach zu bewerten. CA und CE wurden ausgewertet. Von den vorgestellten Bewertungssystemen ist dasjenige für die CA vorzuziehen. Da es nicht in allen Fällen leicht zugänglich ist, erlaubt das CE eine ähnliche Nutzung. Letzteres sei jedoch nach Aussage der Bewerter schwieriger zu bewerten, was zu einem niedrigeren ICC führe. Obwohl die Schnitte in dieser Studie mit einem CO\(_2\)-Laser erzeugt wurden, gibt es keinen Grund, warum das vorgeschlagene Ritzsystem nicht auf andere Lasersysteme oder sogar andere thermische Schneidmodalitäten angewendet werden kann.

Darüber hinaus ist es sicher, dass die vorgestellte Bewertung zur Optimierung der Parameter der Laserchirurgie nützlich ist und einfache und schnelle Ergebnisse für deren Bewertung liefern kann. Der endgültige ICC beträgt 0,71. Daher soll das vorgestellte Scoring-System ein zuverlässiges, einfaches und schnelles System zur Beurteilung von Schnitten mittels Laserchirurgie sein. Die Schnittpunktzahl kann zwischen verschiedenen Gruppen verglichen werden. Es sollte jedoch eine zweite Untersuchung durchgeführt werden, bei der frische Proben direkt nach dem Schnitt bewertet werden.

Für die Zukunft ist eine weitere Studie geplant, in der dieses Bewertungssystem auf frische Ex-vivo-Laseroperationen von Schweinemuskelgewebe mit einem CO\(_2\)-Laser angewendet wird. Hierzu wird der Einfluss der wichtigsten Parameter auf die Ergebnisse untersucht und nach ihrer Wichtigkeit geordnet.

Spyropoulos, B. 50 Jahre Laser: In-vitro-Diagnostik, klinische Anwendungen und Perspektiven. Klin. Labor. 57(3–4), 131–142 (2011).

PubMed Google Scholar

Späth, M. et al. Eine quantitative Bewertung des Einsatzes medizinischer Laser in deutschen Krankenhäusern. J. Biophoton. 13(2), e201900238 (2020).

Artikel Google Scholar

Sinha, P. et al. Transorale Lasermikrochirurgie bei oralem Plattenepithelkarzinom: Onkologische Ergebnisse und Prognosefaktoren. Kopf Hals 36(3), 340–351 (2014).

Artikel Google Scholar

Thomson, PJ & Wylie, J. Interventionelle Laserchirurgie: Ein wirksames chirurgisches und diagnostisches Instrument bei der Behandlung oraler Krebsvorstufen. Int. J. Oral Maxillofac. Surg. 31(2), 145–153 (2002).

Artikel CAS Google Scholar

Fisher, SE & Frame, JW Die Auswirkungen des chirurgischen Kohlendioxidlasers auf Mundgewebe. Br. J. Oral Maxillofac. Surg. 22(6), 414–425 (1984).

Artikel CAS Google Scholar

Ben-Bassat, M., Kaplan, I., Shindel, Y. & Edlan, A. Der CO2-Laser in der Zungenchirurgie. Br. J. Plastische Chirurgie. 31(2), 155–156 (1978).

Artikel CAS Google Scholar

Jundt, JS et al. Weiterentwicklung der Technologien zum Gewebeschneiden. Orales Maxillofac. Surg. Klin. 31(4), 549–559 (2019).

Artikel Google Scholar

Lévesque, L. Kühlgesetz, Wärmeleitung und Stefan-Boltzmann-Strahlungsgesetze angepasst an experimentelle Daten für mit CO2-Laser bestrahlte Knochen. Biomed. Optics Express 5(3), 701–712 (2014).

Artikel Google Scholar

Anvari, B., Motamedi, M., Torres, JH, Rastegar, S. & Orihuela, E. Auswirkungen der Oberflächenbewässerung auf die thermische Reaktion des Gewebes während der Laserbestrahlung. Laserchirurgie. Med. 14(4), 386–395 (1994).

Artikel CAS Google Scholar

McKenzie, AL Ein Drei-Zonen-Modell der Weichteilschädigung durch einen CO2-Laser. Physik. Med. Biol. 31(9), 967 (1986).

Artikel CAS Google Scholar

Arashiro, DS, Rapley, JW, Cobb, CM & Killoy, WJ Histologische Bewertung von Schweinehautschnitten, die durch CO2-Laser, Elektrochirurgie und Skalpell erzeugt wurden. Int. J. Parodontologie, restaurative Zahnheilkunde. 16(5), 478–491. 14p (1996).

Goertz, O. Modell zur intravitalen fluoreszenzmikroskopischen Langzeit-Analyse von Mikrozirkulation, Leukozyten-Endothelzell-Interaktion und Neovaskularisation nach Verbrennung. Ruhr-Universität Bochum, Universitätsbibliothek, dissertation (2006).

Vescovi, P. et al. Nd:Yag-Laser im Vergleich zum herkömmlichen Skalpell. Eine vorläufige histologische Analyse von Proben aus der menschlichen Mundschleimhaut. Laser Med. Wissenschaft. 25(5), 685–691 (2010).

Artikel Google Scholar

Magdy, EA, Elwany, S., El-Daly, AS, Abdel-Hadi, M. & Morshedy, MA Coblation-Tonsillektomie: Ein prospektiver, doppelblinder, randomisierter, klinischer und histopathologischer Vergleich mit Dissektion-Ligation, monopolarer Elektrokauterisation und Laser Tonsillektomien. J. Laryngol. Otol. 122(3), 282 (2008).

Artikel CAS Google Scholar

Cercadillo-Ibarguren, I. et al. Histologische Bewertung der thermischen Schädigung von Weichgewebe durch CO2-, Er-, Cr: Ysgg- und Diodenlaser. Medicina Oral Patol. Oral y Cirugia Bucal 15(6), 912–918 (2010).

Artikel Google Scholar

McGraw, KO & Wong, SP Schlussfolgerungen über einige Korrelationskoeffizienten innerhalb der Klasse ziehen. Psychol. Methoden 1(1), 30 (1996).

Artikel Google Scholar

Eschner, E., Staudt, T. & Schmidt, M. Korrelation von Spritzerverhalten und Prozesszonenbildung beim Pulverbettschmelzen von Metallen. CIRP Ann. 69(1), 209–212 (2020).

Artikel Google Scholar

Koo, TK & Li, MY Eine Richtlinie zur Auswahl und Berichterstattung von klasseninternen Korrelationskoeffizienten für die Zuverlässigkeitsforschung. J. Chiropraktik Med. 15(2), 155–163 (2016).

Artikel Google Scholar

Vallat, R. Pingouin: Statistiken in Python. J. Open Source Softw. 3(31), 1026 (2018).

Artikel ADS Google Scholar

Greguras, GJ & Robie, C. Ein neuer Blick auf die quelleninterne Interrater-Zuverlässigkeit von 360-Grad-Feedback-Bewertungen. J. Appl. Psychol. 83(6), 960 (1998).

Artikel Google Scholar

Referenzen herunterladen

Open-Access-Förderung ermöglicht und organisiert durch Projekt DEAL.

Institute of Photonic Technologies (LPT), Friedrich-Alexander-Universität Erlangen-Nürnberg (FAU), Konrad-Zuse-Straße 3/5, 91052, Erlangen, Germany

Martin Hohmann, David Kühn, Moritz Späth, Florian Stelzle, Florian Klämpfl & Michael Schmidt

Erlangen Graduate School in Advanced Optical Technologies (SAOT), Paul-Gordan-Straße 6, 91052, Erlangen, Germany

Martin Hohmann, Moritz Späth, Florian Stelzle, Florian Klämpfl & Michael Schmidt

Abteilung für Mund-, Kiefer- und Gesichtschirurgie, Universitätsklinikum Erlangen, Ulmenweg 18, 91054, Erlangen, Deutschland

Max Rohde & Florian Stelzle

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

MH konzipierte die Forschung, führte die Datenanalyse durch, bereitete das Manuskript vor und unterstützte DK bei der Laborarbeit. DK führte die experimentelle Arbeit durch und entwickelte das Bewertungssystem. MS unterstützte die Datenanalyse. MR spezifizierte das Punktesystem aus medizinischer Sicht. FS und MS leiteten die allgemeine Forschungsstrategie. Alle Autoren haben das Manuskript überprüft.

Korrespondenz mit Martin Hohmann.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die Originalautor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Hohmann, M., Kühn, D., Späth, M. et al. Entwicklung und Evaluierung eines Scoring-Systems zur Beurteilung von Schnitten in der Laserchirurgie. Sci Rep 12, 14741 (2022). https://doi.org/10.1038/s41598-022-18969-0

Zitat herunterladen

Eingegangen: 14. Dezember 2021

Angenommen: 23. August 2022

Veröffentlicht: 30. August 2022

DOI: https://doi.org/10.1038/s41598-022-18969-0

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.