Özgün Araştırma

Dört Yoğun Bakım Skorlama Sisteminin Performanslarının Değerlendirilmesi

10.4274/Haseki.951

  • Beliz Bilgili
  • Yalım Dikmen
  • Oktay Demirkıran
  • Tuğhan Utku
  • Seval Ürkmez

Gönderim Tarihi: 07.12.2012 Kabul Tarihi: 31.01.2013 Med Bull Haseki 2013;51(2):45-50

Amaç:

Dört yoğun bakım skorlama sisteminin performansının ve yoğun bakım hasta popülasyonumuzda bu sistemlerin sonucu öngörebilme yetilerinin değerlendirilmesi amaçlanmıştır.

Yöntem:

Yoğun bakım ünitesinde 72 saat ve daha fazla yatan 200 hasta çalışmaya dahil edildi. APACHE II, SAPS II, LODS ve TRIOS orijinal metodolojilerinde tarif edildiği şekilde hesaplandı. Skorlama sistemlerince hesaplanan puanlardan, lojistik regresyon formülleri kullanılarak öngörülen mortalite oranı hesaplandı. Skorlama sistemlerinin performansları kalibrasyonlarının ve diskriminasyonlarının değerlendirilmesi ile test edildi.

Bulgular:

Her dört sistem için hesaplanan skorlar, ölen hastalarda istatistiksel olarak anlamlı derecede daha yüksektir (p<0.05). Gerçekleşen mortalite oranı %51'dir. Hesaplanan SMO değerleri; APACHE II için 1.30, SAPS II için 1.22, LODS için 1.05, TRIOS için 1.13'tür. "Hosmer- Lemeshow goodness of fit C" testinde her dört sistem için p>0.05'tir. "Receiver Operating Characteristic" eğrisi altında kalan alanlar her dört sistem için 0.8'in üzerindedir. Dört skorlama sistemi için de kalibrasyon kabul edilebilir olmakla birlikte, hiçbiri gerçekleşen mortaliteye tam olarak yaklaşamamışlardır. Dört skorlama sistemi için diskriminasyon iyidir. Her dört sistem, yaşayan ve ölen hastaları birbirinden ayırt edebilmiştir.

Sonuç:

Sistemler arasında belirgin bir farklılık gözlenmemiştir. Çalışma popülasyonunun, sistemlerin oluşturulduğu orijinal popülasyonlardan farklı olduğu, bunun da performansı etkileyen bir faktör olduğu göz önünde tutulmak şartıyla, incelenen dört skorlama sisteminden herhangi birinin yoğun bakım sonuçlarının değerlendirilmesinde kullanılmasının önerilebileceği görüşüne varılmıştır.

Anahtar Kelimeler: Skorlama sistemleri, mortalite, standardize mortalite orani

Giriş

Yoğun bakım tedavisinin dinamik bir süreç olması, hastaların tanılarının farklı ve hastalıklarının ciddiyet derecesinin değişken olması ve yandaş hastalıklarının bulunması nedeniyle belirli standardizasyonlara ihtiyaç duyulmuştur. Bu süreç içinde yapılan uygulamaların hastanın iyileşme şansına etkisi ve bu etkinliğin ölçülmesi, yoğun bakım sonuçlarının değerlendirilmesinde vazgeçilmez unsurlardır. Bu etkinliğin ölçülebilmesi için en sık kullanılan parametre mortalitedir. Mortalitenin değerlendirme amacıyla sık kullanılmasının nedeni, yoğun bakım hastalarının yüksek mortaliteye sahip olması, ölümün sensitif, uygun ve anlamlı bir parametre olmasıdır (1).

Mortalitenin birçok unsurdan etkilenmesi nedeniyle, yoğun bakım sonuçlarının değerlendirilmesinde parametre olarak kullanılabilmesi için belirli standardizasyonlara ihtiyaç duyulmaktadır. Bu nedenlerle yoğun bakım skorlama sistemleri geliştirilmiştir (2).

Skorlama sistemleri, organ fonksiyonlarını veya hastayı bir bütün olarak ele alarak, hastalığın ciddiyetinin değerlendirilmesini standardize etmek amacıyla geliştirilmişlerdir. Bu skorlamalar, hastanın veya hastalığın sonuçlarını etkileyecek bir seri değişkendeki anormallik derecesini puanlandırmaktadırlar. Puanlamalar ile hastalığın ciddiyeti ve mortalite tahmin edilmeye çalışılır (1). Elde edilen skorlar ile kritik hastalar gruplandırılabilir, birçok klinik durum için anlamlı bilgiler sağlanarak klinik uygulama yönlendirilebilir (3). Skorlama sistemlerinin kullanım amaçları içinde en önemlisi, mortalite riskinin öngörülmesidir. Mortalite riskini öngörmek için, elde edilen skorlar istatistiksel yöntemlerle 0 ile 1 arasında değişen olasılıklara çevrilirler (4).

Birçok kullanım amacı ve tipi olan skorlama sistemlerinin yoğun bakımın değerlendirilmesi ve mortalite riskinin en iyi şekilde öngörülebilmesi için, doğru skorlama sisteminin kullanılması gerekir. Doğru skorlama sisteminin anlamı, sistemin geliştirildiği çevre dışında kullanıldığında, değerlendirilecek toplum için sistemin performansının ortaya konması ve en iyi performans gösteren sistemin kullanılmasıdır. Ancak performansının iyi olduğu gösterilmiş yoğun bakım skorlama sistemi kullanılarak elde edilen bilgilerle doğru yorumlar yapılabilir, değerlendirmeler ve karşılaştırmalar yorumlanabilir (3,4).

Bu nedenlerle, çalışmamızda dört ayrı yoğun bakım skorlama sisteminin performansını değerlendirerek, hasta popülasyonumuz ile uygunluklarını incelemeyi amaçladık.


Gereç ve Yöntem

Bu çalışmaya, İstanbul Üniversitesi Cerrahpaşa Tıp Fakültesi 4079 numaralı, 04.03.2004 tarihli etik kurul onayı alındıktan sonra, yoğun bakım ünitesinde bir yıllık süre içinde 72 saat ve daha fazla yatmış olan 200 hasta dahil edildi. Çalışma prospektif olarak yapıldı. 16 yaşından küçük çocuklar, yanık hastaları, beyin ölümü olan ve 72 saatten daha az süre ile yatmış hastalar çalışma dışı bırakıldı. Bu süre içinde yoğun bakım ünitesine bir defadan fazla yatan hastalar, sadece ilk girişlerinde çalışmaya dahil edildi.

APACHE II, SAPS II, LODS orijinal yöntemlerinde tarif edildiği şekilde (5,6,7) ilk 24 saatte en kötü değerler dikkate alınarak hesaplandı. TRIOS (8) hesaplanması için, yönteminde tarif edildiği şekilde, 48. ve 72. saatlerde SAPS II ve LODS hesaplandı. Bu hesaplamalar yapılırken, parametrelerin o gün için en kötü değerleri dikkate alındı. Tüm veriler standardizasyon sağlamak amacıyla tek bir kişi tarafından kaydedildi.

Glasgow Koma Skalası (GKS), sedatize olmayan hastalar için en iyi değer, sedatize olanlar için sedasyon öncesi GKS değeri kullanıldı. Entübe hastalar için verbal yanıt, hastanın anlayabilme kapasitesi göz önüne alınarak değerlendirildi. Yoğun bakıma ameliyathaneden gelen hastalarda, anestezi etkisi ortadan kalktıktan sonra GKS değerlendirildi. Elde edilen demografik veriler, "Student's t testi" ve " Ki-kare testi" kullanılarak karşılaştırıldı.

Gerçekleşen mortalite, ölen hasta sayısının toplam hasta sayısına bölünmesiyle hesaplandı. Skorlama sistemlerince hesaplanan puanlardan, lojistik regresyon formülleri kullanılarak öngörülen mortalite oranı hesaplandı.

Standardize mortalite oranı (SMO), gerçekleşen mortalitenin öngörülen mortaliteye bölünmesiyle hesaplandı.

Sistemlerin performansı kalibrasyon ve diskriminasyon ile test edildi. Kalibrasyon Hosmer-Lemeshow goodness-of-fit C istatistiği (9) ile, diskriminasyon klasifikasyon matrisleri ve ROC eğrileri ile değerlendirildi.

Tüm istatistiksel hesaplamalar SPSS ver 10.0 ve ROC eğrilerinin hesaplanması için özel olarak hazırlanmış bir Excel dosyası ile yapıldı.


Bulgular

Belirlenen zaman aralığında yoğun bakım ünitesine 832 hasta yatmış olup, toplam 200 hasta çalışmaya dahil edilmiştir. Hastalar yaşayanlar (n=98) ve ölenler (n=102) şeklinde gruplandırılmıştır Hastaların demografik özellikleri ve yatış süreleri Tablo 1'de verilmiştir. Hastaların %56'sı medikal nedenlerle yoğun bakım ünitesine başvurmuştur ve en yüksek ölüm oranı (%67) bu hastalarda görülmektedir. Acil operasyon nedeni ile başvuru %16, mortalite %37, elektif operasyon nedeni ile başvuru %28, mortaliteleri %25'tir En sık görülen dört yatış tanısı sırasıyla, akut solunum yetersizliği (%31), sepsis (%29), postoperatif takip (%19) ve subaraknoidal kanamadır (%5).

APACHE II, SAPS II, LODS ve TRIOS skorları (Tablo 2) ölen hastalarda istatistiksel olarak anlamlı derecede daha yüksektir (p<0,05). Her iki grup bir arada değerlendirildiğinde, ortalama APACHE II 20.97±7.70; SAPS II 48.26±17.82; LODS 8.29±2.96 ve TRIOS %44.82±26.88 olarak hesaplanmıştır

Gerçekleşen mortalite oranı %51'dir. Değerlendirilen dört yoğun bakım skorlama sisteminin öngördüğü mortalite oranları ve gerçekleşen mortalitenin öngörülen mortaliteye bölünmesi ile hesaplanan standardize mortalite oranları Tablo 3'te verilmiştir. Her bir skorlama sisteminin öngördüğü mortalite birbirinden farklıdır. En yüksek SMO, APACHE II ile hesaplanmıştır.

Kalibrasyon eğrileri değerlendirildiğinde (Şekil 1,2,3,4), dört sistem arasında beklenen mortalite için çizilen ideal eğriden sapma en çok APACHE II' de görülmektedir. APACHE II; düşük mortalite risklerinde, beklenen mortaliteye yakın mortalite değerleri verirken, orta ve yüksek mortalite risklerinde beklenenden yüksek mortalite değerleri vermektedir. SAPS II, APACHE II'ye benzer şekilde kalibrasyon eğrisi çizmektedir. TRIOS, düşük mortalite risklerinde beklenenden daha az mortaliteyi öngörürken, orta ve yüksek mortalite risklerinde beklenenden yüksek değerler vermektedir. LODS'ta, düşük ve orta mortalite risklerinde ideal eğriden sapma daha azdır, beklenene yakın mortalite değerleri gözlenmektedir. Yüksek mortalite risklerinde, beklenenden fazla mortalite gözlenmektedir.

Skorlama sistemlerinin diskriminasyon gücünün değerlendirmesi için duyarlılık ve özgüllük hesaplanmış (Tablo 4) ve ROC eğrileri (Şekil 5) çizilmiştir. Bu değerler %50 öngörülen mortalite eşik değer kabul edilerek hesaplanmıştır En yüksek duyarlılık (0,82) ve özgüllük (0,80) TROIS'da izlenmektedir. ROC eğrisi altında kalan alanlar; APACHE II 0.80±0.03, SAPS II 0.84±0.02, LODS 0.79±0.03, TRIOS 0.90±0.02 olarak hesaplanmıştır.


Tartışma

Yoğun bakım üniteleri; heterojen hasta popülasyonuna sahip, mortaliteleri yüksek, birimlerdir. Yoğun bakıma yatışlarının ilk 24 saatinde yapılan mortalite tahmini yoğun bakım hekimi tarafından hasta prognozunun tartışılması, araştırmacıların hastaları sınıflaması gibi konularda önemlidir (10).

Genel skorlama sistemlerinden olan APACHE II ve SAPS II, içinde Türkiye'den yoğun bakım ünitesi bulunmayan 12 yoğun bakım ünitesinden toplanan veriler doğrultusunda geliştirilmişlerdir (11). Bu nedenle, ilk olarak skorlama sistemlerinin Türk hasta popülasyonuna uygunluklarının gösterilmesi gerekmektedir. Çalışmamızda, APACHE II, SAPS II, LODS ve TRIOS skorlama sistemlerinin hasta popülasyonumuz için uygunluklarını değerlendirdik.

Gerçekleşen mortalite oranı %51'dir, literatürde belirtilen%17 ile %36 arasında değişen mortalite oranlarından yüksektir (12,13). Medikal hasta grubu, hasta popülasyonumuzun %56'sını oluşturmaktadır ve en yüksek mortalite medikal nedenle yatan hastalarda izlenmektedir (%67). Medikal hasta oranımız, APACHE II'nin (%47) (14) ve SAPS II'nin (%48) (10) geliştirildikleri hasta popülasyonundaki medikal hasta oranlarından fazladır. Çolpan ve ark. (15) YBÜ'de mortalitede rol oynayan risk faktörlerini inceledikleri çalışmalarında, %46.7 gerçekleşen mortalite bildirmişlerdir. Ortalama APACHE II 12.8'dir. Medikal nedenlerle yatanlarda mortalite %53.2, cerrahi nedenlerle yatanlarda mortalite %46.8'dir. Mortalitelerinin yüksek olmasını, hasta popülasyonlarında travma, intraabdominal sorunlar ve ciddi nörolojik hastalıklarının oranlarının fazla olmasına bağlamışlardır.

Literatürde, değişik hasta popülasyonları için APACHE II ve SAPS II ortalama değerleri sırasıyla 11.83 ile 24.67 ve 30.25 ile 46.97 arasında değişmektedir (16). Bizim skorlarımızın ortalama değerleri, literatürde bildirilenlerden yüksektir. Bunun nedeni, hasta popülasyonumuzun skorlama sistemlerinin geliştirildiği hasta popülasyonuna ve yayınlanmış ortalama skorlara göre daha yüksek ortalama skorlara sahip medikal nedenle yatan hasta içermesidir. Yapılan birçok çalışmada, ölen hastalarda hesaplanan skorların daha yüksek olduğu ve bunun istatistiksel olarak anlamlı olduğu gösterilmiştir (13,15,17,18). Bu çalışmada da, hesaplanan skorlar ölen hastalarda anlamlı derecede daha yüksektir. Hesaplanan skoraların ölen hastalarda daha yüksek olması, bu skorlama sistemlerinin hastalık ağırlığını ve ciddiyetini doğru olarak değerlendirdiğini göstermektedir

Metnitz ve ark. (19) yaptığı 13 yoğun bakım ünitesinin dahil edildiği çalışmalarında, SMO değerleri 0.62 ile 1.54 arasında değişmektedir. Medikal nedenlerle yatan hasta oranı daha fazla olan yoğın bakım ünitelerinde daha yüksek SMO değerleri gözlemlemişlerdir. Bu nedenle medikal nedenle yatan hastası daha yüksek oranda olan bir ünitedede, öngörülen mortalitenin ve SMO'nın daha yüksek olacağını söylemişlerdir. Standardize mortalite oranlarının üniteninnin etkinliğinin değerlendirilmesi için kullanılacağında, karşılaştırılacak ünitelerin hasta popülasyonlarının alt gruplarının benzer ve kullanılan skorlama sisteminin o popülasyon için kalibrasyonunun kabul edilebilir olması gerektiğini ileri sürmüşlerdir. Vosylius ve ark.'nın (20), SAPS II'nin performansının değerlendirdikleri çalışmalarında, SMO 1.28 olarak hesaplamış, yaş ve cinsiyetin SMO'nını etkilemediği, ancak medikal nedenlerle yatan hastalarda SMO 1.52 olarak hesaplanmış ve yatış nedeninin SMO'nı etkilediğini göstermişlerdir. Çalışmamızda her dört skorlama sistemi için hesaplanan yüksek SMO değerlerinin, hasta popülasyonumuzda medikal hasta oranının fazla ve bu hastalarda mortalitenin daha yüksek olmasına bağlamaktayız.

Skorlama sistemlerinin performansları birçok çalışma ile test edilmiştir. Performans değerlendirilmesinde öncelikle sistemin kalibrasyonunun iyi olması gerektiği, diskriminasyonun ikincil olarak değerlendirilmesinin uygun olduğu söylenmektedir (21). Bazı çalışmalarda, incelenen sistemlerin kalibrasyonlarının iyi (11,14,17,21,22), bazılarında ise yetersiz olduğu vurgulanmıştır (12,13,23-26). Kalibrasyonun iyi olmasına rağmen mortaliteyi doğru tahmin edemediği, genellikle gerçekleşen mortalitenin öngörülenden yüksek olduğunu belirten çalışmalar da vardır (14,17,21). Kalibrasyonun yetersiz kalmasının, hastaları yatış nedenleri ve yoğun bakım öncesi nerede yattıkları, kalibrasyon metodolojisine, veri toplanmasında gözlemciler arasındaki farklara, Glasgow Koma Skalası değerlendirilmesindeki ve hasta popülasyonunundaki farklılıklara, tıbbi tedaviler arasındaki değişkenliklere, incelenen popülasyondaki hasta sayısının yetersizliğine bağlı olabileceğini söyleyen çalışmalar mevcuttur (11-14,21,24).

Tüm skorlama sistemleri için kalibrasyon kabul edilebilir değerlerde olmakla birlikte, hiçbiri gerçekleşen mortaliteyi tam olarak belirleyememiştir. En iyi kalibrasyon eğrisi LODS'ta izlenmektedir. LODS'ta, düşük ve orta mortalite risklerinde ideal eğriden sapma daha azdır, gerçekleşene yakın mortalite değerleri gözlenmektedir. Receiver Operating Characteristics eğrisi altında kalan alan hepsi için 0.8'in üzerindedir, her dört sistem, yaşayan ve ölen hastaları birbirinden ayırt edebilmiştir. Diskriminasyonu en iyi olan TRIOS'tur. (ROC eğrisi altında kalan alan 0.90) En yüksek duyarlılık ve özgüllük TRIOS'ta izlenmektedir. Bunun nedeninin, bu skorlama sisteminin 72 saatlik zaman dilimindeki değişiklikleri yansıtmasından kaynaklandığını düşünmekteyiz.

Performansını değerlendirdiğimiz dört skorlama sistemi için duyarlılık değerleri, literatürde belirtilen duyarlılık değerlerinden oldukça yüksektir. Hasta sayımızın az olması nedeniyle, her bir mortalite aralığına düşen hasta sayısı azdır, istatistiksel anlamlılık gözlenmemiştir ve bunun sonucunda duyarlılık değerlerimiz yüksek bulunmuştur Sonuç olarak , sistemler arasında belirgin bir farklılık gözlenmemiştir. Çalışma popülasyonunun, sistemlerin oluşturulduğu orijinal popülasyonlardan farklı oldukları, bunun da performansı etkileyen bir faktör olduğu göz önünde tutulmak şartıyla incelenen dört skorlama sisteminden herhangi birinin yoğun bakım sonuçlarının değerlendirilmesinde kullanılmasının önerilebileceği görüşüne varılmıştır.


1.    Gunning K, Rowan K. ABC of intensive care: outcome data and scoring systems. BMJ 1999;319:241-4.
2.    Ridley S. Outcomes in critical care.2nd edition.Oxford: Butterworth-Heinemann. 28-82.
3.    Ridley S. Severity of illness scoring systems and performance appraisal. Anaesthesia 1998;53:1185-94.
4.    Ridley s. Uncertainty and scoring systems. Anaesthesia 2002;57:761-7.
5.    Knaus WA, Draper EA, Wagner DP Zimmerman JE. APACHE II: a severity of disease classification system. Crit Care Med 1985;13:818-29.
6.    Le Gall JR, Lemeshow S, Saulnier F A new Simplified Acute Physiology Score (SAPS II) based on a European/North American multicenter study. JAMA 1993;270:2957-63.
7.    Le Gall JR, Klar J, Lemeshow S, et al. The Logistic Organ Dysfunction system. A new way to assess organ dysfunction in the intensive care unit. ICU Scoring Group. ICU Scoring Group. JAMA 1996;276:802-10.
8.    Timsit JF Fosse JP Troche G, et al. Accuracy of a composite score using daily SAPS II and LOD scores for predicting hospital mortality in ICU patients hospitalized for more than 72 h. Intensive Care Med 2001;27:1012-21.
9.    Hosmer DW, Lemeshow S. Applied Logistic Regression 2nd edition. New York, NY: John Wiley & Sons; 1989.
10.    Balcı C, Sungurtekin H, Gürses E, Sungurtekin U. Septik ve nonseptik hastalarda APACHE II, APACHE III, SOFA skorlama sistemleri, trombosit düzeyleri ve mortalite. Ulusal Travma Acil Cerrahi Derg 2005;11:29-34.
11.    Katsaragakis S, Papadimitropoulos K, Antonakis P Strergiopoulos S, Konstadoulakis MM, Androulakis G. Comparison of Acute Physiology and Chronic Health Evaluation II (APACHE II) and Simplified Acute Physiology Score II (SAPS II) scoring systems in a single Greek intensive care unit. Crit Care Med 2000;28:426-432.
12.    Chiavone PA, Sens YA. Evaluation of APACHE II system among intensive care patients at a teaching hospital. Sao Paulo Med J 2003;121:53-57.
13.    Beck DH, Smith GB, Pappachan JV, Millar B. External validation of the SAPS II, APACHE II and APACHE III prognostic models in South England: a multicentre study. Intensive Care Med 2003;29:249-56.
14.    Capuzzo M, Valpondi V, Sgarbi A, et al. Validation of severity scoring systems SAPS II and APACHE II in a single-center population. Intensive Care Med 2000;26:1779-85.
15.    Colpan A, Akinci E, Erbay A, Balaban N, Bodur H. Evaluation of risk factors for mortality in intensive care units: a prospective study from a referral hospital in Turkey. Am J Infect Control 2005;33:42-7.
16.    Moreno R, Morais P Outcome prediction in intensive care: results of a prospective, multicentre, Portuguese study. Intensive Care Med 1997;23:177-86.
17.    Markgraf R, Deutschinoff G, Pientka L, Scholten T. Comparison of acute physiology and chronic health evaluations II and III and simplified acute physiology score II: a prospective cohort study evaluating these methods to predict outcome in a German interdisciplinary intensive care unit. Crit Care Med 2000;28:26-33.
18.    Carson SS, Bach PB. Predicting mortality in patients suffering from prolonged critical illness: an assessment of four severity-of-illness measures. Chest 2001;120:928-33.
19.    Metnitz PG, Lang T, Vesely H, Valentin A, Le Gall JR. Ratios of observed to expected mortality are affected by differences in case mix and quality of care. Intesive Care Med 2000;26:1466-72.
20.    Vosylius S, Sipylaite J, Ivaskevicius J. Evaluation of intensive care unit performance in Lithuania using the SAPS II system. Eur J Anaesthesiol 2004;21:619-24.
21.    Livingston BM, MacKirdy FN, Howie JC, Jones R, Norrie JD. Assessment of the performance of five intensive care scoring models within a large Scottish database. Crit Care Med 2000;28:1820-27.
22.    Schellongowski P Benesch M, Lang T , et al. Comparison of three severity scores for critically ill cancer patients. Intensive Care Med 2004;30:430-6.
23.    Moreno R, Morais P Outcome prediction in intensive care: results of a prospective, multicentre, Portuguese study. Intensive Care Med 1997;23:177-86.
24.    Arabi Y, Haddad S, Goraj R, Al-Shimemeri A, Al-Malik S. Assessment of performance of four mortality prediction systems in a Saudi Arabian intensive care unit. Critical Care 2001;6:166-74.
25.    Metnitz PG, Valentin A, Vesely H, et al. Prognostic performance and customization of the SAPS II: results of a multicenter Austrian study. Simplified Acute Physiology Score. Intensive Care Med 1999;25:192-7.
26.    Metnitz PG, Lang T, Valentin A, Steltzer H, Krenn CG, Le Gall JR. Evaluation of the logistic organ dysfunction system for the assessment of organ dysfunction and mortality in critically ill patients. Intensive Care Med 2001;27:992-8.
27.    Özbilgin Ş, Demirağ K, Sargın A, Uyar Mehmet,Moral ARl. Yoğun Bakımda Kullanılan Skorlama Sistemlerinin Mortalite Tahminindeki Rolleri Açısından Karşılaştırılması. Türk Yoğun Bakım Derneği Dergisi 2011;9:8-13.