מונחים בסיסיים באפידמיולוגיה וסטטיסטיקה
ארגז כלים לחוקר ברפואת המשפחה
מאת ד"ר טומי ספנסר, פרופסור דורון חרמוני, פרופסור מרגלית גולדפרכט, פרופסור שמואל רייס
ארגז כלים לחוקר ברפואת המשפחה | ||
---|---|---|
שם המחבר | ד"ר שמואל גבעון | |
שם הפרק | מונחים בסיסיים באפידמיולוגיה וסטטיסטיקה | |
ערך זה נמצא בבדיקה ועריכה על ידי מערכת ויקירפואה, וייתכן כי הוא לא ערוך ומוגה.
היסטוריה של המחקר הקליני
המחקר הקליני הראשון שתועד אי פעם בהיסטוריה מופיע בפרק א' בספר דניאל. (ראו בויקיטקסט)
כשהיהודים הוגלו לבבל, 10 נערים מתוכם נלקחו לחצר המלך נבוכדנצר ומונה עליהם שר להשגיח על כל מחסורם. רצו לתת להם את המזון הכי משובח – פת בג המלך, אבל דניאל ביקש מהשר הממונה לקבל גרגירים וזרעונים במקום המזון הזה (כנראה בגלל שמירה על כשרות). השר חשש לחייו והיסס למלא את בקשתו, אבל דניאל התעקש והציע לשר לתת להם את מבוקשם ולהשוות אותם לקבוצת נערים אחרת שהמשיכה לאכול מפת-בג המלך, ואכן כך נעשה. אחרי 10 ימים מראם היה טוב ונאה והכל בא על מקומו בשלום.
המחקר הקליני הראשון בהיסטוריה המודרנית מיוחס לד"ר ג'יימס לינד (1716–1794) שהיה רופא בצי הבריטי. במשך שנות דור, צפדינה (SCURVY) חיסלה כמחצית מיורדי הים. ד"ר לינד ביקש לבדוק השערה שהועלתה אז שחומר כלשהו בפירות הדר עשוי למנוע היווצרות המחלה.
הוא חילק את המלחים באניית הוד מלכותו "סליסבורי" לארבע קבוצות, כשאחת מהן קבלה מדי יום פרי הדר והשאר קבלו מזונות שונים. אחרי מסע של 6 שבועות בים הסתבר שאלה שאכלו פרי הדר לא חלו בצפדינה. הוא פרסם בשנת 1763 את התוצאות בעיתון רפואי, אבל לקח לצי הבריטי 40 שנים עד שאימצו את הרעיון ומאז הייתה פקודת קבע בצי שכל מלח חייב לאכול כל יום פרי הדר. זה הוביל לכינוי של מלחי הצי הבריטי שתקף עד היום: LYMEES.
לא ידעו אז דבר על ויטמינים אבל התובנה של ד"ר לינד שינתה את ההיסטוריה. (אגב: פרי ההדר שהועמס לאוניה הספיק רק ל 6 ימים, אבל זה הספיק למניעת התפתחות המחלה).
כמאה שנה לאחר מכן, בשנת 1954, הייתה מגפה קשה של כולירה בלונדון. ד"ר ג'ון סנואו (1813–1858), מהאבות המייסדים של מדע האפידמיולוגיה, שם לב שבצד אחד של רחוב מסוים בלונדון -Broadwick Street, היו הרבה חולים, בעוד שבצד האחר שלו לא חלו. הוא בדק את הנושא ומצא שהצד של הרחוב בו חלו רבים מהתושבים קיבל את המים שלו מנהר התמזה סמוך למוצא הביוב, בעוד שבצד הרחוב בו לא חלו, המים הגיעו ממקום מרוחק בנהר.
בלי לדעת דבר על חיידקים בכלל ועל חיידקי כולרה בפרט, הוא הציע לסגור את המשאבה ששאבה מים סמוך למוצא הביוב והמגפה פסקה. יש פאב על שמו ברחוב הזה.
תהליך המחקר
מחקר של תופעה לא מוכרת מתחיל לרוב בדיווחי מקרים – CASE REPORT.
בתחילת שנות השמונים של המאה העשרים החלו להופיע בספרות הרפואית דיווחים ספורדיים על מחלה שעד אז לא הייתה מוכרת לאנושות, שהתבטאה בפגיעה אימונית קשה, דלקת ריאות שנגרמה על ידי מחולל נדיר וסרטן ע"ש קפושי באזורים לא אופייניים, והובילה לתמותה מהירה.
ביולי 1982 המרכז לבקרת מחלות האמריקאי (CDC) פרסם לראשונה מחקר חתך שבדק את השכיחות של התופעה, שלא היה ידוע עליה כלום באותה תקופה.
- האפידמיולוגים מבדילים בין 3 סוגי שכיחות
- שכיחות עכשיו – POINT PREVALENCE: כמה מקרים של תופעה/מחלה יש כרגע. דוגמה: השכיחות של סוכרת (למשל) באוכלוסייה בישראל היא כ 8%
- שכיחות בשנה – ONE YEAR PREVALENCE: כמה מקרים של תופעה יש בשנה
- שכיחות לאורך החיים – LIFE TIME PREVALENCE: מה הסיכוי/סיכון של כל אחד ואחת מאתנו ללקות בבעיה כלשהי במהלך חיינו. הדוגמה הקלאסית היא עמותת "אחת מתשע": אחת מתשע (מדובר אפילו על אחת משמונה) נשים ישראליות תחלה בסרטן השד במהלך חייה
ברירת המחדל, כשכתוב "שכיחות" בלי ציון נוסף, היא שכיחות עכשיו.
השלב הבא במחקר הוא ברור הסיבה לתופעה. זה נעשה במחקר רטרוספקטיבי.
תחילה, יש צורך לבדוק את ההיסטוריה של התופעה: ללכת אחורה בזמן כדי לברר מה משותף לחולים ולא קיים אצל בריאים עם מאפיינים דומים. במילים אחרות: לקחת אנמנזה מקיפה, עד כמה שאפשר אחורה בזמן, כולל אפילו להיריון של האם.
למשל: דיאתילסטילבסטרול, שנרשם לנשים בהיריון במשך שנים, גרם בהמשך לבעיות פוריות וסוגים שונים של סרטן אצל הבנות שלהן. היה צורך לברר אצל הבנות את ההיסטוריה הרפואית עד תקופת ההיריון של האימהות שלהן כדי לאתר את הגורם.
כך גם, חשיפה לאזבסט או סיליקון גורמת למזותליומה כעבור 20–30 שנים. אם לא ניקח מידע מקיף מהמטופלים מספיק זמן לאחור, לא נאתר את הגורם.
במקרה של AIDS, אנמנזה מקיפה העלתה גורם משותף לכל החולים: כולם (בתחילת המגפה) היו הומוסקסואלים.
מחקר רטרוספקטיבי יכול להיות משני סוגים:
- מחקר מקרה/בקרה - CASE CONTROL: לכל "מקרה" (חולה כלשהו) יש אדם בריא שמשמש לבקרה
- מחקר מקרה בלבד - CASE SERIES: מדובר בחולים בלבד, ללא בקרה
במקרה שאנחנו דנים בו, לקחו את כל החולים (שהיו כולם גברים ושחלקם נפטרו במהלך הברור) והשוו אותם לקבוצת גברים "בריאים" (ייתכן שהיו בהם גם הומוסקסואלים, שחלקם נשאו כבר את המחלה, אבל לא היו להם סימנים אופייניים בזמן הבדיקה). הסתבר שכל החולים היו הומוסקסואלים, בעוד שבקבוצת הביקורת היו (אם בכלל) הומוסקסואלים אקראיים.
מחקר רטרוספקטיבי נותן לנו חיזוק לאפשרות של קשר = ASSOCIATION בין תופעות שונות ואנו גוזרים ממנו מדד סטטיסטי מאד חשוב: יחס צולב = ODDS RATIO.
השלב הבא הוא לבחון האם הקשר בין התופעה וההסבר האפשרי שמצאנו במחקר רטרוספקטיבי הוא אכן אמיתי ומבוסס.
לצורך זה מבצעים מחקר פרוספקטיבי.
- מחקר פרוספקטיבי יכול להיות מכמה סוגים
- מחקר התבוננות – OBSERVATIONAL STUDY: אנחנו עוקבים אחרי אוכלוסייה מסוימת, בדרך כלל קבוצה מוגדרת, המכונה COHORT (ע"ש הפלוגות הרומיות שהיו מתקדמות בשורות צפופות מוקפות מגינים) ובודקים התרחשות של תופעות שונות בקרבה. מחקרים מפורסמים בקבוצה הזאת הם FRAMINGHAM STUDY; NURSE STUDY; WHI.
- במחקר פרמינגהם, שהחל כבר בשנות הארבעים, התמקדו בעיירה בשם זה, ששוכנת לא רחוק מבוסטון (בחרו בה בכוונה, משום שתושביה היו רובם ממעמד ה"צווארון הכחול" שאינם נוטים לשנות את מקום מגוריהם חדשות לבקרים) והחלו למדוד לחץ דם, כולסטרול וכדומה. מהמחקר הזה למדנו מהם הערכים הנורמליים של אותם מדדים, והוא עדיין נמשך.
- מחקר האחיות הוסיף לנו מידע על סרטן השד.
- מחקר WHI זכור לרע בגלל השם הרע שהוציא לטיפול ההורמונלי החליפי.
- בדוגמה שלנו, כדי לאשר את הקשר בין הומוסקסואליות והמחלה שעדיין לא ידוע עליה הרבה, נוכל לקחת קבוצת גברים הומוסקסואליים בריאים (לכאורה, כי ייתכן שחלקם כבר נושאים את הווירוס אבל אז עוד לא ידעו שתקופת הדגירה עלולה להימשך 10 שנים) ובעדיפות לקחת גם קבוצת גברים הטרוסקסואליים בריאים, לעקוב אחרי קדימה בזמן במהלך תקופה ולבדוק את ההיארעות של אותן התופעות החמורות בשתי הקבוצות כדי לוודא שאכן הומוסקסואליות (נכון לאותה תקופה) היא הגורם לתופעה.
- מחקר התערבות – INTERVENTIONAL STUDY: אנחנו מתערבים בצורה זו או אחרת – תרופה, טיפול כלשהו או חשיפה לגורם זה או אחר, ובודקים לאורך זמן מה קרה עם האוכלוסייה שנחשפה. גם כאן עדיף לעשות את המחקר הזה בשתי קבוצות מקבילות: אחת שנחשפת להתערבות, תהיה אשר תהיה, ואחת שלא נחשפת. עוקבים לאורך זמן אחרי שתי הקבוצות ובודקים האם יש הבדל בהתרחשות של נושא שמעניין אותנו בין שתי הקבוצות.
- מחקר התערבות מתחלק גם הוא למספר סוגים
- מחקר פתוח: כבר בשנים הראשונות של המאה העשרים שמו כמה רופאי שיניים לב לתופעה בה השיניים של ילידים באזורים מסוימים במערב ארצות הברית היו מוכתמים מאד. הם החלו לעקוב אחריהם בניסיון להבין מה גורם לתופעה זו. תוך כדי מעקב הם נוכחו שיש לאותם ילידים הרבה פחות עששת בהשוואה לקבוצה אחרת של אוכלוסייה. במשך עשרות שנים ניסו אותם רופאים להבין מה גורם לתופעה, עד ש"עלו" על העובדה שהמים שאותם ילידים שותים מכילים פלואור בכמות גדולה. לאור זאת, בשנת 1945 ערך ד"ר דין, רופא שיניים את ההתערבות הפתוחה המפורסמת, בעיר GRAND RAPIDS במישיגן הוחלט בהשפעתו להוסיף פלואור למי השתייה, ואחרי מעקב של 15 שנים נצפתה ירידה של 60% בעששת בקרב הילדים של אותה עיר.
- מחקר "סגור": לא תמיד יש אפשרות לערוך מחקרים בסדר גודל כזה שתואר לעיל. לרוב אנו צריכים להסתפק באוכלוסייה מצומצמת וקיים חשש להשפעות חיצוניות על התוצאות. כדי למנוע עד כמה שאפשר השפעות חיצוניות על תוצאות המחקר הפרוספקטיבי, ניתן לנקוט באחת משלוש האפשרויות:
- מחקר שהוא סמוי בודד – SINGLE BLIND: המטופל לא יודע מה הוא מקבל (תרופה, טיפול וכדומה) ורק המטפל יודע
- מחקר סמוי כפולות – DOUBLE BLIND: לא החוקר ולא הנחקר יודעים מי מקבל טיפול ומי מקבל טיפול/תרופת דמה
- מחקר סמוי משולש – TRIPLE BLIND: לא החוקר, לא הנחקר ולא מי שמחלק את התרופה יודעים מי מקבל תרופה ומי מקבל כדור דמה (למשל). רק גורם חיצוני, שאינו מעורב ישירות במחקר, "מחזיק את המפתח" ויודע לפענח את התוצאות.
- כל זאת כדי למנוע הטיה –BIAS של החוקר, שרוצה להראות הצלחה, ושל הנחקר, שרוצה לרצות את החוקר.
סוג ספציפי של מחקר סמוי כפולות או משולש הוא מחקר קליני: אותן המגבלות חלות גם עליו, אבל נוספות עוד שתי מגבלות:
- קביעה מראש של מועד הסיום
- הקצאה אקראית של הנחקרים לקבוצת ההתערבות (שמקבלת תרופה, טיפול וכדומה) ולקבוצת הביקורת (שמקבלת טיפול דמה)
הערה: ניתן לראות שהתיאור בספר דניאל והמחקר של ד"ר לינד עומדים בקריטריונים של מחקר קליני: נקבעה קבוצת התערבות וקבוצת ביקורת ונקבע מראש מועד סיום (10 ימים במקרה של דניאל וששה שבועות במקרה של ד"ר לינד).
תת מחקר פרוספקטיבי הוא מחקר היסטורי-פרוספקטיבי. בדרך כלל, מחקר פרוספקטיבי מתחיל מהיום או מתאריך עתידי כלשהו ואילך. במקרה הזה, אם אנחנו יודעים בדיוק את מועד החשיפה, מותר לנו לחשב היארעות החל מרגע החשיפה ואילך, גם אם היא אירעה בעבר. לדוגמה - אסון צ'רנוביל אירע ב – 26 באפריל 1986 לפנות בוקר. לאור העובדה שאנחנו יודעים בדיוק את מועד החשיפה, מותר לנו מבחינה טכנית ומדעית לחשב היארעות של סרטן בלוטת התריס, לויקמיות וכדומה באוכלוסייה שנחשפה לקרינה החל מאותו תאריך ואילך, ולאו דווקא החל מעתה ואילך. מאגר המידע העצום והנרחב שיש לשירותי בריאות כללית (וגם למכבי, בין השאר), מאפשר ביצוע של מחקרים כאלה על כל האוכלוסייה של כללית (למשל), כי אנחנו יודעים בוודאות את תאריכי האירועים/אספקת תרופות וכדומה, ואנחנו יכולים להתחיל אותם אפילו משנת 2004 ואילך (המאגר נחשב מושלם החל משנה זאת ואילך), מה שמהווה קפיצת מדרגה, בהשוואה לתקופה שקדמה לכך מבחינת המידע שניתן להפיק.
מחקר פרוספקטיבי חשוב במיוחד, כי הוא מאפשר לנו לאשר את הקשר שמצאנו במחקר רטרוספקטיבי: הוא מאשר CAUSATION כלומר: ניתן לומר בוודאות שהמשתנה הנבדק אכן גורם למחלה/תופעה וכדומה.
מחקר פרוספקטיבי מאפשר לנו לחשב ערך חיוני ביותר: היארעות = INCIDENCE: מספר מקרים חדשים בשנה של התופעה הנחקרת (זאת לעומת שכיחות בשנה, שם לא מדובר במקרים חדשים).
מהערך החיוני הזה אנחנו ממשיכים לחשב כמה ערכים חיוניים:
- סיכון יחסי = RELATIVE RISK (RR) = INCIDENCE EXPOSED/INCIDENCE NON EXPOSED או במילים אחרות: ההיארעות (מספר המקרים החדשים בשנה) של התופעה שאנחנו חוקרים בקבוצת ההתערבות חלקי ההיארעות שלה בקבוצת הביקורת.
- התוצאה יכולה להיות 1, אם ההיארעות של התופעה שווה בשתי הקבוצות, או קטנה מ 1 אם ההיארעות קטנה יותר בקבוצת ההתערבות (פחות תמותה או מחלה, למשל) או גדולה ממנו, אם ההיארעות בקבוצת ההתערבות גדולה יותר מזו של קבוצת הביקורת
- ההפחתה בסיכון היחסי = RELATIVE RISK REDUCTION (RRR), שהנוסחה שלה 1-RR ולרוב מבטאים אותה באחוזים – 100-RR. זה הערך שתועמלניות התרופות נוהגות להציג לנו: 60% ירידה בשברים אוסטאופורוטיים בעזרת טיפול ב PROLIA, למשל.
- ההפחתה האבסולוטית בסיכון = ABSOLUTE RISK REDUCTION (ARR) = INCIDENCE EXPOSED-INCIDENCE NON EXPOSED - מספר המקרים החדשים בקבוצת ההתערבות פחות מספר המקרים החדשים בקבוצת הביקורת
- מהערך ARR אנחנו גוזרים ערך חשוב נוסף: NUMBER NEEDED TO TREAT = NNT שהנוסחה שלו: 1/ARR: כמה אנשים יקבלו (למשל) תרופה להורדת לחץ דם כדי שאחד מהם לא יפתח אירוע לבבי במהלך 10 שנים (במקרה הזה – 13)
הערה: נציגות חברות התרופות מציגות תמיד את הירידה בסיכון היחסי – RRR, שעושה לרוב רושם רב. ירידה של 68% בסיכון לשבר בצוואר הירך עקב שימוש בפרוליה, לדוגמה, היא אכן מאד מרשימה. אבל כשמעיינים היטב בנתונים, מסתבר שמדובר בהיארעות של שברים בשיעור של 1.2% בקבוצת הביקורת ושל 0.7% בקבוצה שטופלה בפרוליה. זו אכן ירידה של 68% אבל הירידה המוחלטת בסיכון - ARR היא 0.5 ובחישוב מהיר, מספר המטופלות שצריכות לקבל פרוליה כדי שאחת מהן (לרוב אלה נשים שסובלות מהמחלה) לא תשבור את צוואר הירך הוא 200. (FREEDOM TRIAL). לכן זה נשמע ונראה אחרת: ראשית, שיעור השברים בקבוצת הביקורת הוא 1.2% וזה כבר מצביע על בעיה נדירה, יחסית. שנית, האם יש באמת היגיון לתת זריקת פרוליה ל -200 נשים כדי למנוע שבר אצל אחת מהן, כשהעלות של כל טיפול היא 1170$? זה כבר נושא לוויכוח (אגב – מטה אנליזה שפורסמה במאי 2019 מצאה שכנראה אין תועלת בהזרקת פרוליה בהשוואה לפלצבו [1]
מחקר מצא ש NNT של הורדת כולסטרול כמניעה ראשונית הוא 400. חישוב מהיר לאחור מוצא שההפרש בין קבוצת הטיפול וקבוצת המעקב הוא רבע אחוז בלבד.
מסקנה: צריך תמיד לבדוק את הנתונים המלאים של המחקר כדי להתרשם מיעילות הטיפול המוצע ולא להתרשם מהנתונים המרשימים, אבל חלקיים, שהתועמלניות מציגות.
לא זאת בלבד, אלא יש תמיד צורך לחשב גם את מספר האנשים שייפגעו מהטיפול/תרופה – NNH = NUMBER NEEDED TO HARM. אם נחזור להשתמש בדוגמה של טיפול בסטטינים להורדת כולסטרול, ידוע שהם מעלים את הסיכון להתפתחות סוכרת בשיעור של 40-70% (תלוי במאמרים) ולפחות 15% מהמטופלים מפתחים כאבי שרירים ובמקרים נדירים מתפתחת פגיעה שרירית חמורה. טיפול בפרוליה עלול גם הוא לגרום נזקים, בעיקר עליה בזיהומים, אבל הסיכון נמוך - (11·5 and 14·4 per 100 participant-years).7.
יש אתר רשמי של NNT ואפשר למצוא שם נתונים לגבי תרופות וטיפולים שונים, שכדאי מאד להכיר ולהשתמש בו כדי לקבל החלטות מושכלות לרישום טיפולים ותרופות.
הסתייגויות לביצוע מחקרים פרוספקטיביים
- מגבלות אתיות: וועדת הלסינקי לא תתיר למנוע טיפול מחולים. דהיינו: אם נרצה לבדוק השפעה של תרופה על סוכרת, למשל, לא נוכל למנוע טיפול מקבוצת הביקורת ולתת אותו רק לתקופת ההתערבות. לכן, מבצעים לרוב מחקרים שמוכיחים שתרופה חדשה לסוכרת לא פחות טובה מתרופה מוכרת, מה שנקרא non inferiority.
- וועדת הלסיקי לא תתיר גם לנסות תרופה או גורם כלשהו שידוע (או חשוד) שהוא מזיק. בעבר עשו בבתי הכלא בארצות הברית ניסויים בהם חשפו את האסירים לחומרים מסוכנים, קרינה וכו', שבזמננו לא יעלה על הדעת בכלל להציע מחקרים כאלה
- מגבלה של שכיחות של התופעה: אם המחלה/תופעה מאד נדירה, אין סיכוי סביר לבצע מחקר פרוספקטיבי. לדוגמה: הסיכוי של רופא משפחה שיש לו פרקטיקה של 1500 נפשות לראות מקרה חדש (היארעות) של פניל-קטונוריה (PKU) הוא אחת ל 300 שנים (ציטוט מחוברת שכתב פרופ' מיכאל וינגרטן לפני עשרות שנים). ברור שאין אפשרות לעשות מחקר פרוספקטיבי במקרה כזה
- בעיות לוגיסטיות: מחקר פרוספקטיבי, בעיקר מחקר קליני, מאד יקר ומסובך לביצוע, ולכן רוב המחקרים האלה נעשים (או ממומנים) על ידי חברות תרופות
לאור המגבלות האלה, ניתן תמיד להסתמך במידה רבה של ודאות על תוצאות של מחקרים רטרוספקטיביים, כי אותם ניתן תמיד לבצע, בהסתייגויות שונות, כפי שנראה להלן: יש לנו תמיד מקרים של מחלה כלשהי באוכלוסייה, גם אם היא נדירה, ואנחנו יכולים תמיד ללכת אחורה בזמן כדי לבדוק קשר בין סיבה ומסובב אפשריים לגבי אותה מחלה.
מבחינה סטטיסטית, היחס הצולב שאנחנו יכולים לחשב ממחקר רטרוספקטיבי מקורב לסיכון היחסי שמחושב ממחקר פרוספקטיבי ב 0.93, כך שבהיעדר אפשרות לבצע מחקר פרוספקטיבי, ניתן להסתמך על מחקר רטרוספקטיבי במידה מספיק טובה של מהימנות.
רווח בר-סמך - CONFIDENCE INTERVAL
רוב המחקרים מבוצעים על מדגמים של אוכלוסייה, ולא על כלל האוכלוסייה. לפיכך, יש תמיד חשש שהמשתתפים במחקר אינם מייצגים את כלל האוכלוסייה. יש לכן צורך לסייג את התוצאות של הסיכון היחסי – RR (ממחקר פרוספקטיבי) או היחס הצולב - OR (ממחקר רטרוספקטיבי). לכן מוסיפים ליד התוצאות של המשתנים האלה את המונח המכונה רווח בר-סמך = CONFIDENCE INTERVAL. הוחלט באופן שרירותי לחלוטין שניתן לקבל מרווח טעות של עד 5% בממצאים ולכן צריך תמיד להוסיף הערה ליד החישוב של הסיכון היחסי או היחס הצולב בצורה הבאה (הקשה על הספרות הכחולות מאפשרת כניסה למאמרים עצמם), אם נמשיך להשתמש בדוגמה של פרוליה:
A meta-analysis3 published in 2014 examined the safety of denosumab in 15,263 postmenopausal women from 13 trials with documented osteoporosis who were followed between 9 months to 3 years after initiation of therapy. This meta-analysis found a non-significant reduction in the risk of non-vertebral fractures with the administration of denosumab (RR: 0.86, 95%CI, 0.74 - 1.00; ARD: 0.83%; NNT 121). The meta-analysis found the difference in incidence of death or neoplasm to be non-significant. However, a non-statistically significant difference in rates of infection (RR: 1.23, 95%CI, 1.00 - 1.52; ARD: 0.60%; NNH 167) was seen.2
בלי להיכנס להסברים מסובכים, כל עוד הטווח של הרווח בר-סמך לא מכיל בתוכו את המספר 1, ניתן לומר שההבדל בין קבוצת הביקורת לקבוצת המחקר הוא משמעותי סטטיסטית. ברגע שהוא מכיל בתוכו את המספר 1, הרי גם אם מדובר על הבדל של 23% (כמו בדוגמה למטה) בין הקבוצות, הכלל קובע שבמקרה כזה אין הבדל משמעותי סטטיסטית בין הקבוצות. כמה דוגמאות מאותו המאמר על פרוליה לצורך ההסבר:
Relative risk [RR]: 0.32, 95% confidence interval [CI], 0.26 - 0.41];
כאן הרווח בר-סמך לא כולל 1 בתוכו ולכן ההבדל הוא משמעותי.
RR: 1.23, 95%CI, 1.00 - 1.52; ARD: 0.60%
כאן הרווח כן כולל 1 בתוכו ולכן ההפרש של 23% אינו משמעותי סטטיסטית. כך גם לגבי
RR: 0.86, 95%CI, 0.74 - 1.00;
מאידך, אם נראה (למשל) RR: 1.5, 95%CI 1.1-3.4 הרי שכאן ההבדל הוא כן משמעותי, כי הרווח בר-סמך לא מכיל את המספר 1 בתוכו. כך גם לגבי RR:0.7, 95%CI 0.5-0.95
כך גם לגבי ODDS RATIO – תמיד צריך לדרוש ולבדוק את הרווח בר-סמך ליד הנתון שמופיע ולוודא שהמספר 1 לא מופיע ברווח הזה. אם הוא כן מופיע, הרי שגם אם ההפרש באחוזים בין קבוצת ההתערבות וקבוצת הביקורת נראה מרשים, מבחינה סטטיסטית הוא אינו משמעותי.
- כל המחקרים באשר הם חשופים להטיות. יש סוגים שונים של הטיות
- הטיה של הזכרות – RECALL BIAS: החולים זוכרים את השתלשלות המקרה יותר טוב מקבוצת הביקורת. פתרון: מדדים אובייקטיביים, שאינם מסתמכים על זיכרון, או קבוצת ביקורת שיש לה סיכוי דומה לזכור את האירועים
- הטיה של זיכרון – MEMORY = SUBJECTIVE BIAS: אנשים זוכרים מאורעות קרובים טוב יותר ממאורעות רחוקים, ועלולים לדווח על שכיחות גבוהה יותר לגבי אירועים מהעבר הקרוב. לאנשים חולים יש גם נטייה להגזים בחשיבות של דברים מסויימים וליחס להם בטעות את הסיבה למחלתם (למשל: חולות בסרטן השד עלולות ליחס את מחלתן לחבלה שספגו בחזה)
- הטיה של ראיון – INTERVIEW BIAS: המראיינים מציגים את השאלות בצורה שונה לחולים ולקבוצת הביקורת. הפתרון: לאמן את צוות המראיינים או שאדם אחד מראיין את כולם
- הטיה של בחירה – SELECTION BIAS: לבחור לקבוצת המחקר מטופלים של רופאים פרטיים, למשל. או לבחור מטופלים במחלה מסוימת מבי"ח אחד ולקבוצת הביקורת – חולים ממחלקה שונה. מחלקה המטולוגית, למשל, עשויה לרכז חולים מכמה מחוזות בעוד שמחלקה אורתופדית מרכזת חולים רק מהמחוז הקרוב, כך שהאוכלוסיות המאושפזות לא בהכרח דומות
- הטיה ע"ש ברקסון – BERKSONIAN BIAS: זה סוג של הטיה של בחירה. האנשים הנכללים בקבוצת המחקר שונים מאלו שבקבוצת הביקורת. למשל: החולים בבי"ח שונים מהבריאים, או אפילו החולים בקהילה. כ"כ – אנשים שבאים לבקש טיפול שונים מאלה שלא מגיעים.
- הטיה של המוסד – INSTITUTIONAL BIAS: אם בוחרים חולים מבי"ח מסוים, יש סיכוי שחולים מסוימים לא ייכללו, מכיוון שהם מעדיפים להתאשפז בבי"ח אחד למחלה א' ובבי"ח אחר למחלה ב', למשל
- הטיה של הערכה מוטעית של המשתנה (לגבי משתנים רציפים): המכשירים שבודקים כולסטרול, למשל, יכולים לתת תשובות השונות ב 10-15 מ"ג אחד מהשני, וזה משפיע על התוצאות
- הטיה של טכנולוגיה: אם הגילוי של מחלה מסוימת מחייב טכנולוגיה שאינה מצויה כל מקום, זה משפיע על התוצאות. יש יחס ישיר בין מספר הרופאים ובתי החולים באזור מסוים ובין כמות המחלות המתגלה באזור. כך גם לגבי הימצאותה של טכנולוגיה מסוימת, כמו MRI
- הטיה של שירותי בריאות: ביצוע בדיקות בתת קבוצות מסוימות של האוכלוסייה הנחשבות בסיכון גבוה לחלות במחלה מסוימת, כמו HIV. אם בודקים רק גברים רווקים בגילאים 25-40 שנים הגרים באזורים מסוימים, הם בהכרח שונים מכלל האוכלוסייה
- הטיה של היעדר תשובה (NON RESPONSE BIAS): אנשים המעדיפים לא להשתתף או לא לענות הם לעתים שונים במאפיינים מסוימים מאלה שמשתתפים ועונים לשאלונים
- הטיה של המתבונן – OBSERVER BIAS: אם המתבונן או המראיין יודע שלנשאל יש מחלה מסוימת, הוא עלול באופן לא מודע ליחס לחולה תכונות מסוימות, שעלולות להימצא יותר אצל החולים מאשר אצל קבוצת הביקורת, למרות שבפועל אין זה נכון
- הטיה של דגימה – SAMPLING BI: אם הדגימה נעשית בצורה לא אקראית. למשל – בוחרים רק את אלה שקל למצוא אותם, או בוחרים באופן סיסטמטי כל אדם עשירי ברשימה, למשל, והרשימה עלולה להיות מורכבת בצורה מחזורית. הבחירה הזאת תגרום להטיה של התוצאות עקב מדגם לא מייצג
- הטיה של משתתפים – PARTICIAPNT BIAS: אם המשתתפים בקבוצת המחקר או הביקורת יודעים על הסיבות למחקר, זה עלול לגרום להם לדווח יתר על תסמינים שוליים, שאינם קשורים בהכרח למחלה הנבדקת
- הטיה של זמן מטעה – LEAD TIME BIAS: האם גילוי מוקדם של מחלה משפר באמת את ההישרדות, או שמא הוא רק מאריך את התקופה בין גילוי התופעה והמוות. היום ניתן לגלות ממאירות הרבה יותר מוקדם מבעבר בעזרת מכשור מתקדם ובדיקות חדישות, אבל יתכן בהחלט שאנחנו אכן מגלים אותה מוקדם יותר, הופכים את האדם לחולה ומטפלים בו - על כל הכרוך בזה -יותר שנים, אבל בפועל לא משפיעים אפילו ביום אחד על ההישרדות שלו ורק מאריכים את הסבל שלו
- הטיה של נושרים – DROPUOT BIAS: אלה שאינם ממשיכים במעקב עלולים להיות שונים מאלה הממשיכים להשתתף במחקר. מתקנים את התופעה הזאת בעזרת ניתוח של "הכוונה לטפל" – INTENTION TO TREAT ANALYSIS. גם בניסוים הקליניים הטובים ביותר יש נשירה של חלק מהמשתתפים. בשיטה של ניתוח עם "הכוונה לטפל" נלקחים בחשבון גם אלה שנשרו כאילו סיימו את המחקר. זה אמנם עלול להפחית את הסיכוי למצוא הבדלים משמעותיים בין הקבוצות אבל מפחית את הסיכון להצביע על הצלחה של הטיפול/תרופה שאין לו הצדקה ממשית
ערפלן – CONFOUNDER: זה נושא שלא תמיד שמים לב אליו וחייבים להימנע מכך: קיים משתנה חיצוני בלתי תלוי שמשפיע הן על המשתנה התלוי והן על המשתנה הבלתי תלוי שאנו בודקים. הוא יכול למסך או להגביר את השפעתו של המשתנה שאנו מעוניינים לבדוק. אנחנו לא ערים לקיומו של הערפלן ועלולים להגיע לתוצאות מוטעות. השפעתו של ערפלן כזה יכולה להתבטא בתוספת פשוטה לתוצאה, או אפילו בהכפלתה. יתרה מכך: לעתים קרובות, הערפלן הוא זה שגורם בפועל לשינוי, בעוד שאנחנו מייחסים את השינוי לגורם שהכנסנו (תרופה למשל). דוגמה: ידוע שאזבסט גורם למזותליומה. הסיכון היחסי של מי שנחשף לו לעומת אלה שלא נחשפו הוא פי 2.5 בערך. במחקרים מצאו סיכון יחסי של פי 10. הערפלן שם היה עישון. רוב אלה שעסקו באזבסט גם עישנו וזה הכפיל ושילש את הסיכון, אלא שהחוקרים לא היו מודעים לכך.
- יש סוגים שונים של ערפלנים
- שינויים פנימיים: רוב החולים בשפעת מבריאים מעצמם. אם לא ניקח זאת בחשבון כשנבחן את השפעה של תרופה כלשהי על השפעת, אנו עלולים ליחס לתרופה יעילות שבפועל אין לה
- סטייה מתמשכת – SECULAR DRIFT: שינויים ארוכי טווח שמתחוללים באזור, בקהילה או במדינה, יכולים למסך או להגביר את ההשפעה של התוכנית שהפעלנו ושאת יעילותה אנו בודקים. תכנית להקטנת הילודה באוכלוסייה שממילא יש לה נטייה בכיוון הזה בזמן עריכת הניסוי תיראה יעילה יותר מכפי שההיא באמת. תכנית לשיפור המגורים בשכונה מסוימת עשויה להיראות מוצלחת מאד, בעוד שבפועל יש פריחה כלכלית באזור, שהיא זאת שמאפשרת שיפור הדיור. מאידך, תכנית לשיפור היבולים באזור מסוים עלולה להיראות בלתי יעילה, וזאת רק משום שתנאי מזג אוויר קשים גרמו לחבלה והרס של היבול, שבתנאים אופטימליים היה אכן גדל משמעותית כתוצאה מהתכנית שהפעלנו.
- אירועים "מתערבים" – INTERFERING EVENTS: גם אירועים קצרי מועד יכולים למסך או להגביר את ההשפעה של פעולה שיזמנו ואנו בודקים. איום פתאומי במלחמה, למשל, יכול להגביר את ההשפעה של תכנית שיזמנו להגברת שיתוף הפעולה בין תושבים
- מגמת התבגרות – MATURATION TREND: תכנית שכוונתה ליצור שינוי מסוים בקבוצת גיל מוגדרת, עשויה לקבל תגבור או להיכשל רק משום שאותה קבוצת גיל עוברת "התבגרות" מסוימת בתקופת הניסון, שגוררת עמה שינוי עמדות טבעי
- בחירה בלתי מבוקרת – UNCONTROLLED SELECTION: אלו תהליכים שאינם בשליטתו של עורך המחקר, ואשר מובילים לכך שלאנשים בעלי תכונות מסוימות יש יותר סיכוי להשתתף במחקר מאשר לאחרים. למשל: אם אין לחוקר אפשרו לקבוע מי ייכלל או לא ייכלל במחקר. זהו אולי המבלבל הקשה ביותר לניטרול. למשל: אם רוצים לחקור אנשים שנרשמו לקורס להסבת מקצוע, ולא ניתן היה לקבוע מי ישתתף בו, יש לקחת בחשבון שמלכתחילה נרשמו לקורס אנשים עם מוטיבציה גבוהה יותר, וסביר להניח שהם שונים במאפיינים חשובות מאלה שלא נרשמו. מידת המוטיבציה היא הגורם המערפל במקרה הזה. זו תשפיע על מידת יכולתם למצוא עבודה בהמשך, ללא כל שייכות להשתלמות שעברו. אותו הגורם המערפל עובד בכיוון הפוך לגבי הנושרים מהקורס. לעתים קרובות קורה ש"גורם השחיקה" פועל כך שבקורס נשארים דווקא אלה שזקוקים לו הכי פחות, כיוון שממילא יש להם מוטיבציה גבוהה, ואלה מן הסתם יצליחו למצוא עבודה יותר מאחרים הודות לתוכנה זו, ולאו דווקא בזכות הקורס.
רגישות, סגוליות, ערך ניבוי
מחלה | בדיקה |
---|---|
FP | TP |
TN | FN |
SENSITIVITY = רגישות של בדיקה מוגדרת: TP\TP+FN
SPECIFICITY = סגוליות של בדיקה מוגדרת: TN\TN+FP
POSITIVE PREDICTIVE VALUE = ערך ניבוי חיובי של הבדיקה מוגדר TP\TP+FP
NEGATIVE PREDICTIVE VALUE = ערך ניבוי שלילי של הבדיקה מוגדר TN\TN+FN
בילביוגרפיה
- ↑ Am Fam Physician. 2019 May 1;99(9):online.).