בקורס "סטטיסטיקה לתלמידי מדעי החברה א'" לימדו אותי, אני לא זוכר בדיוק למה, אבל לימדו אותי שמשום מה, מדגם של פחות מ-30 אנשים הוא לא אמין, ובמחקר צריך

hrpbiiapnrpeltework

Well-known member
מדגם של לפחות 30 אנשים ומעלה. צריך לפחות 30 דוגמאות ומעלה.

אבל בחיי היום-יום, ובאופן כללי, כשמישהו רוצה להוכיח משהו, מה שנהוג זה להביא 3 דוגמאות שונות. מה זה אומר? האם זה אומר שזה לא אמין? האם זה אומר שלא ניתן לסמוך על זה? האם כשרוצים להוכיח נקודה, כדי באמת להוכיח אותה צריך להביא לפחות 30 דוגמאות אחרת זה לא נחשב ולא באמת הוכחת שום דבר?
 

uzi2

Active member
בהקשר הזה אין מספר קסם של 30.
אם אתה רוצה לבדוק האם מטבע מסוים מוטה לצד מסוים, אז אם זרקת 30 פעמים וקיבלת ב- 17 מהם פלי, וב- 13 עץ, צריך מדגם יותר גדול כדי לקבוע אם יש הטייה או לא, אבל אם קיבלת בכל ה- 30 פלי, אז אפשר לקבוע בוודאות שיש הטייה כיוון שהסבירות שזה יצא באקראי היא זניחה.
התשובה לשאלה עד כמה (לא האם אלא עד כמה) מדגם בגודל מסוים מספיק, קשורה גם לתוצאות שמתקבלות. מה שחשוב זה גודל האפקט, והוא מושפע גם מגודל המדגם אך לא רק. כמובן אפשר להוכיח ששיטה א' יעילה יותר משיטה ב' ברמת וודאות מאוד מאוד גבוהה, אך ההבדל ביעילות עדיין לא יהיה משמעותי, כך שהדברים יותר מורכבים.

המספר 30, זכור לי כ-"מספר קסם" בהקשר של ההבדל בין סיגמה-n לסיגמה (n-1) (הסטייה הממוצעת מהממוצע במדגם, אל מול הסטייה הממוצעת מהערך "האמיתי". שם הערך 30 הוא ערך ריאלי והוא נבחר בשל היותו ריאלי, וכן מספר עגול (היה אפשר לבחור 33, אבל בחרו במספר עגול).

השאלה השנייה שחשוב להבין בהקשר של מה שכתבת זה למה אתה קורא אמין. הרבה פעמים אני רואה שמתייחסים בביטול למחקרים שלא נעשו בתנאי Gold standard (כלומר קבוצת ביקורת וקבוצת בדיקה שנבחרו באקראי, ומחקר שבוצע בסמיות כפולה, וכדומה). מחקרים כאלו שבהם גם יש מיצוע על גורמים אחרים שמשפיעים. הם בדרך כלל מחקרים רחבי היקף והם נועדו להוכיח או להפריך.
אבל בין הוכחה להפרכה יש הרבה באמצע. מחקר שמוכיח (טענה מסוימת) הוא מחקר שתוצאותיו משאירות סיכויים זניחים בלבד שהטענה שגויה. מחקר שמפריך הוא מחקר שתוצאותיו משאירות סיכוי זניח שהטענה נכונה. אבל בחיים שלנו אנחנו כל הזמן מקבלים החלטות בתנאי אי וודאות, ושם מעניין אותנו לא רק הוכחות או הפרכות, אלא ראיות. ראייה מחזקת = הראיה שמגדילה את הסיכוי של הטענה להיות נכונה. ראייה מחלישה=ראייה שמקטינה את הסיכוי.
בסופו של דבר אנחנו אמורים לשקול סיכונים מול סיכויים בכל אחת מהאופציות ולקבל החלטה בתנאי אי וודאות, ואז כל מחקר - גם עם סטטיסטיקה נמוכה ושאינו עומד בתנאי תקן הזהב, יכול לעזור בקבלת ההחלטות. גם מחקר קורלטיבי (וקורלציה לא מראה בהכרח על כיוון סיבתיות) מהווה ראיה לסיבתיות, ואפשר להוכיח את זה מתמטית. השאלה עד כמה היא חזקה תלויה בפרטים הקטנים.

לגבי העניין של 3 דוגמאות (חיי היום יום שהזכרת) - כאן צריך מאוד להיזהר מראיות אנקדוטליות. כל הזמן אנשים רגילים עושים את הטעות הזאת, הפוקוס שלהם הוא על ראיות שמחזקות את האמונה שלהם (אפקט האישוש/כשל האישוש/הטיית האישוש/confirmation bias) ואז הם ימצאו עוד ועוד דוגמאות שמחזקות את הטענה שלהם (והעולם שלנו מספיק גדול כך שנמצא ראיות אנקדוטליות לכמעט כל טענה כללית שאנו מאמינים בה).
אין שום קושי להביא דוגמאות ל-לא שלושה, אלא הרבה יותר יהודים (בוודאי כמה מאות) שרצחו. אם אתחיל לתת כאן דוגמאות - לא אסיים. האם זה מוכיח שהיהודים הם רוצחים? כאשר אנשים מאמינים שהיהודים הם רוצחים, הם ישימו לב במיוחד לדיווחים על יהודים שרצחו, (אפקט הפוקוס כמו שדניאל כהנמן קרא לזה), ואז זה יראה להם כתופעה רגילה שגרתית אצל יהודים. זה קיים בכל האוכלוסיות.

בסופו של דבר כל מחקר יש להבין על כל הפרטים שרשומים בו - גם הפרטים הכי קטנים, כמו איך נבחר המדגם.
 

hrpbiiapnrpeltework

Well-known member
בהקשר הזה אין מספר קסם של 30.
אם אתה רוצה לבדוק האם מטבע מסוים מוטה לצד מסוים, אז אם זרקת 30 פעמים וקיבלת ב- 17 מהם פלי, וב- 13 עץ, צריך מדגם יותר גדול כדי לקבוע אם יש הטייה או לא, אבל אם קיבלת בכל ה- 30 פלי, אז אפשר לקבוע בוודאות שיש הטייה כיוון שהסבירות שזה יצא באקראי היא זניחה.
התשובה לשאלה עד כמה (לא האם אלא עד כמה) מדגם בגודל מסוים מספיק, קשורה גם לתוצאות שמתקבלות. מה שחשוב זה גודל האפקט, והוא מושפע גם מגודל המדגם אך לא רק. כמובן אפשר להוכיח ששיטה א' יעילה יותר משיטה ב' ברמת וודאות מאוד מאוד גבוהה, אך ההבדל ביעילות עדיין לא יהיה משמעותי, כך שהדברים יותר מורכבים.

המספר 30, זכור לי כ-"מספר קסם" בהקשר של ההבדל בין סיגמה-n לסיגמה (n-1) (הסטייה הממוצעת מהממוצע במדגם, אל מול הסטייה הממוצעת מהערך "האמיתי". שם הערך 30 הוא ערך ריאלי והוא נבחר בשל היותו ריאלי, וכן מספר עגול (היה אפשר לבחור 33, אבל בחרו במספר עגול).

השאלה השנייה שחשוב להבין בהקשר של מה שכתבת זה למה אתה קורא אמין. הרבה פעמים אני רואה שמתייחסים בביטול למחקרים שלא נעשו בתנאי Gold standard (כלומר קבוצת ביקורת וקבוצת בדיקה שנבחרו באקראי, ומחקר שבוצע בסמיות כפולה, וכדומה). מחקרים כאלו שבהם גם יש מיצוע על גורמים אחרים שמשפיעים. הם בדרך כלל מחקרים רחבי היקף והם נועדו להוכיח או להפריך.
אבל בין הוכחה להפרכה יש הרבה באמצע. מחקר שמוכיח (טענה מסוימת) הוא מחקר שתוצאותיו משאירות סיכויים זניחים בלבד שהטענה שגויה. מחקר שמפריך הוא מחקר שתוצאותיו משאירות סיכוי זניח שהטענה נכונה. אבל בחיים שלנו אנחנו כל הזמן מקבלים החלטות בתנאי אי וודאות, ושם מעניין אותנו לא רק הוכחות או הפרכות, אלא ראיות. ראייה מחזקת = הראיה שמגדילה את הסיכוי של הטענה להיות נכונה. ראייה מחלישה=ראייה שמקטינה את הסיכוי.
בסופו של דבר אנחנו אמורים לשקול סיכונים מול סיכויים בכל אחת מהאופציות ולקבל החלטה בתנאי אי וודאות, ואז כל מחקר - גם עם סטטיסטיקה נמוכה ושאינו עומד בתנאי תקן הזהב, יכול לעזור בקבלת ההחלטות. גם מחקר קורלטיבי (וקורלציה לא מראה בהכרח על כיוון סיבתיות) מהווה ראיה לסיבתיות, ואפשר להוכיח את זה מתמטית. השאלה עד כמה היא חזקה תלויה בפרטים הקטנים.

לגבי העניין של 3 דוגמאות (חיי היום יום שהזכרת) - כאן צריך מאוד להיזהר מראיות אנקדוטליות. כל הזמן אנשים רגילים עושים את הטעות הזאת, הפוקוס שלהם הוא על ראיות שמחזקות את האמונה שלהם (אפקט האישוש/כשל האישוש/הטיית האישוש/confirmation bias) ואז הם ימצאו עוד ועוד דוגמאות שמחזקות את הטענה שלהם (והעולם שלנו מספיק גדול כך שנמצא ראיות אנקדוטליות לכמעט כל טענה כללית שאנו מאמינים בה).
אין שום קושי להביא דוגמאות ל-לא שלושה, אלא הרבה יותר יהודים (בוודאי כמה מאות) שרצחו. אם אתחיל לתת כאן דוגמאות - לא אסיים. האם זה מוכיח שהיהודים הם רוצחים? כאשר אנשים מאמינים שהיהודים הם רוצחים, הם ישימו לב במיוחד לדיווחים על יהודים שרצחו, (אפקט הפוקוס כמו שדניאל כהנמן קרא לזה), ואז זה יראה להם כתופעה רגילה שגרתית אצל יהודים. זה קיים בכל האוכלוסיות.

בסופו של דבר כל מחקר יש להבין על כל הפרטים שרשומים בו - גם הפרטים הכי קטנים, כמו איך נבחר המדגם.
קודם כל, טוב לראות אותך איתנו. אנחנו מעריכים אותך ואתה חסר לנו. מתי יהיו לך קצת פחות מחויבויות? אתה עומד לסיים איזשהם פרויקטים גדולים בקרוב כדי שאולי נזכה בעוד קצת מזמנך לעצמנו והדברים יוכלו לחזור להיות כמו פעם? ;)

מה בנוגע למחקר הגדול שלך על פסיכולוגיה עם השותפים מארצות הברית? זה קרוב לסיום?

לאחרונה פרסמתי כמה וכמה שרשורים מעניינים על מתמטיקה, פיזיקה ומדע, ואמנם מעולם לא למדתי את הנושאים האלו לעומקם ובצורה פורמאלית, אבל אתה מכיר אותי, אני חכם ויש לי ראש טוב על הכתפיים, אז בכל זאת יש מה להעיף מבט ;)

בכל מקרה, ובאשר לתגובתך, קודם כל, רב תודות על התגובה המלומדת והמושקעת. הדבר העיקרי שאני לוקח מתגובתך הוא שהעניין של כמה דוגמאות צריך זה דבר שמשתנה ממקרה למקרה ושאין אפילו טעם שאטרח לנסות לחשוב על זה. כתבתי ביני לבין עצמי כל מיני תיאוריות וצירפתי דוגמאות, ויכול להיות שלא מספיק, אבל בעיקרון, וכאשר יגיע הזמן הנכון, אקח מישהו שמבין ויודע מה הוא עושה והוא כבר יעשה לי סדר בראש ויגיד לי כמה דוגמאות צריך עבור כל מקרה.
 
למעלה