Specification biases

Khepera

New member
Specification biases

היי שוב - בעיה נוספת התרגום המילולי הוא דעות קדומות המובנות במפרט עצמו - ואתם רשאים לחלוק עלי ,כי אני לא ממש רואה שימוש לוגי בביטוי הזה - אבל אני לא מוצא שום הסבר מניח את הדעת באתרים מקצועיים מישהו נתקל בזה פעם?
 

Khepera

New member
אני שוב

Specifications The criteria for participants in a focus group, involving their demographic characteristics, product usage, product awareness, and so on. Bias A systematic tendency of a sample to misrepresent the population. Biases may be caused by improper representation of the population in the sample, interviewing techniques, wording of questions, data entry, etc. מצירוף של שניהם - אולי זה סטיית תקן?!
 

kirishiman

New member
bias במחקרים או בסטטיסטיקה זה לא

סטייה, ובוודאי לא סטיית תקן. הפירוש שלו הוא "הטייה", וזאת במובן של גורם כלשהו הגורם לתוצאות להיות מוטות בכיוון לא נכון או בלתי מייצג. פעמים רבות ישנם אמצעים מיוחדים-ספציפיים כיצד להתגבר על הטייה זו בניסוי או במידגם.
 

Khepera

New member
זה עוזר , אבל לא מקדם אותי לפיתרון

in another study , Gautschi explored the probable specification biases of conventional patronage אולי ההקשר יעזור?
 

gunger

New member
אני מסכימה

זה נשמע כמו מדגם מוטה. מדגם לא מייצג...
 

טרודי

New member
טעות/הטייה בהגדרת הבעיה

מצאתי בגוגל כמה התייחסויות, לצערי לא מאוד ברורות, למשל כמו זאת. בעקרון זה נראה שפירוש המושג הוא שלא לוקחים בחשבון משתנה בלתי-תלוי כלשהו. לדוגמא, ברפואה יש נטייה לערוך מחקרים וניסויים רק על גברים בריאים (מלבד המחלה שאותה חוקרים). להיות אשה נחשבת "מחלה" או מצב condition ש"רק מסבך" את המחקר... אז בודקים רק על גברים, מסיקים מסקנות מרחיקות לכת לגבי הקשר בין משתנה כלשהו (נניח, כמות של סידן בתזונה) לבין משתנה אחר (נניח, צפיפות עצם) - אבל כל המסקנות בכלל לא רלוונטיות לחצי מהאוכלוסיה, כי לא הכניסו למשוואה את רמת האסטרוגן בדם. מדי פעם גם רואים "מחקרים" שמתפרסמים בעיתונות הפופולרית ומראים דברים סנסציוניים (למשל, שלבישת חזיה מגבירה את הסיכון ללקות בסרטן השד), תוך התעלמות ממשתנים אחרים שיכולים להיות רלוונטיים (כמו העובדה שנשים בסביבה מערבית-מתועשת-מזוהמת לובשות חזיות הרבה יותר מנשים בסביבה כפרית-פרימטיבית-נקיה). המושג, specification bias מתייחס לעניין הזה: שאם לא הצבת את המשתנים הנכונים במשוואת הרגרסיה שלך (המשוואה שמחשבת מתאם בין דברים), אתה יכול לקבל תוצאות מוטות. לפחות, ככה הבנתי את זה. אבל איך קוראים לזה בעברית? כדאי לשאול סטטיסטיקאי.
 
../images/Emo6.gifדמה לי שהמונח המתאים כאן הוא

ייצוגיות המדגם או אולי הטיית ייצוגיות המדגם. ראו קישור (שקוצר בעזרת ה TINYURL עליו המליץ אלדד). ואפרופו המשתנה הסמוי שעליו דיברה טרודי: מכירים את המחקר שמצא שהנזק בשריפה גדל ככל שגדל מספר הכבאים המשתתפים בכיבויה?
 

טרודי

New member
דווקא הדוגמא שלך

מראה שזו לא בעיה במדגם. המדגם בסדר, מייצג את כל השריפות בצורה טובה מאוד. מה שעשו איתו, זה לא בסדר. הבעיה היא בשאלות שנשאלו, במשתנים שהוכנסו לכלים הסטטיסטיים. תאר לעצמך שמישהו היה עושה סקר פוליטי במדינת ישראל, והיה בוחר מדגם מייצג לגמרי של האוכלוסיה, אבל היה שוכח לשאול את העונים לגבי הדת ומידת הדתיות שלהם. אז הגורם הזה, שכידוע משפיע מאוד על הדעות הפוליטיות של תושבי מדינתנו, פשוט לא יופיע בתוצאות המחקר שלו. וזה אומר שכל מיני דברים שהיום אנחנו מקשרים בעיקר לדת (כמו הצבעה למפלגות ערביות, או אגודת ישראל, או מפד"ל, או שינוי), הוא יאלץ לקשר לדברים אחרים (רמת הכנסה? גודל ישוב? גודל משפחה? רמת השכלה? גיל?), ויגיע למסקנות מוזרות למדי. הבעיה היא שלא תמיד ברור מראש מהם הגורמים שצריך לקחת בחשבון, מה יכול להיות קשור לנושא המחקר. האם יש קשר בין הדעה הפוליטית של אדם לבין סוג המים שהוא שותה (ברז, מינרלים מבקבוק, מינרלים ממתקן, מטוהרים/מסוננים, לא שותה מים)? אולי כן. אולי לא. אם לא נשאל, איך נדע? מצד שני, יש גבול לכמה שאלות אנשים מוכנים לענות בסקר טיפוסי. ולכן ב-specification bias מדובר על ההטייה (bias) שבעצם הגדרת (specification) המחקר. ברגע שאמרת "אני חוקר את השפעת ציפרני החתול על גידול החסה בשטחים", ולא הכנסת למשוואות את הקרינה הקוסמית, אז יש לך הטייה מובנית שאומרת "הקרינה הקוסמית לא משנה לגידול החסה בשטחים. רק ציפורני החתול יכולות לשנות, ועד כמה - זה מה שאני בודק." ושוב: כל זה למיטב הבנתי, אבל אני לא סטטיסטיקאית.
 
מה שהבאתי הייתה בדיחה שנועדה

להדגים את הכשל שאת תיארת: התעלמות ממשתנה מסוים. במקרה של הבדיחה, הכשל נובע מן העובדה שהמשתנים הנחקרים אינם בלתי תלויים, אלא שניהם משתנים בגורם שלישי - גודל השריפה. ברור שככל שגודל השריפה יהיה יותר גדול, כן נזקיה יהיו גדולים יותר וגם מספר הכבאים המשתתפים יהיה גדול יותר. לגבי הבעיה הספציפית של ייצוגיות המדגם (הבעיה המקורית שהועלתה כאן) אני חושב שהכוונה לכך שמגדירים קריטריונים לקביעת המשתתפים, אבל הקריטריונים האלה סובלים מהטייה מסוימת, הגורמת לכך שהמדגם עליו עורכים את הניסוי איננו משקף נכונה את האוכלוסייה אותה הוא מתיימר לייצג. דוגמה לכך היא סקר דעת קהל המתבצע בשיטת משאל טלפוני. גם אם נניח שהוגדר הרכב מדויק של חלוקה לדתיים - חילוניים, יהודים . ערבים וכיו"ב, המדגם יהיה עדיין מוטה, כי הוא מייצג רק אוכלוסייה של בעלי טלפון - כלומר רמה סוציו-אקונומית מסוימת. כנ"ל אם אין מספיק ייצוג לדתיים, ערבים וכו'. אבל גם אני לא סטטיסטיקאי...
 

טרודי

New member
אה, אבל מה היתה הבעיה המקורית?

מישהו שאל על מושג. specification bias. האם specification bias היא "הטייה בייצוגיות המדגם"? למיטב הבנתי, לא. מדגם זה sample, מדגם מייצג הוא representative sample. הטייה בייצוגיות המדגם תהיה משהו בסגנון sampling bias או non-representative sample. ב-specification bias אין לא מדגם ולא מייצג. ולפי התיאורים שמצאתי ברשת, בפירוש לא מדובר על המדגם, אלא על משוואות הרגרסיה. כלומר, על הצבת או הגדרת הבעיה. זה יכול להביא לכך ש: - בוחרים מדגם לא מייצג, - בוחרים מדגם מייצג, אבל לא אוספים מידע רלוונטי לגביו, - בוחרים מדגם מייצג, ואוספים כל המידע החשוב, אבל לא מכניסים את המשתנים הנכונים לאותה משוואה ביחד אבל אני עדיין לא יודעת איך קוראים לזה בעברית.
 

Khepera

New member
הטייה בייצוגיות המדגם

הטקסט המקורי הוא על מישהו שחוקר שמבצע מחדש הערכה של המחקר בגלל שלא כללו בו שני גורמים שהם לדעתו קריטיים . לפי דעתי הטייה בייצוגיות המדגם כן יכול מאוד להתאים פה , כי גם אם זה לא מונח מקצועי (ואני כבר נואשתי מלמצוא אחד בעברית), הוא עדיין מסביר את המשמעות של העניין.
 

טרודי

New member
הוא בוחר מדגם חדש?

או רק לוקח בחשבון עוד נתונים לגבי המדגם הקיים? המדגם מייצג, או לא? לדוגמא: האם המדגם כלל רק גברים, או שהוא כלל גם גברים וגם נשים, אבל לא רשמו לגבי כל נבדק אם הוא גבר או אישה?
 

unordained

New member
bias

נתקלתי בבעיה הזו בעבר. אנשים העוסקים בתחום נוהגים להשתמש במלה "ביאס" (לא מ"לבאס" אלא מ bias") והתשובה המשעממת לשאלה (הלא משעממת) שלך זה שצריך לתרגם זאת ל"באיס בספציפיקציה". קצת יותר לעניין: האקדמיה תרגמה את המלה הזו בזמנו כ"נטאי", ואפילו נתקלתי בה פה ושם, אבל מעט מאוד. חשוב להדגיש שטעויות ב bias מצביעות קודם כל על בעיות הגדרת הנתונים, ולא על שגיאה בפעולה החישובית עצמה. זאת לא טעות בחשבון, אלא טעות במחשבה על איך "לפרמל" (להגדיר מבחינה פורמלית/מתמטית)את הנתונים של החישוב, והיא נובעת ממגוון סיבות, שרובן מתכנסות לצרות אופקים. ועל כך נאמר: Statistics cannot lie, but statisticians can
 
למעלה