פתרון רב משמעות של מילה (wsd)

פתרון רב משמעות של מילה (wsd)

שלום. אני לא ממש בטוחה שזה שייך לפה אבל ננסה. אם מישהו מכיר אני צריכה לכתוב אלגוריתם למידה ל word sense disambiguation, ואני מתלבטת בשאלה מהם ה features הרלוונטים למילה- האם המילים שבהקשר (במשפט)-( בלי התחשבות במרחק מהמילה הרב משמעית או עם התחשבות?) או רק הPOS המופיעים בהקשר. אשמח לתשובות/דעות...
 
על איזו שפה מדובר?

כיצד נראה הטקסט שלך? באיזה אלגוריתם סיווג את עושה שימוש?
 

טשאפק

New member
הדעת נותנת שהמרחק כן משנה

לעניין השני, התחשבות במילה המדויקת שבסביבת המילה אותה בודקים, ולא רק בחלק הדיבר, עלולה ליצור עומס כבד מדי אם מדובר בקורפוס (אוסף טקסטים) גדול, וגם תגרום לכך שהרבה מאד צירופים יופיעו במספר נמוך מדי מכדי ללמוד משהו מהותי.
 
למעלה