כמה מלים על בלשנות חישובית
"בלשנות חישובית" היא שילוב של בלשנות עם מדעי המחשב. זהו ענף במדע העוסק בבניית תוכנות מחשב המבינות שפה טבעית (לא שפת תכנות) - בין אם מדובר בטקסט כתוב, ובין אם הכוונה לדיבור בקול. אחד השימושים הידועים יותר של הבלשנות החישובית הוא תוכנות לתרגום אוטומטי משפה לשפה. כולכם יודעים בוודאי שתוכנות כאלה מספקות בדרך כלל תרגום מלה במלה שאינו מוצלח במיוחד... יש סיפור מפורסם מאד על תוכנה שידעה לתרגם מאנגלית לרוסית ולהיפך. נתנו לה לתרגם את המשפט
The spirit is willing but the flesh is weak.
לרוסית, ואת מה שהתקבל הזינו מחדש לתוכנה ותרגמו מחדש לשפת המקור. אלא שהתוצאה היתה:
The vodka is strong but the meat is rotten.
לא מזמן קראתי שהסיפור הזה לא היה ולא נברא, ושזהו רק מיתוס מרושע. אך זה בכל זאת משעשע, גם אם זה לא נכון. בכל מקרה, נעשים הרבה מאמצים בשנים האחרונות בתחום זה. כמובן שקל יותר לתרגם בין שפות קרובות (למשל בין צרפתית לספרדית) מאשר בין שפות ממשפחות שונות לגמרי. כמו כן, אם מגבילים את תחום הפעולה של התוכנה למספר מצומצם של נושאים, אפשר להשיג תרגום ברמה טובה יותר: למשל (אם זכרוני אינו מטעני), קיימת תוכנת תרגום יפנית-גרמנית, שכל מטרתה היא לאפשר לדוברי השפות הללו לקבוע ביניהם מועד לפגישה עסקית. הבלשנות החישובית צריכה להתמודד לא רק עם התחביר אלא גם עם הסמנטיקה. דוגמה מפורסמת של נועם חומסקי היא המשפט
Colorless green ideas sleep furiously.
שהוא מושלם מבחינה דקדוקית, אך אין לו שום משמעות. כיצד ניתן לגרום למחשב להבדיל בין משפט משונה שכזה לבין משפט נורמלי, כמו
Toothless brown dogs bark loudly.
למשל? בבלשנות חישובית עברית יש גם בעיות שלא קיימות בשפות אחרות: כאשר אין ניקוד, לעיתים קרובות ניתן לקרוא צירוף אותיות מסויים בכמה דרכים. גם העובדה שמלות היחס מתחברות למלים יוצרת קושי. כיצד ידע המחשב לזהות את צירוף האותיות "שמנה", נניח? אנחנו מבינים לפי ההקשר, אך המחשב לא מבין את התוכן... איני מומחית לבלשנות חישובית, אך זה לדעתי תחום מחקר מרתק. אם מישהו יכול להמליץ על ספרים בנושא, אשמח לשמוע...