כללי תיעתוק

primus2

New member
כללי תיעתוק

שלום, אני כותב תוכנה קטנה שמבצעת תיעתוק פונטי מערבית לעברית, הבעיה שאני לא יודע ערבית (אפילו לא אותיות) והתקדמתי כמה שיכולתי לבד. הכוונה לעשות שירות WEB חינם שיתרגם אתרים בערבית לעברית פונטית. (יעבוד כמו התרגום של גוגל) 1) האם יש איזה מסמך על כללי תיעתוק שאני יכול להבין מבלי לדעת ערבית? 2) מה התיעתוק לאותיות הללו: ء آ أ ؤ إ ئ ? האם הכל "א" או "ה" או צירוף כלשהו? 3) מה התיעתוק של غ? "גע"? התוכנה מקבלת מחרוזת בערבית ומחזירה מחרוזת בעברית פונטית. אני אשים כמה דוגמאות של מה שיצא לי ותגידו לי בבקשה מה אני צריך לתקן. اريحا - אריחא رام الله - ראמ אללח غزة - געזת نابلس - נאבלס قلقيلية - קלקילית عبد الرحمن عطيه عبد الرحمن القططي - עבד אלרחמנ עטיח עבד אלרחמנ אלקטטי (שם של מישהוא?) شركة الاتصالات الفلسطينية هاتف عمومي - שרקת אלאטצאלאט אלפלסטינית חאטפ עמומי شركة ألإتصالات الفلسطينيه - שרקת אלאטצאלאט אלפלסטיניח תודה מראש
 

yoavshovav

New member
תשובה

לגבי השאלה הראשונה- בכל מילון ערבי-עברי יש תעתיק. בויקיפדיה בטוח תמצא. לגבי השאלה השנייה- הכל א. אולי במקרים מסויימים תוכל להוסיף את הניקוד בערבית (אליף מדה למשל) כמו שמוסיפים "שדה" בתעתיק לעברית בחלק מהמילים. לגבי השאלה השלישית- התעתיק הוא לא "גע". האות غ מקבילה ל-(ג) בעברית. הבעיה כאן היא שברוב התעתיקים היא נכתבת כ-(ע'). כדי לא ליצור בלבול אתה יכול ליצור בתוכנה מקרא שמבהיר כי (ג) היא غ ו(ג') היא ج. אבל נראה לי שאם תתייחס ל-غ כ-(ע') זה גם יהיה נכון. שווה לשאול בפורום בלשנות כי יש שם מקצוענים. הבחנתי בבעיה. האות ة אמנם מוגדרת כ-(ת), אך לא בסמיכות. היא כמו ה' שותקת לציון נקבה בעברית. למשל: כלבת אשפתות(כלבה+אשפתות) . קיים מעבר בין ה' שותקת ל-ת בסמיכות וכך גם לגבי האות ة מבחינת הצליל, היא נכתבת אותו הדבר בשני המקרים, אך בתעתיק תצטרך להבחין בין שני המקרים- לעיתים ה' ולעיתים ת'.
 

primus2

New member
בסוף זה יהיה ב- PHP

אבל בינתיים אני משחק עם הקוד של התיעתוק ב-VB, יותר קל לדבג.
 
למעלה