סימנים דיאקריטיים בכתובות אינטרנט

Yarenn

New member
סימנים דיאקריטיים בכתובות אינטרנט

מה עושים בשפות שמשתמות באותיות לטיניות עם סימנים דיאקריטיים כשאי אפשר להשתמש בהן? למשל כשיש שם או מילה עם אותיות כאלה ורוצים לבחור לה כתובת אימייל או אתר ו׳ב?
 
תשובה

התשובה רלוונטית לכל תו שאינו בקוד ה-ASCII הבסיסי, כלומר גם תווים עם סימנים דיאקריטיים כמו é, וגם תווים עבריים, קיריליים, יווניים ועוד.

כתובת URL מחולקת לשם דומיין ולנתיב. לדוגמה, בכתובת הפורום http://www.tapuz.co.il/forums/forumpage/943 שם הדומיין הוא www.tapuz.co.il והנתיב הוא forums/forumpage/943

אם בנתיב יש תווים מיוחדים, משתמשים ב-URL encoding. ראה לדוגמה כתובות של מאמרים בוויקיפדיה העברית.
לדוגמה, הכתובת הבאה:
https://he.wikipedia.org/wiki/גד
היא הכתובת של המאמר "גד".
האות ג' מקודדת כ- %D7%92
האות ד' מקודדת כ- %D7%93

כדי להרגיש מה זה URL encoding, היכנס לאתר הבא, כתוב כמה תווים ולחץ על encode:
http://meyerweb.com/eric/tools/dencoder/

שמות דומיין עם תווים מיוחדים זה סיפור אחר לגמרי והרבה יותר מורכב. הנה מאמר בנושא: https://en.wikipedia.org/wiki/Internationalized_domain_name

אם הדפדפן נתקל בתו מיוחד בשם דומיין, הוא ממיר את הכתובת לכתובת אחרת לגמרי שמתחילה ב-xn. הנה כלי שבו אפשר לשחק עם ההמרות: https://www.afnic.fr/en/products-and-services/services/idn-convertor/

לדוגמה, שם הדומיין naïveté.co.il הוא בעצם xn--navet-fsa2b.co.il
 
ולגבי כתובות אימייל

גם כתובות אימייל יכולות להכיל תווים מיוחדים. הנה מידע בנושא: https://en.wikipedia.org/wiki/Email_address#Internationalization
&nbsp
מה שבא אחרי ה-@ הוא שם הדומיין והוא מטופל כפי שתיארתי לעיל.
מה שבא לפני ה-@ הוא על אחריות שרת הדוא"ל המקומי. כלומר, אם לדוגמה אני בוחר להקים שרת מייל בשם ilya.co.il וברצוני להקצות בו כתובת כמו איליה@ilya.co.il, זאת אחריות השרת שלי לדעת לטפל בכתובת הזאת ולהפנות את ההודעות לתיבה הנכונה.
אני לא יודע מה רמת התמיכה של שירותים כמו gmail הוא yahoo בתווים מיוחדים, אבל אפשר פשוט לנסות.
 

Yarenn

New member
את הדברים האלה אני דווקא יודע. אבל מה אנשים פשוטים בדרך כלל

עושים? איך הם בוחרים לכתוב את השם שלהם למשל במקר כזה? אם יש להם למשל š בשם?
 
אני מניח שכותבים אותו כמו שהוא. הרי אם כותבים בלי הסימן,

זאת יוצאת מילה אחרת שנשמעת אחרת.
 

Yarenn

New member
לא, אבל אי אפשר עם סימנים מיוחדים

סתומרת, להבנתי עד כה, הם כותבים את האות הבסיסית בלי הסימן. אבל אני תוהה אם כדאי לי לעשות ככה ולהיות עוד יותר לא ברור.
 
למעלה