יום שני, 28 בנובמבר 2011

קידוד

קודם כל, קצת מידע על קידוד תווים.

בתחום המערכות - קידוד תווים מאפשר להציג כראוי תווים (במקרה שלנו - שפות) בדפדפן, לדוגמה עברית.
רוב המערכות כיום תומכות בקידוד UTF-8, מכיוון שזה מאפשר להן לתמוך במספר רב מאוד של שפות.

בעברית, יש 2 סוגי קידוד עיקריים (לפי דעתי):
ISO-8859-8-I - שמשמש לעברית ויזואלית ועברית לוגית (מי שותיק בתחום האינטרנט יודע שבעבר הרבה אתרים השתמשו, ויש גם כאלה שעדיין משתמשים בסוג הקידוד הזה. אני עוד זוכר את בעיות ה"ג'יבריש" ש-Internet Explorer היה עושה לי, וכל הזמן הייתי מנסה קידוד עברית ויזואלית או לוגית).
WINDOWS-1255 - תקן העברית הלוגית של Microsoft. נראה לי שתקן זה לא היה נתמך במערכות מבוססות לינוקס.

מה זה אומר לגביי?
קודם כל, אני מעדיף (ותמיד אעדיף) מערכת בקידוד UTF-8. למה? כי מהניסיון שלי - זה הקידוד שעושה הכי פחות בעיות, אם בכלל. מערכות שמשתמשות ב-UTF-8, הן בקובצי המערכת והן בבסיס הנתונים - מאפשרות תמיכה טובה יותר בעברית.

בהתקנת מערכות - רצוי תמיד לבחור ב-UTF-8. ב-SMF ניתן לבחור בין קידוד ISO לקידוד UTF - ואני תמיד ממליץ על UTF. זה יעשה לכם (ולי) חיים קלים יותר בפיתרון בעיות העברית, אם וכאשר יצוצו.

בקשר לשידרוג מערכות - עוד לא בדיוק התנסיתי בשידרוג מערכת מקידוד ISO ל-UTF, אבל אני כבר מעריך שזה יעשה בעיות, אז מומלץ לכם להתחיל ולהישאר עם UTF.

לסיכום: אם ניתנת לכם האופציה לבחור בין UTF-8 ל-ISO-8859-8-I או אפילו WINDOWS-1255, רצוי תמיד לבחור ב-UTF.

אין תגובות:

פרסום תגובה

אין לבקש תמיכה והצעת/בקשת שירותים בתגובות.