English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية
تحدد مجموعة الحروف كيفية ترجمة البايتات التي تمثل النصوص في ملفات HTML إلى حروف قابلة للقراءة. يمكن تفسير الرقم أو الاستدلال على الحرف الستة عشرة ("〹" أو "ሴ") وفقًا لـ ISO010646، وهو متوافق مع إصدار 2.0 من معيار Unicode، وهو مستقل عن مجموعة الحروف المختارة.
لعرض صفحة HTML بشكل صحيح، يجب أن يعرف المتصفح أي مجموعة حروف تستخدم.
كانت مجموعة الحروف المستخدمة في بداية شبكة الويب العالمية هي ASCII. يدعم ASCII الأرقام من 0 إلى 9، الأبجدية الأبجدية الكبيرة والصغيرة، وبعض الرموز الخاصة.
بسبب أن العديد من البلدان يستخدمون حروفًا لا تنتمي إلى ASCII، يكون النطاق الافتراضي للصفحات في المتصفحات الحديثة هو ISO-8859-1.
إذا كان النص المستخدم في الصفحة الويب مختلفًا عن ISO-8859-1، يجب تحديد ذلك في علامة <meta>.
مجموعات الحروف ISO هي مجموعات الحروف المعيارية التي تعرفها منظمة المعايير الدولية (ISO) للعديد من الأبجديات/اللغات.
فيما يلي قائمة بالعديد من مجموعات الحروف المستخدمة في أنحاء العالم:
مجموعة الحروف | الوصف | نطاق الاستخدام |
---|---|---|
ISO-8859-1 | جزء 1 من الأبجدية اللاتينية | شمال أمريكا، أوروبا الغربية، أمريكا اللاتينية، البحر الكاريبي، كندا، أفريقيا |
ISO-8859-2 | جزء 2 من الأبجدية اللاتينية | أوروبا الشرقية |
ISO-8859-3 | جزء 3 من الأبجدية اللاتينية | شبه أوروبا، اللغة العالمية، والمتنوعة الأخرى |
ISO-8859-4 | جزء 4 من الأبجدية اللاتينية | اللغات السكندنافية واللغة البحرية البولندية (وبعض الأجزاء التي لم تكن مضمونة في ISO-8859-1) |
ISO-8859-5 | جزء 5 من Latin/Cyrillic | اللغات التي تستخدم الأبجدية السلافية القديمة، مثل اللغة البولندية واللغة البيelorوسية واللغة الروسية واللغة المقدونية |
ISO-8859-6 | جزء 6 من Latin/Arabic | اللغات التي تستخدم الأبجدية العربية |
ISO-8859-7 | جزء 7 من Latin/Greek | اللغة اليونانية الحديثة، والرموز الرياضية التي تتفرع من اليونانية |
ISO-8859-8 | جزء 8 من Latin/Hebrew | اللغات التي تستخدم اللغة العبرية |
ISO-8859-9 | جزء 9 من Latin 5 | اللغة التركية. باستثناء أن حروف تركيا استبدلت حروف آيسلندا، تكون مشابهة لـ ISO-8859-1 |
ISO-8859-10 | Latin 6 | اللغة الفنلندية واللغة السويدية واللغة الإسكيمو البحرية الشمالية |
ISO-8859-15 | Latin 9 (أي Latin 0) | مثل ISO 8859-1، تم استبدال بعض الرموز القليلة الاستخدام بمزيج من رموز مثل رمز اليورو |
ISO-2022-JP | جزء 1 من Latin/Japanese | اللغة اليابانية |
ISO-2022-JP-2 | جزء 2 من Latin/Japanese | اللغة اليابانية |
ISO-2022-KR | جزء 1 من Latin/Korean | اللغة الكورية |
بسبب أن مجموعات الحروف المذكورة أعلاه لها محدودية في الكمية، وتكون غير متوافقة مع بيئات متعددة اللغات، طور مجلس يونيكود معيار يونيكود.
يغطي معيار يونيكود جميع الحروف والنقاط والرموز في العالم.
يونيكود قادر على معالجة، التخزين وتبادل بيانات النصوص على أي منصة أو برنامج أو لغة.
مجلس يونيكود طور معيار يونيكود. هدافهم هو استبدال مجموعات الحروف الحالية باستخدام تنسيق التحويل Unicode القياسي (UTF).
تم تحقيق نجاح معيار يونيكود، حيث تم تنفيذه في XML و Java و ECMAScript (JavaScript) و LDAP و CORBA 3.0 و WML. كما يتم دعم يونيكود في العديد من أنظمة التشغيل وكل المتصفحات الحديثة.
مجلس يونيكود يعمل على تعاون مع منظمات تطوير المعايير الرائدة، مثل ISO و W3C و ECMA.
Unicode يمكنه أن يتم التكامل مع مجموعة الحروف المختلفة. أكثر الطرق استخدماً للتحويل هي UTF-8 و UTF-16:
مجموعة الحروف | الوصف |
---|---|
UTF-8 | يمكن أن تكون الأحرف في UTF-8 من 1 إلى 4 بت. يمكن لـ UTF-8 التمثيل الكامل للرموز في معيار Unicode. UTF-8 متوافق مع ASCII. UTF-8 هو الشيفرة المفضلة للصفحات الإلكترونية والبريد الإلكتروني. |
UTF-16 | تنسيق التحويل Unicode من 16 بت هو شكل Unicode للرمز المتغير، يمكنه تشفير كل أوامر جدول Unicode. يتم استخدام UTF-16 بشكل رئيسي في أنظمة التشغيل والبيئات مثل Windows 2000/XP/2003/Vista/CE و Java و .NET بيئة الشيفرة. |
إشارة: الـ 256 حرف من مجموعة الحروف Unicode يمثلون 256 حرف من مجموعة الحروف ISO-8859-1.
إشارة: جميع معالجات HTML 4 يدعم UTF-8، بينما جميع معالجات XHTML و XML يدعم UTF-8 و UTF-16!