English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

دليل HTML

مجمع علامات HTML

مجموعة الحروف لـ HTML

تحدد مجموعة الحروف كيفية ترجمة البايتات التي تمثل النصوص في ملفات HTML إلى حروف قابلة للقراءة. يمكن تفسير الرقم أو الاستدلال على الحرف الستة عشرة ("〹" أو "ሴ") وفقًا لـ ISO010646، وهو متوافق مع إصدار 2.0 من معيار Unicode، وهو مستقل عن مجموعة الحروف المختارة.

مجموعة الحروف لـ HTML

لعرض صفحة HTML بشكل صحيح، يجب أن يعرف المتصفح أي مجموعة حروف تستخدم.

كانت مجموعة الحروف المستخدمة في بداية شبكة الويب العالمية هي ASCII. يدعم ASCII الأرقام من 0 إلى 9، الأبجدية الأبجدية الكبيرة والصغيرة، وبعض الرموز الخاصة.

دليل ASCII الكامل.

بسبب أن العديد من البلدان يستخدمون حروفًا لا تنتمي إلى ASCII، يكون النطاق الافتراضي للصفحات في المتصفحات الحديثة هو ISO-8859-1.

دليل ISO-8859-1 الكامل.

إذا كان النص المستخدم في الصفحة الويب مختلفًا عن ISO-8859-1، يجب تحديد ذلك في علامة <meta>.

مجموعات الحروف ISO

مجموعات الحروف ISO هي مجموعات الحروف المعيارية التي تعرفها منظمة المعايير الدولية (ISO) للعديد من الأبجديات/اللغات.

فيما يلي قائمة بالعديد من مجموعات الحروف المستخدمة في أنحاء العالم:

مجموعة الحروفالوصفنطاق الاستخدام
ISO-8859-1جزء 1 من الأبجدية اللاتينيةشمال أمريكا، أوروبا الغربية، أمريكا اللاتينية، البحر الكاريبي، كندا، أفريقيا
ISO-8859-2جزء 2 من الأبجدية اللاتينيةأوروبا الشرقية
ISO-8859-3جزء 3 من الأبجدية اللاتينيةشبه أوروبا، اللغة العالمية، والمتنوعة الأخرى
ISO-8859-4جزء 4 من الأبجدية اللاتينيةاللغات السكندنافية واللغة البحرية البولندية (وبعض الأجزاء التي لم تكن مضمونة في ISO-8859-1)
ISO-8859-5جزء 5 من Latin/Cyrillicاللغات التي تستخدم الأبجدية السلافية القديمة، مثل اللغة البولندية واللغة البيelorوسية واللغة الروسية واللغة المقدونية
ISO-8859-6جزء 6 من Latin/Arabicاللغات التي تستخدم الأبجدية العربية
ISO-8859-7جزء 7 من Latin/Greekاللغة اليونانية الحديثة، والرموز الرياضية التي تتفرع من اليونانية
ISO-8859-8جزء 8 من Latin/Hebrewاللغات التي تستخدم اللغة العبرية
ISO-8859-9جزء 9 من Latin 5اللغة التركية. باستثناء أن حروف تركيا استبدلت حروف آيسلندا، تكون مشابهة لـ ISO-8859-1
ISO-8859-10Latin 6اللغة الفنلندية واللغة السويدية واللغة الإسكيمو البحرية الشمالية
ISO-8859-15Latin 9 (أي Latin 0)مثل ISO 8859-1، تم استبدال بعض الرموز القليلة الاستخدام بمزيج من رموز مثل رمز اليورو
ISO-2022-JPجزء 1 من Latin/Japaneseاللغة اليابانية
ISO-2022-JP-2جزء 2 من Latin/Japaneseاللغة اليابانية
ISO-2022-KRجزء 1 من Latin/Koreanاللغة الكورية

معيار يونيكود

بسبب أن مجموعات الحروف المذكورة أعلاه لها محدودية في الكمية، وتكون غير متوافقة مع بيئات متعددة اللغات، طور مجلس يونيكود معيار يونيكود.

يغطي معيار يونيكود جميع الحروف والنقاط والرموز في العالم.

يونيكود قادر على معالجة، التخزين وتبادل بيانات النصوص على أي منصة أو برنامج أو لغة.

مجلس يونيكود

مجلس يونيكود طور معيار يونيكود. هدافهم هو استبدال مجموعات الحروف الحالية باستخدام تنسيق التحويل Unicode القياسي (UTF).

تم تحقيق نجاح معيار يونيكود، حيث تم تنفيذه في XML و Java و ECMAScript (JavaScript) و LDAP و CORBA 3.0 و WML. كما يتم دعم يونيكود في العديد من أنظمة التشغيل وكل المتصفحات الحديثة.

مجلس يونيكود يعمل على تعاون مع منظمات تطوير المعايير الرائدة، مثل ISO و W3C و ECMA.

Unicode يمكنه أن يتم التكامل مع مجموعة الحروف المختلفة. أكثر الطرق استخدماً للتحويل هي UTF-8 و UTF-16:

مجموعة الحروفالوصف
UTF-8يمكن أن تكون الأحرف في UTF-8 من 1 إلى 4 بت. يمكن لـ UTF-8 التمثيل الكامل للرموز في معيار Unicode. UTF-8 متوافق مع ASCII. UTF-8 هو الشيفرة المفضلة للصفحات الإلكترونية والبريد الإلكتروني.
UTF-16تنسيق التحويل Unicode من 16 بت هو شكل Unicode للرمز المتغير، يمكنه تشفير كل أوامر جدول Unicode. يتم استخدام UTF-16 بشكل رئيسي في أنظمة التشغيل والبيئات مثل Windows 2000/XP/2003/Vista/CE و Java و .NET بيئة الشيفرة.

إشارة: الـ 256 حرف من مجموعة الحروف Unicode يمثلون 256 حرف من مجموعة الحروف ISO-8859-1.

إشارة: جميع معالجات HTML 4 يدعم UTF-8، بينما جميع معالجات XHTML و XML يدعم UTF-8 و UTF-16!