English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية
يحتوي Pandas على ثلاثة أنواع من الهياكل البيانية الشائعة
Series DataFrame Panel
تستند هذه الهياكل البيانية إلى مصفوفات Numpy، مما يعني أن سرعاتها تشغيل عالية جدًا.
list: نوع بيانات Python المدمج، يستخدم عادةً بشكل أحادي الأبعاد، وظيفة بسيطة، كفاءة منخفضة Dict: نوع بيانات Python المدمج، مفتاحين متعددين، كفاءة منخفضة
ndarray: نوع البيانات الأساسي لنumpy، نوع بيانات واحد يركز على الهياكل البيانية/العمليات/المساحات (العلاقات بين البيانات)
Series: أحادي الأبعاد، مشابه لـ 1D ndarray يحتوي على مؤشرات DataFrame: ثنائي الأبعاد، نوع بيانات جدولي، مشابه لـ 2D ndarray يحتوي على مؤشرات الأسطر والأعمدة، يركز على علاقة البيانات والمعلمات (التطبيق العملي)
من حيث الفعالية، قوة الوظيفة وتشغيلها: list < ndarray < Series/DataFrame
في أعمال تنظيم البيانات وتحليلها، يتم استخدام مصفوفات ndarray كإضافة ضرورية، وتجنب استخدامها قدر الإمكان باستخدام أنواع بيانات Pandas.
الطريقة الأمثل للنظر في هذه الهياكل البيانية هي أن الهيكل البياني متعدد الأبعاد هو حاوية للهياكل البيانية الأبعاد الأقل. على سبيل المثال، DataFrame هو حاوية لـ Series، وPanel هو حاوية لـ DataFrame.
الهيكل البياني | المساحة | شرح |
Series | 1 | يستخدم لتحفظ بيانات مستقيمة. |
Data Frames | 2 | يستخدم DataFrame كنوع أكثر تعقيدًا من الهياكل البيانية لتحفظ البيانات متعددة الأبعاد. |
Panel | 3 | التسميات العامة للـ 3D، مصفوفات قابلة للتغيير في الحجم. |
إن إنشاء وتعامل مع مصفوفات ثنائية أمر مرهق، وعند كتابة الدوال يجب أن يفكر المستخدم في اتجاه مجموعة البيانات. ولكن يمكن للهيكل البيانات الخاص بـ Pandas تقليل جهود المستخدم.
على سبيل المثال، بالنسبة لبيانات الجدول (DataFrame)، النظر في المؤشرات (الأعمدة) والأسطر من الناحية اللغوية أكثر فائدة من النظر في المحاور 0 و1.
جميع بنيات البيانات في Pandas قابلة للتغيير (يمكن تعديلها)، باستثناء Series، حيث تكون الأحجام قابلة للتغيير.
ملاحظة - يتم استخدام DataFrame بشكل واسع، وهو أحد الهياكل البيانية الأكثر أهمية. يتم استخدام اللوحات بشكل أقل بكثير.
Series هي هيكل شبه مصفوفة أحادي الأبعاد يحتوي على بيانات متساوية. على سبيل المثال، المجموعة التالية هي مجموعة من الأعداد الصحيحة 10،23،56...
10 | 23 | 56 | 17 | 52 | 61 | 73 | 90 | 26 | 72 |
Series هي هيكل شبه مصفوفة أحادي الأبعاد يحتوي على بيانات متساوية. على سبيل المثال، المجموعة التالية هي مجموعة من الأعداد الصحيحة 10،23،56...
بيانات متشابهة الحجم ثابت القيم القابلة للتغيير
DataFrame هو مصفوفة ثنائية الأبعاد تحتوي على بيانات متباينة. على سبيل المثال،
Name | Age | Gender | Rating |
Steve | 32 | Male | 3.45 |
Lia | 28 | Female | 4.6 |
Vin | 45 | Male | 3.9 |
Katie | 38 | Female | 2.78 |
الجدول أعلاه يمثل بيانات فريق المبيعات في المنظمة وأقرار الأداء العامة، تم تمثيل البيانات بالسطور والعمود، حيث يمثل كل عمود خاصية، وكل سطر شخصًا.
Column | Type |
Name | String |
Age | Integer |
Gender | String |
Rating | Float |
بيانات متباينة الحجم ثابت البيانات قابلة للتغيير
Panel هو هيكل بيانات ثلاثي الأبعاد يحتوي على بيانات متباينة. من الصعب التمثيل بيانياً للوحة. ولكن يمكن توضيح اللوحة كوعاء لـ DataFrame.
بيانات متباينة الحجم قابلة للتغيير البيانات قابلة للتغيير