English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

هيكل البيانات في Pandas

يحتوي Pandas على ثلاثة أنواع من الهياكل البيانية الشائعة

Series DataFrame Panel

تستند هذه الهياكل البيانية إلى مصفوفات Numpy، مما يعني أن سرعاتها تشغيل عالية جدًا.

مقارنة بين Python، Numpy وPandas

Python

list: نوع بيانات Python المدمج، يستخدم عادةً بشكل أحادي الأبعاد، وظيفة بسيطة، كفاءة منخفضة Dict: نوع بيانات Python المدمج، مفتاحين متعددين، كفاءة منخفضة

Numpy

ndarray: نوع البيانات الأساسي لنumpy، نوع بيانات واحد يركز على الهياكل البيانية/العمليات/المساحات (العلاقات بين البيانات)

Pandas

Series: أحادي الأبعاد، مشابه لـ 1D ndarray يحتوي على مؤشرات DataFrame: ثنائي الأبعاد، نوع بيانات جدولي، مشابه لـ 2D ndarray يحتوي على مؤشرات الأسطر والأعمدة، يركز على علاقة البيانات والمعلمات (التطبيق العملي)

من حيث الفعالية، قوة الوظيفة وتشغيلها: list < ndarray < Series/DataFrame

في أعمال تنظيم البيانات وتحليلها، يتم استخدام مصفوفات ndarray كإضافة ضرورية، وتجنب استخدامها قدر الإمكان باستخدام أنواع بيانات Pandas.

الطريقة الأمثل للنظر في هذه الهياكل البيانية هي أن الهيكل البياني متعدد الأبعاد هو حاوية للهياكل البيانية الأبعاد الأقل. على سبيل المثال، DataFrame هو حاوية لـ Series، وPanel هو حاوية لـ DataFrame.

الهيكل البياني المساحةشرح
Series1يستخدم لتحفظ بيانات مستقيمة.
Data Frames2يستخدم DataFrame كنوع أكثر تعقيدًا من الهياكل البيانية لتحفظ البيانات متعددة الأبعاد.
Panel3التسميات العامة للـ 3D، مصفوفات قابلة للتغيير في الحجم.

إن إنشاء وتعامل مع مصفوفات ثنائية أمر مرهق، وعند كتابة الدوال يجب أن يفكر المستخدم في اتجاه مجموعة البيانات. ولكن يمكن للهيكل البيانات الخاص بـ Pandas تقليل جهود المستخدم.
على سبيل المثال، بالنسبة لبيانات الجدول (DataFrame)، النظر في المؤشرات (الأعمدة) والأسطر من الناحية اللغوية أكثر فائدة من النظر في المحاور 0 و1.

التنوع

جميع بنيات البيانات في Pandas قابلة للتغيير (يمكن تعديلها)، باستثناء Series، حيث تكون الأحجام قابلة للتغيير.

ملاحظة - يتم استخدام DataFrame بشكل واسع، وهو أحد الهياكل البيانية الأكثر أهمية. يتم استخدام اللوحات بشكل أقل بكثير.

Series

Series هي هيكل شبه مصفوفة أحادي الأبعاد يحتوي على بيانات متساوية. على سبيل المثال، المجموعة التالية هي مجموعة من الأعداد الصحيحة 10،23،56...

10235617526173902672

Series هي هيكل شبه مصفوفة أحادي الأبعاد يحتوي على بيانات متساوية. على سبيل المثال، المجموعة التالية هي مجموعة من الأعداد الصحيحة 10،23،56...

نقاط رئيسية

بيانات متشابهة الحجم ثابت القيم القابلة للتغيير

Data Frames

DataFrame هو مصفوفة ثنائية الأبعاد تحتوي على بيانات متباينة. على سبيل المثال،

NameAgeGenderRating
Steve32Male3.45
Lia28Female4.6
Vin45Male3.9
Katie38Female2.78

الجدول أعلاه يمثل بيانات فريق المبيعات في المنظمة وأقرار الأداء العامة، تم تمثيل البيانات بالسطور والعمود، حيث يمثل كل عمود خاصية، وكل سطر شخصًا.

نوع البيانات في العمود
ColumnType
Name String
Age Integer
Gender String
Rating Float
نقاط رئيسية

بيانات متباينة الحجم ثابت البيانات قابلة للتغيير

Panel

Panel هو هيكل بيانات ثلاثي الأبعاد يحتوي على بيانات متباينة. من الصعب التمثيل بيانياً للوحة. ولكن يمكن توضيح اللوحة كوعاء لـ DataFrame.

نقاط رئيسية

بيانات متباينة الحجم قابلة للتغيير البيانات قابلة للتغيير