دليل Pandas

الطرق الأساسية Pandas

مثال على الطريقة الأساسية لـ Pandas

حتى الآن، لقد تعرفنا على ثلاثة بنيات بيانات Pandas وكيفية إنشائها. نظرًا لأهميته في معالجة البيانات في الوقت الحقيقي، سنركز بشكل رئيسي على مجرد DataFrame، وسنناقش بعض بنيات البيانات الأخرى.

الطريقة	وصف
axes	يعود قائمة بتسميات المحاور.
dtype	يعود dtype للمجرد.
empty	إذا كانت Series فارغة، فإنها تعود True.
ndim	يعود أبعاد البيانات الأساسية بناءً على التعريف.
size	يعود عدد العناصر في البيانات الأساسية.
values	يعود Series كndarray.
head()	يتم عودة النسخة الأولى من n صف.
tail()	يتم عودة النسخة الأخيرة من n صف.

لدينا نخلق سلسلة واحدة ونرى جميع العمليات على جميع القوائم.

مثال

　استيراد pandas كـ pd
　استيراد numpy كـ np
　# أنشئ Series باستخدام 100 عدد عشوائي
　s = pd.Series(np.random.randn(4))
　print(s)

نتيجة التنفيذ:

0      0.967853
1     -0.148368
2     -1.395906
3     -1.758394
dtype: float64

axes

استرداد قائمة علامات Series

مثال

　استيراد pandas كـ pd
　استيراد numpy كـ np
　# أنشئ Series باستخدام 100 عدد عشوائي
　s = pd.Series(np.random.randn(4))
　print ("الأعمدة هي:")
　print(s.axes)

نتيجة التنفيذ:

　الأعمدة هي:
　[RangeIndex(start=0, stop=4, step=1)]

النتائج أعلاه هي من 0 إلى 5 (أي [0,1,2,3,4]).

empty

استرداد قيمة بولية، تشير إلى ما إذا كان العنصر فارغًا. True يعني أن العنصر فارغ

مثال

　استيراد pandas كـ pd
　استيراد numpy كـ np
　# أنشئ Series باستخدام 100 عدد عشوائي
　s = pd.Series(np.random.randn(4))
　print ("هل العنصر فارغ؟")
　print(s.empty)

نتيجة التنفيذ:

هل العنصر فارغ؟
False

ndim

استرداد أبعاد العنصر. وفقًا للتعريف، Series هي بنية بيانات 1D، لذا يُرجع

مثال

　استيراد pandas كـ pd
　استيراد numpy كـ np
　# يتم إنشاء سلسلة باستخدام 4 أرقام عشوائية
　s = pd.Series(np.random.randn(4))
　print(s)
　print ("مقاييس العنصر:")
　print(s.ndim)

نتيجة التنفيذ:

　　　　　0      0.175898
1      0.166197
2     -0.609712
3     -1.377000
dtype: float64
مقاييس العنصر:
1

size

استرداد حجم Series (الطول).

مثال

　استيراد pandas كـ pd
　استيراد numpy كـ np
　# يتم إنشاء سلسلة باستخدام 4 أرقام عشوائية
　s = pd.Series(np.random.randn(2))
　print(s)
　print ("حجم العنصر:")
　print(s.size)

نتيجة التنفيذ:

0      3.078058
1     -1.207803
dtype: float64
حجم العنصر:
2

values

استرداد بيانات Series كنموذج مصفوفة

مثال

　استيراد pandas كـ pd
　استيراد numpy كـ np
　# يتم إنشاء سلسلة باستخدام 4 أرقام عشوائية
　s = pd.Series(np.random.randn(4))
　print(s)
　print ("السلسلة البيانية الفعلية هي:")
　print(s.values)

نتيجة التنفيذ:

0      1.787373
1     -0.605159
2      0.180477
3     -0.140922
dtype: float64
السلسلة البيانية الفعلية هي:
[ 1.78737302 -0.60515881 0.18047664 -0.1409218 ]

Head و Tail

للإطلاع على بيانات الرسالة أو DataFrame، استخدم الأساليب head() و tail().

head() استرداد النسخ الأولية من n سطر (مراجعة مؤشرات النسخ). يظهر العدد الافتراضي للعناصر هو 5، ولكن يمكنك تقديم رقم مخصص.

مثال

　استيراد pandas كـ pd
　استيراد numpy كـ np
　# يتم إنشاء سلسلة باستخدام 4 أرقام عشوائية
　s = pd.Series(np.random.randn(4))
　print ("السلسلة الأصلية هي:")
　print(s)
　print("السلسلة البيانية الأولى من سطرين:")
　print(s.head(2))

نتيجة التنفيذ:

السلسلة الأصلية هي:
0 0.720876
1 -0.765898
2 0.479221
3 -0.139547
dtype: float64
السلسلة البيانية الأولى من سطرين:
0 0.720876
1 -0.765898
dtype: float64

tail() استرداد آخر n سطر (مراقبة قيم الأنماط). العدد الافتراضي للعناصر المعروضة هو 5، ولكن يمكنك تقديم رقم مخصص.

مثال

　استيراد pandas كـ pd
　استيراد numpy كـ np
　# يتم إنشاء سلسلة باستخدام 4 أرقام عشوائية
　s = pd.Series(np.random.randn(4))
　print("السلسلة الأصلية هي:")
　print(s)
　print("السلسلة البيانية الأخيرة من سطرين:")
　print(s).tail(2)

نتيجة التنفيذ:

السلسلة الأصلية هي:
0 -0.655091
1 -0.881407
2 -0.608592
3 -2.341413
dtype: float64
السلسلة البيانية الأخيرة من سطرين:
2 -0.608592
3 -2.341413
dtype: float64

وظائف DataFrame الأساسية

دعونا نتعرف على ما هو DataFrame الأساسي. يعرض الجدول أدناه بعض الخصائص أو الطرق المهمة التي تساعد في وظائف DataFrame الأساسية.

خصائص/طرق	وصف
T	تبادل الصفوف والعمود
axes	يتم عودة قائمة تحتوي على أعضاء فريدون هم علامات المحاور والعمود.
dtypes	يتم عودة dtypes هذا العنصر.
empty	إذا كانت NDataFrame فارغة تمامًا [لا تحتوي على أي مشاريع]，则为 true؛ وإلا则为 false. إذا كان طول أي محور يساوي 0.
ndim	عدد الأبعاد/حجم الماتريس.
shape	يتم عودة زوج يمثل أبعاد DataFrame.
size	عدد العناصر في NDataFrame.
values	مقدار NDataFrame.
head()	يتم عودة النسخة الأولى من n صف.
tail()	يتم عودة النسخة الأخيرة من n صف.

فيما يلي، سنقوم بإنشاء DataFrame ونرى كيفية تنفيذ جميع العمليات المذكورة أعلاه.

مثال

　استيراد pandas كـ pd
　استيراد numpy كـ np
　# تأسيس قاموس Series
　d　=　{'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),}
　　　　'Age':pd.Series([25,26,25,23,30,29,23]),
　　　　'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
　#　إنشاء DataFrame
　df　=　pd.DataFrame(d)
　print("سلسلة بياناتنا هي:")
　print(df)

نتيجة التنفيذ:

سلسلة بياناتنا هي:
　　　　العمر　الاسم　التقييم
0　25　Tom　　4.23
1　26　James　　3.24
2　25　Ricky　　3.98
3　23　Vin　　2.56
4　30　Steve　　3.20
5　29　Smith　　4.60
6　23　Jack　　3.80

T (التحويل العكسي)

يتم عودة التحويل العكسي للDataFrame. سيتم تبادل الصفوف والعمود.

مثال

　استيراد pandas كـ pd
　استيراد numpy كـ np
　　
　# تأسيس قاموس Series
　d　=　{'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),}
　　　　'Age':pd.Series([25,26,25,23,30,29,23]),
　　　　'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
　#　إنشاء DataFrame
　df　=　pd.DataFrame(d)
　print("التحويل العكسي للسلسلة البيانية هو:")
　print(df.T)

نتيجة التنفيذ:

التحويل العكسي للسلسلة البيانية هو:
　　　　　　　　　0 1 2 3 4 5 6
Age 25 26 25 23 30 29 23
Name Tom James Ricky Vin Steve Smith Jack
Rating 4.23 3.24 3.98 2.56 3.2 4.6 3.8

axes

返回行轴标签和列轴标签的列表。

مثال

　استيراد pandas كـ pd
　استيراد numpy كـ np
　# تأسيس قاموس Series
　d　=　{'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),}
　　　　'Age':pd.Series([25,26,25,23,30,29,23]),
　　　　'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
　#　إنشاء DataFrame
　df　=　pd.DataFrame(d)
　print ("行轴标签和列轴标签是:")
　print(df.axes)

نتيجة التنفيذ:

　　行轴标签和列轴标签是:
　[RangeIndex(start=0,  stop=7,  step=1),  Index([u'Age',  u'Name',  u'Rating'],
　dtype='object')]

dtypes

返回每一列的数据类型。

مثال

　استيراد pandas كـ pd
　استيراد numpy كـ np
　# تأسيس قاموس Series
　d　=　{'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),}
　　　　'Age':pd.Series([25,26,25,23,30,29,23]),
　　　　'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
　#　إنشاء DataFrame
　df　=　pd.DataFrame(d)
　print ("每列的数据类型如下:")
　print(df.dtypes)

نتيجة التنفيذ:

每列的数据类型如下:
Age  int64
Name  object
Rating  float64
dtype:  object

empty

返回布尔值，说明对象是否为空；True表示对象为空。

مثال

　استيراد pandas كـ pd
　استيراد numpy كـ np
　　
　# تأسيس قاموس Series
　d　=　{'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),}
　　　　'Age':pd.Series([25,26,25,23,30,29,23]),
　　　　'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
　　
　#　إنشاء DataFrame
　df　=　pd.DataFrame(d)
　print ("Is the object empty?")
　print(df.empty)

نتيجة التنفيذ:

　Is the object empty?
　False

ndim

返回对象的数量。根据定义，DataFrame是2D对象。

مثال

　استيراد pandas كـ pd
　استيراد numpy كـ np
　# تأسيس قاموس Series
　d　=　{'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),}
　　　　'Age':pd.Series([25,26,25,23,30,29,23]),
　　　　'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
　#　إنشاء DataFrame
　df　=　pd.DataFrame(d)
　print("جسمنا هو:")
　print　df
　print ("The dimension of the object is:")
　print(df.ndim)

نتيجة التنفيذ:

　　　　　جسمنا هو:
　　　　　　Age  Name  Rating
0  25  Tom  4.23
1  26  James  3.24
2  25  Ricky  3.98
3  23  Vin  2.56
4  30  Steve  3.20
5  29  Smith  4.60
6  23  Jack  3.80
The dimension of the object is:
2

shape

返回表示DataFrame维度的元组。元组(a,b)，其中a表示行数，b表示الإطار الزمني.

مثال

　استيراد pandas كـ pd
　استيراد numpy كـ np
　　
　# تأسيس قاموس Series
　d　=　{'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),}
　　　　'Age':pd.Series([25,26,25,23,30,29,23]),
　　　　'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
　　
　#　إنشاء DataFrame
　df　=　pd.DataFrame(d)
　print("جسمنا هو:")
　print　df
　print ("The shape of the object is:")
　print(df.shape)

نتيجة التنفيذ:

　　　　　جسمنا هو:
　　　العمر　الاسم　التقييم
0  25  Tom  4.23
1  26  James  3.24
2  25  Ricky  3.98
3  23  Vin  2.56
4  30  Steve  3.20
5  29  Smith  4.60
6  23  Jack  3.80
شكل الجسد هو:
(7, 3)

size

استرداد عدد العناصر في DataFrame.

مثال

　استيراد pandas كـ pd
　استيراد numpy كـ np
　　
　# تأسيس قاموس Series
　d　=　{'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),}
　　　　'Age':pd.Series([25,26,25,23,30,29,23]),
　　　　'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
　　
　#　إنشاء DataFrame
　df　=　pd.DataFrame(d)
　print("جسمنا هو:")
　print　df
　print("عدد العناصر الإجمالي في جسمنا هو:")
　print(df.size)

نتيجة التنفيذ:

　　　　　جسمنا هو:
　　　　العمر　الاسم　التقييم
0　25　Tom　　4.23
1　26　James　　3.24
2　25　Ricky　　3.98
3　23　Vin　　2.56
4　30　Steve　　3.20
5　29　Smith　　4.60
6　23　Jack　　3.80
عدد العناصر الإجمالي في جسمنا هو:
21

values

استرداد البيانات الفعلية في DataFrame بصيغة NDarray.

مثال

　استيراد pandas كـ pd
　استيراد numpy كـ np
　　
　# تأسيس قاموس Series
　d　=　{'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),}
　　　　'Age':pd.Series([25,26,25,23,30,29,23]),
　　　　'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
　　
　#　إنشاء DataFrame
　df　=　pd.DataFrame(d)
　print("جسمنا هو:")
　print　df
　print("بيانات الحقيقة في جدول بياناتنا هي:")
　print(df.values)

نتيجة التنفيذ:

　　　　　جسمنا هو:
　　　　العمر　الاسم　التقييم
0　25　Tom　　4.23
1　26　James　　3.24
2　25　Ricky　　3.98
3　23　Vin　　2.56
4　30　Steve　　3.20
5　29　Smith　　4.60
6　23　Jack　　3.80
بيانات الحقيقة في جدول بياناتنا هي:
[[25  'Tom'  4.23]
[26  'James'  3.24]
[25  'Ricky'  3.98]
[23  'Vin'  2.56]
[30  'Steve'  3.2]
[29  'Smith'  4.6]
[23  'Jack'  3.8]

الرأس والذيل

للإطلاع على بيانات الرأس والذيل لج�체 DataFrame، استخدم طرق head() و tail(). تعود head() إلى n سطر (مراقبة قيم الأنماط). العدد الافتراضي للعناصر المعروضة هو 5، ولكن يمكنك تقديم رقم مخصص.

مثال

　استيراد pandas كـ pd
　استيراد numpy كـ np
　　
　# تأسيس قاموس Series
　d　=　{'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),}
　　　　'Age':pd.Series([25,26,25,23,30,29,23]),
　　　　'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
　#　إنشاء DataFrame
　df　=　pd.DataFrame(d)
　print("جدول بياناتنا هو:")
　print　df
　print("سطرين الأولى من جدول البيانات هي:")
　print(df.head(2))

نتيجة التنفيذ:

　　　　　جدول بياناتنا هو:
　　　　العمر　الاسم　التقييم
0　25　Tom　　4.23
1　26　James　　3.24
2　25　Ricky　　3.98
3　23　Vin　　2.56
4　30　Steve　　3.20
5　29　Smith　　4.60
6　23　Jack　　3.80
سطرين الأولى من جدول البيانات هي:
　　　العمر  الاسم  التقييم
0  25  Tom  4.23
1  26  James  3.24

tail() استرداد آخر n سطر (مراقبة قيم الأنماط). العدد الافتراضي للعناصر المعروضة هو 5، ولكن يمكنك تقديم رقم مخصص.

مثال

　استيراد pandas كـ pd
　استيراد numpy كـ np
　# تأسيس قاموس Series
　d　=　{'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),}
　　　　'Age':pd.Series([25,26,25,23,30,29,23]),　
　　　　'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
　　
　#　إنشاء DataFrame
　df　=　pd.DataFrame(d)
　print　("جدول بياناتنا هو:")
　print　df
　print　("السطرين الأخيرين للجدول هي:")
　print(df.tail(2))

نتيجة التنفيذ:

جدول بياناتنا هو:
　　　　العمر　الاسم　التقييم
0　25　Tom　　4.23
1　26　James　　3.24
2　25　Ricky　　3.98
3　23　Vin　　2.56
4　30　Steve　　3.20
5　29　Smith　　4.60
6　23　Jack　　3.80
السطرين الأخيرين للجدول هي:
　　　　العمر　الاسم　التقييم
5　29　Smith　　4.6
6　23　Jack　　3.8

عمليات SQL Pandas Panel Pandas