English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

الطرق الأساسية Pandas

مثال على الطريقة الأساسية لـ Pandas

حتى الآن، لقد تعرفنا على ثلاثة بنيات بيانات Pandas وكيفية إنشائها. نظرًا لأهميته في معالجة البيانات في الوقت الحقيقي، سنركز بشكل رئيسي على مجرد DataFrame، وسنناقش بعض بنيات البيانات الأخرى.

الطريقةوصف
axesيعود قائمة بتسميات المحاور.
dtypeيعود dtype للمجرد.
emptyإذا كانت Series فارغة، فإنها تعود True.
ndimيعود أبعاد البيانات الأساسية بناءً على التعريف.
sizeيعود عدد العناصر في البيانات الأساسية.
valuesيعود Series كndarray.
head()يتم عودة النسخة الأولى من n صف.
tail()يتم عودة النسخة الأخيرة من n صف.
لدينا نخلق سلسلة واحدة ونرى جميع العمليات على جميع القوائم.
 استيراد pandas كـ pd
 استيراد numpy كـ np
 # أنشئ Series باستخدام 100 عدد عشوائي
 s = pd.Series(np.random.randn(4))
 print(s)

نتيجة التنفيذ:

0      0.967853
1     -0.148368
2     -1.395906
3     -1.758394
dtype: float64

axes

استرداد قائمة علامات Series

 استيراد pandas كـ pd
 استيراد numpy كـ np
 # أنشئ Series باستخدام 100 عدد عشوائي
 s = pd.Series(np.random.randn(4))
 print ("الأعمدة هي:")
 print(s.axes)

نتيجة التنفيذ:

 الأعمدة هي:
 [RangeIndex(start=0, stop=4, step=1)]

النتائج أعلاه هي من 0 إلى 5 (أي [0,1,2,3,4]).

empty

استرداد قيمة بولية، تشير إلى ما إذا كان العنصر فارغًا. True يعني أن العنصر فارغ

 استيراد pandas كـ pd
 استيراد numpy كـ np
 # أنشئ Series باستخدام 100 عدد عشوائي
 s = pd.Series(np.random.randn(4))
 print ("هل العنصر فارغ؟")
 print(s.empty)

نتيجة التنفيذ:

هل العنصر فارغ؟
False

ndim

استرداد أبعاد العنصر. وفقًا للتعريف، Series هي بنية بيانات 1D، لذا يُرجع

 استيراد pandas كـ pd
 استيراد numpy كـ np
 # يتم إنشاء سلسلة باستخدام 4 أرقام عشوائية
 s = pd.Series(np.random.randn(4))
 print(s)
 print ("مقاييس العنصر:")
 print(s.ndim)

نتيجة التنفيذ:

     0      0.175898
1      0.166197
2     -0.609712
3     -1.377000
dtype: float64
مقاييس العنصر:
1

size

استرداد حجم Series (الطول).

 استيراد pandas كـ pd
 استيراد numpy كـ np
 # يتم إنشاء سلسلة باستخدام 4 أرقام عشوائية
 s = pd.Series(np.random.randn(2))
 print(s)
 print ("حجم العنصر:")
 print(s.size)

نتيجة التنفيذ:

0      3.078058
1     -1.207803
dtype: float64
حجم العنصر:
2

values

استرداد بيانات Series كنموذج مصفوفة

 استيراد pandas كـ pd
 استيراد numpy كـ np
 # يتم إنشاء سلسلة باستخدام 4 أرقام عشوائية
 s = pd.Series(np.random.randn(4))
 print(s)
 print ("السلسلة البيانية الفعلية هي:")
 print(s.values)

نتيجة التنفيذ:

0      1.787373
1     -0.605159
2      0.180477
3     -0.140922
dtype: float64
السلسلة البيانية الفعلية هي:
[ 1.78737302 -0.60515881 0.18047664 -0.1409218 ]

Head و Tail

للإطلاع على بيانات الرسالة أو DataFrame، استخدم الأساليب head() و tail().

head() استرداد النسخ الأولية من n سطر (مراجعة مؤشرات النسخ). يظهر العدد الافتراضي للعناصر هو 5، ولكن يمكنك تقديم رقم مخصص.

 استيراد pandas كـ pd
 استيراد numpy كـ np
 # يتم إنشاء سلسلة باستخدام 4 أرقام عشوائية
 s = pd.Series(np.random.randn(4))
 print ("السلسلة الأصلية هي:")
 print(s)
 print("السلسلة البيانية الأولى من سطرين:")
 print(s.head(2))

نتيجة التنفيذ:

السلسلة الأصلية هي:
0 0.720876
1 -0.765898
2 0.479221
3 -0.139547
dtype: float64
السلسلة البيانية الأولى من سطرين:
0 0.720876
1 -0.765898
dtype: float64

tail() استرداد آخر n سطر (مراقبة قيم الأنماط). العدد الافتراضي للعناصر المعروضة هو 5، ولكن يمكنك تقديم رقم مخصص.

 استيراد pandas كـ pd
 استيراد numpy كـ np
 # يتم إنشاء سلسلة باستخدام 4 أرقام عشوائية
 s = pd.Series(np.random.randn(4))
 print("السلسلة الأصلية هي:")
 print(s)
 print("السلسلة البيانية الأخيرة من سطرين:")
 print(s).tail(2)

نتيجة التنفيذ:

السلسلة الأصلية هي:
0 -0.655091
1 -0.881407
2 -0.608592
3 -2.341413
dtype: float64
السلسلة البيانية الأخيرة من سطرين:
2 -0.608592
3 -2.341413
dtype: float64

وظائف DataFrame الأساسية

دعونا نتعرف على ما هو DataFrame الأساسي. يعرض الجدول أدناه بعض الخصائص أو الطرق المهمة التي تساعد في وظائف DataFrame الأساسية.

خصائص/طرقوصف
Tتبادل الصفوف والعمود
axesيتم عودة قائمة تحتوي على أعضاء فريدون هم علامات المحاور والعمود.
dtypesيتم عودة dtypes هذا العنصر.
emptyإذا كانت NDataFrame فارغة تمامًا [لا تحتوي على أي مشاريع],则为 true؛ وإلا则为 false. إذا كان طول أي محور يساوي 0.
ndimعدد الأبعاد/حجم الماتريس.
shapeيتم عودة زوج يمثل أبعاد DataFrame.
sizeعدد العناصر في NDataFrame.
valuesمقدار NDataFrame.
head()يتم عودة النسخة الأولى من n صف.
tail()يتم عودة النسخة الأخيرة من n صف.

فيما يلي، سنقوم بإنشاء DataFrame ونرى كيفية تنفيذ جميع العمليات المذكورة أعلاه.

مثال

 استيراد pandas كـ pd
 استيراد numpy كـ np
 # تأسيس قاموس Series
 d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),}
    'Age':pd.Series([25,26,25,23,30,29,23]),
    'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
 # إنشاء DataFrame
 df = pd.DataFrame(d)
 print("سلسلة بياناتنا هي:")
 print(df)

نتيجة التنفيذ:

سلسلة بياناتنا هي:
    العمر الاسم التقييم
0 25 Tom  4.23
1 26 James  3.24
2 25 Ricky  3.98
3 23 Vin  2.56
4 30 Steve  3.20
5 29 Smith  4.60
6 23 Jack  3.80

T (التحويل العكسي)

يتم عودة التحويل العكسي للDataFrame. سيتم تبادل الصفوف والعمود.

 استيراد pandas كـ pd
 استيراد numpy كـ np
  
 # تأسيس قاموس Series
 d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),}
    'Age':pd.Series([25,26,25,23,30,29,23]),
    'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
 # إنشاء DataFrame
 df = pd.DataFrame(d)
 print("التحويل العكسي للسلسلة البيانية هو:")
 print(df.T)

نتيجة التنفيذ:

التحويل العكسي للسلسلة البيانية هو:
         0 1 2 3 4 5 6
Age 25 26 25 23 30 29 23
Name Tom James Ricky Vin Steve Smith Jack
Rating 4.23 3.24 3.98 2.56 3.2 4.6 3.8

axes

返回行轴标签和列轴标签的列表。

 استيراد pandas كـ pd
 استيراد numpy كـ np
 # تأسيس قاموس Series
 d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),}
    'Age':pd.Series([25,26,25,23,30,29,23]),
    'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
 # إنشاء DataFrame
 df = pd.DataFrame(d)
 print ("行轴标签和列轴标签是:")
 print(df.axes)

نتيجة التنفيذ:

  行轴标签和列轴标签是:
 [RangeIndex(start=0,  stop=7,  step=1),  Index([u'Age',  u'Name',  u'Rating'],
 dtype='object')]

dtypes

返回每一列的数据类型。

 استيراد pandas كـ pd
 استيراد numpy كـ np
 # تأسيس قاموس Series
 d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),}
    'Age':pd.Series([25,26,25,23,30,29,23]),
    'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
 # إنشاء DataFrame
 df = pd.DataFrame(d)
 print ("每列的数据类型如下:")
 print(df.dtypes)

نتيجة التنفيذ:

每列的数据类型如下:
Age  int64
Name  object
Rating  float64
dtype:  object

empty

返回布尔值,说明对象是否为空;True表示对象为空。

 استيراد pandas كـ pd
 استيراد numpy كـ np
  
 # تأسيس قاموس Series
 d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),}
    'Age':pd.Series([25,26,25,23,30,29,23]),
    'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
  
 # إنشاء DataFrame
 df = pd.DataFrame(d)
 print ("Is the object empty?")
 print(df.empty)

نتيجة التنفيذ:

 Is the object empty?
 False

ndim

返回对象的数量。根据定义,DataFrame是2D对象。

 استيراد pandas كـ pd
 استيراد numpy كـ np
 # تأسيس قاموس Series
 d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),}
    'Age':pd.Series([25,26,25,23,30,29,23]),
    'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
 # إنشاء DataFrame
 df = pd.DataFrame(d)
 print("جسمنا هو:")
 print df
 print ("The dimension of the object is:")
 print(df.ndim)

نتيجة التنفيذ:

     جسمنا هو:
      Age  Name  Rating
0  25  Tom  4.23
1  26  James  3.24
2  25  Ricky  3.98
3  23  Vin  2.56
4  30  Steve  3.20
5  29  Smith  4.60
6  23  Jack  3.80
The dimension of the object is:
2

shape

返回表示DataFrame维度的元组。元组(a,b),其中a表示行数,b表示الإطار الزمني.

 استيراد pandas كـ pd
 استيراد numpy كـ np
  
 # تأسيس قاموس Series
 d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),}
    'Age':pd.Series([25,26,25,23,30,29,23]),
    'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
  
 # إنشاء DataFrame
 df = pd.DataFrame(d)
 print("جسمنا هو:")
 print df
 print ("The shape of the object is:")
 print(df.shape)

نتيجة التنفيذ:

     جسمنا هو:
   العمر الاسم التقييم
0  25  Tom  4.23
1  26  James  3.24
2  25  Ricky  3.98
3  23  Vin  2.56
4  30  Steve  3.20
5  29  Smith  4.60
6  23  Jack  3.80
شكل الجسد هو:
(7, 3)

size

استرداد عدد العناصر في DataFrame.

 استيراد pandas كـ pd
 استيراد numpy كـ np
  
 # تأسيس قاموس Series
 d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),}
    'Age':pd.Series([25,26,25,23,30,29,23]),
    'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
  
 # إنشاء DataFrame
 df = pd.DataFrame(d)
 print("جسمنا هو:")
 print df
 print("عدد العناصر الإجمالي في جسمنا هو:")
 print(df.size)

نتيجة التنفيذ:

     جسمنا هو:
    العمر الاسم التقييم
0 25 Tom  4.23
1 26 James  3.24
2 25 Ricky  3.98
3 23 Vin  2.56
4 30 Steve  3.20
5 29 Smith  4.60
6 23 Jack  3.80
عدد العناصر الإجمالي في جسمنا هو:
21

values

استرداد البيانات الفعلية في DataFrame بصيغة NDarray.

 استيراد pandas كـ pd
 استيراد numpy كـ np
  
 # تأسيس قاموس Series
 d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),}
    'Age':pd.Series([25,26,25,23,30,29,23]),
    'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
  
 # إنشاء DataFrame
 df = pd.DataFrame(d)
 print("جسمنا هو:")
 print df
 print("بيانات الحقيقة في جدول بياناتنا هي:")
 print(df.values)

نتيجة التنفيذ:

     جسمنا هو:
    العمر الاسم التقييم
0 25 Tom  4.23
1 26 James  3.24
2 25 Ricky  3.98
3 23 Vin  2.56
4 30 Steve  3.20
5 29 Smith  4.60
6 23 Jack  3.80
بيانات الحقيقة في جدول بياناتنا هي:
[[25  'Tom'  4.23]
[26  'James'  3.24]
[25  'Ricky'  3.98]
[23  'Vin'  2.56]
[30  'Steve'  3.2]
[29  'Smith'  4.6]
[23  'Jack'  3.8]

الرأس والذيل

للإطلاع على بيانات الرأس والذيل لج�체 DataFrame، استخدم طرق head() و tail(). تعود head() إلى n سطر (مراقبة قيم الأنماط). العدد الافتراضي للعناصر المعروضة هو 5، ولكن يمكنك تقديم رقم مخصص.

 استيراد pandas كـ pd
 استيراد numpy كـ np
  
 # تأسيس قاموس Series
 d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),}
    'Age':pd.Series([25,26,25,23,30,29,23]),
    'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
 # إنشاء DataFrame
 df = pd.DataFrame(d)
 print("جدول بياناتنا هو:")
 print df
 print("سطرين الأولى من جدول البيانات هي:")
 print(df.head(2))

نتيجة التنفيذ:

     جدول بياناتنا هو:
    العمر الاسم التقييم
0 25 Tom  4.23
1 26 James  3.24
2 25 Ricky  3.98
3 23 Vin  2.56
4 30 Steve  3.20
5 29 Smith  4.60
6 23 Jack  3.80
سطرين الأولى من جدول البيانات هي:
   العمر  الاسم  التقييم
0  25  Tom  4.23
1  26  James  3.24

tail() استرداد آخر n سطر (مراقبة قيم الأنماط). العدد الافتراضي للعناصر المعروضة هو 5، ولكن يمكنك تقديم رقم مخصص.

 استيراد pandas كـ pd
 استيراد numpy كـ np
 # تأسيس قاموس Series
 d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),}
    'Age':pd.Series([25,26,25,23,30,29,23]), 
    'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
  
 # إنشاء DataFrame
 df = pd.DataFrame(d)
 print ("جدول بياناتنا هو:")
 print df
 print ("السطرين الأخيرين للجدول هي:")
 print(df.tail(2))

نتيجة التنفيذ:

جدول بياناتنا هو:
    العمر الاسم التقييم
0 25 Tom  4.23
1 26 James  3.24
2 25 Ricky  3.98
3 23 Vin  2.56
4 30 Steve  3.20
5 29 Smith  4.60
6 23 Jack  3.80
السطرين الأخيرين للجدول هي:
    العمر الاسم التقييم
5 29 Smith  4.6
6 23 Jack  3.8