English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية
مثال على الطريقة الأساسية لـ Pandas
حتى الآن، لقد تعرفنا على ثلاثة بنيات بيانات Pandas وكيفية إنشائها. نظرًا لأهميته في معالجة البيانات في الوقت الحقيقي، سنركز بشكل رئيسي على مجرد DataFrame، وسنناقش بعض بنيات البيانات الأخرى.
الطريقة | وصف |
axes | يعود قائمة بتسميات المحاور. |
dtype | يعود dtype للمجرد. |
empty | إذا كانت Series فارغة، فإنها تعود True. |
ndim | يعود أبعاد البيانات الأساسية بناءً على التعريف. |
size | يعود عدد العناصر في البيانات الأساسية. |
values | يعود Series كndarray. |
head() | يتم عودة النسخة الأولى من n صف. |
tail() | يتم عودة النسخة الأخيرة من n صف. |
استيراد pandas كـ pd استيراد numpy كـ np # أنشئ Series باستخدام 100 عدد عشوائي s = pd.Series(np.random.randn(4)) print(s)
نتيجة التنفيذ:
0 0.967853 1 -0.148368 2 -1.395906 3 -1.758394 dtype: float64
استرداد قائمة علامات Series
استيراد pandas كـ pd استيراد numpy كـ np # أنشئ Series باستخدام 100 عدد عشوائي s = pd.Series(np.random.randn(4)) print ("الأعمدة هي:") print(s.axes)
نتيجة التنفيذ:
الأعمدة هي: [RangeIndex(start=0, stop=4, step=1)]
النتائج أعلاه هي من 0 إلى 5 (أي [0,1,2,3,4]).
استرداد قيمة بولية، تشير إلى ما إذا كان العنصر فارغًا. True يعني أن العنصر فارغ
استيراد pandas كـ pd استيراد numpy كـ np # أنشئ Series باستخدام 100 عدد عشوائي s = pd.Series(np.random.randn(4)) print ("هل العنصر فارغ؟") print(s.empty)
نتيجة التنفيذ:
هل العنصر فارغ؟ False
استرداد أبعاد العنصر. وفقًا للتعريف، Series هي بنية بيانات 1D، لذا يُرجع
استيراد pandas كـ pd استيراد numpy كـ np # يتم إنشاء سلسلة باستخدام 4 أرقام عشوائية s = pd.Series(np.random.randn(4)) print(s) print ("مقاييس العنصر:") print(s.ndim)
نتيجة التنفيذ:
0 0.175898 1 0.166197 2 -0.609712 3 -1.377000 dtype: float64 مقاييس العنصر: 1
استرداد حجم Series (الطول).
استيراد pandas كـ pd استيراد numpy كـ np # يتم إنشاء سلسلة باستخدام 4 أرقام عشوائية s = pd.Series(np.random.randn(2)) print(s) print ("حجم العنصر:") print(s.size)
نتيجة التنفيذ:
0 3.078058 1 -1.207803 dtype: float64 حجم العنصر: 2
استرداد بيانات Series كنموذج مصفوفة
استيراد pandas كـ pd استيراد numpy كـ np # يتم إنشاء سلسلة باستخدام 4 أرقام عشوائية s = pd.Series(np.random.randn(4)) print(s) print ("السلسلة البيانية الفعلية هي:") print(s.values)
نتيجة التنفيذ:
0 1.787373 1 -0.605159 2 0.180477 3 -0.140922 dtype: float64 السلسلة البيانية الفعلية هي: [ 1.78737302 -0.60515881 0.18047664 -0.1409218 ]
للإطلاع على بيانات الرسالة أو DataFrame، استخدم الأساليب head() و tail().
head() استرداد النسخ الأولية من n سطر (مراجعة مؤشرات النسخ). يظهر العدد الافتراضي للعناصر هو 5، ولكن يمكنك تقديم رقم مخصص.
استيراد pandas كـ pd استيراد numpy كـ np # يتم إنشاء سلسلة باستخدام 4 أرقام عشوائية s = pd.Series(np.random.randn(4)) print ("السلسلة الأصلية هي:") print(s) print("السلسلة البيانية الأولى من سطرين:") print(s.head(2))
نتيجة التنفيذ:
السلسلة الأصلية هي: 0 0.720876 1 -0.765898 2 0.479221 3 -0.139547 dtype: float64 السلسلة البيانية الأولى من سطرين: 0 0.720876 1 -0.765898 dtype: float64
tail() استرداد آخر n سطر (مراقبة قيم الأنماط). العدد الافتراضي للعناصر المعروضة هو 5، ولكن يمكنك تقديم رقم مخصص.
استيراد pandas كـ pd استيراد numpy كـ np # يتم إنشاء سلسلة باستخدام 4 أرقام عشوائية s = pd.Series(np.random.randn(4)) print("السلسلة الأصلية هي:") print(s) print("السلسلة البيانية الأخيرة من سطرين:") print(s).tail(2)
نتيجة التنفيذ:
السلسلة الأصلية هي: 0 -0.655091 1 -0.881407 2 -0.608592 3 -2.341413 dtype: float64 السلسلة البيانية الأخيرة من سطرين: 2 -0.608592 3 -2.341413 dtype: float64
دعونا نتعرف على ما هو DataFrame الأساسي. يعرض الجدول أدناه بعض الخصائص أو الطرق المهمة التي تساعد في وظائف DataFrame الأساسية.
خصائص/طرق | وصف |
T | تبادل الصفوف والعمود |
axes | يتم عودة قائمة تحتوي على أعضاء فريدون هم علامات المحاور والعمود. |
dtypes | يتم عودة dtypes هذا العنصر. |
empty | إذا كانت NDataFrame فارغة تمامًا [لا تحتوي على أي مشاريع],则为 true؛ وإلا则为 false. إذا كان طول أي محور يساوي 0. |
ndim | عدد الأبعاد/حجم الماتريس. |
shape | يتم عودة زوج يمثل أبعاد DataFrame. |
size | عدد العناصر في NDataFrame. |
values | مقدار NDataFrame. |
head() | يتم عودة النسخة الأولى من n صف. |
tail() | يتم عودة النسخة الأخيرة من n صف. |
فيما يلي، سنقوم بإنشاء DataFrame ونرى كيفية تنفيذ جميع العمليات المذكورة أعلاه.
استيراد pandas كـ pd استيراد numpy كـ np # تأسيس قاموس Series d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),} 'Age':pd.Series([25,26,25,23,30,29,23]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])} # إنشاء DataFrame df = pd.DataFrame(d) print("سلسلة بياناتنا هي:") print(df)
نتيجة التنفيذ:
سلسلة بياناتنا هي: العمر الاسم التقييم 0 25 Tom 4.23 1 26 James 3.24 2 25 Ricky 3.98 3 23 Vin 2.56 4 30 Steve 3.20 5 29 Smith 4.60 6 23 Jack 3.80
يتم عودة التحويل العكسي للDataFrame. سيتم تبادل الصفوف والعمود.
استيراد pandas كـ pd استيراد numpy كـ np # تأسيس قاموس Series d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),} 'Age':pd.Series([25,26,25,23,30,29,23]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])} # إنشاء DataFrame df = pd.DataFrame(d) print("التحويل العكسي للسلسلة البيانية هو:") print(df.T)
نتيجة التنفيذ:
التحويل العكسي للسلسلة البيانية هو: 0 1 2 3 4 5 6 Age 25 26 25 23 30 29 23 Name Tom James Ricky Vin Steve Smith Jack Rating 4.23 3.24 3.98 2.56 3.2 4.6 3.8
返回行轴标签和列轴标签的列表。
استيراد pandas كـ pd استيراد numpy كـ np # تأسيس قاموس Series d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),} 'Age':pd.Series([25,26,25,23,30,29,23]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])} # إنشاء DataFrame df = pd.DataFrame(d) print ("行轴标签和列轴标签是:") print(df.axes)
نتيجة التنفيذ:
行轴标签和列轴标签是: [RangeIndex(start=0, stop=7, step=1), Index([u'Age', u'Name', u'Rating'], dtype='object')]
返回每一列的数据类型。
استيراد pandas كـ pd استيراد numpy كـ np # تأسيس قاموس Series d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),} 'Age':pd.Series([25,26,25,23,30,29,23]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])} # إنشاء DataFrame df = pd.DataFrame(d) print ("每列的数据类型如下:") print(df.dtypes)
نتيجة التنفيذ:
每列的数据类型如下: Age int64 Name object Rating float64 dtype: object
返回布尔值,说明对象是否为空;True表示对象为空。
استيراد pandas كـ pd استيراد numpy كـ np # تأسيس قاموس Series d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),} 'Age':pd.Series([25,26,25,23,30,29,23]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])} # إنشاء DataFrame df = pd.DataFrame(d) print ("Is the object empty?") print(df.empty)
نتيجة التنفيذ:
Is the object empty? False
返回对象的数量。根据定义,DataFrame是2D对象。
استيراد pandas كـ pd استيراد numpy كـ np # تأسيس قاموس Series d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),} 'Age':pd.Series([25,26,25,23,30,29,23]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])} # إنشاء DataFrame df = pd.DataFrame(d) print("جسمنا هو:") print df print ("The dimension of the object is:") print(df.ndim)
نتيجة التنفيذ:
جسمنا هو: Age Name Rating 0 25 Tom 4.23 1 26 James 3.24 2 25 Ricky 3.98 3 23 Vin 2.56 4 30 Steve 3.20 5 29 Smith 4.60 6 23 Jack 3.80 The dimension of the object is: 2
返回表示DataFrame维度的元组。元组(a,b),其中a表示行数,b表示الإطار الزمني.
استيراد pandas كـ pd استيراد numpy كـ np # تأسيس قاموس Series d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),} 'Age':pd.Series([25,26,25,23,30,29,23]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])} # إنشاء DataFrame df = pd.DataFrame(d) print("جسمنا هو:") print df print ("The shape of the object is:") print(df.shape)
نتيجة التنفيذ:
جسمنا هو: العمر الاسم التقييم 0 25 Tom 4.23 1 26 James 3.24 2 25 Ricky 3.98 3 23 Vin 2.56 4 30 Steve 3.20 5 29 Smith 4.60 6 23 Jack 3.80 شكل الجسد هو: (7, 3)
استرداد عدد العناصر في DataFrame.
استيراد pandas كـ pd استيراد numpy كـ np # تأسيس قاموس Series d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),} 'Age':pd.Series([25,26,25,23,30,29,23]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])} # إنشاء DataFrame df = pd.DataFrame(d) print("جسمنا هو:") print df print("عدد العناصر الإجمالي في جسمنا هو:") print(df.size)
نتيجة التنفيذ:
جسمنا هو: العمر الاسم التقييم 0 25 Tom 4.23 1 26 James 3.24 2 25 Ricky 3.98 3 23 Vin 2.56 4 30 Steve 3.20 5 29 Smith 4.60 6 23 Jack 3.80 عدد العناصر الإجمالي في جسمنا هو: 21
استرداد البيانات الفعلية في DataFrame بصيغة NDarray.
استيراد pandas كـ pd استيراد numpy كـ np # تأسيس قاموس Series d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),} 'Age':pd.Series([25,26,25,23,30,29,23]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])} # إنشاء DataFrame df = pd.DataFrame(d) print("جسمنا هو:") print df print("بيانات الحقيقة في جدول بياناتنا هي:") print(df.values)
نتيجة التنفيذ:
جسمنا هو: العمر الاسم التقييم 0 25 Tom 4.23 1 26 James 3.24 2 25 Ricky 3.98 3 23 Vin 2.56 4 30 Steve 3.20 5 29 Smith 4.60 6 23 Jack 3.80 بيانات الحقيقة في جدول بياناتنا هي: [[25 'Tom' 4.23] [26 'James' 3.24] [25 'Ricky' 3.98] [23 'Vin' 2.56] [30 'Steve' 3.2] [29 'Smith' 4.6] [23 'Jack' 3.8]
للإطلاع على بيانات الرأس والذيل لج�체 DataFrame، استخدم طرق head() و tail(). تعود head() إلى n سطر (مراقبة قيم الأنماط). العدد الافتراضي للعناصر المعروضة هو 5، ولكن يمكنك تقديم رقم مخصص.
استيراد pandas كـ pd استيراد numpy كـ np # تأسيس قاموس Series d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),} 'Age':pd.Series([25,26,25,23,30,29,23]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])} # إنشاء DataFrame df = pd.DataFrame(d) print("جدول بياناتنا هو:") print df print("سطرين الأولى من جدول البيانات هي:") print(df.head(2))
نتيجة التنفيذ:
جدول بياناتنا هو: العمر الاسم التقييم 0 25 Tom 4.23 1 26 James 3.24 2 25 Ricky 3.98 3 23 Vin 2.56 4 30 Steve 3.20 5 29 Smith 4.60 6 23 Jack 3.80 سطرين الأولى من جدول البيانات هي: العمر الاسم التقييم 0 25 Tom 4.23 1 26 James 3.24
tail() استرداد آخر n سطر (مراقبة قيم الأنماط). العدد الافتراضي للعناصر المعروضة هو 5، ولكن يمكنك تقديم رقم مخصص.
استيراد pandas كـ pd استيراد numpy كـ np # تأسيس قاموس Series d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),} 'Age':pd.Series([25,26,25,23,30,29,23]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])} # إنشاء DataFrame df = pd.DataFrame(d) print ("جدول بياناتنا هو:") print df print ("السطرين الأخيرين للجدول هي:") print(df.tail(2))
نتيجة التنفيذ:
جدول بياناتنا هو: العمر الاسم التقييم 0 25 Tom 4.23 1 26 James 3.24 2 25 Ricky 3.98 3 23 Vin 2.56 4 30 Steve 3.20 5 29 Smith 4.60 6 23 Jack 3.80 السطرين الأخيرين للجدول هي: العمر الاسم التقييم 5 29 Smith 4.6 6 23 Jack 3.8