English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

وظائف الإحصاء في NumPy

numpy.amin() و numpy.amax()

numpy.amin() تستخدم لحساب أصغر قيمة للعناصر في المجموعة على المحور المحدد.
numpy.amax() تستخدم لحساب أكبر قيمة للعناصر في المجموعة على المحور المحدد.

 import numpy as np 
 a = np.array([[3,7,5],[8,4,3],[2,4,9]]) 
 print('مجموعتنا هي:', a)
 print('ندعو إلى وظيفة amin():', np.amin(a, 1))
 print('ندعو إلى وظيفة amin() مرة أخرى:', np.amin(a, 0))
 print('ندعو إلى وظيفة amax():', np.amax(a))
 print('ندعو إلى وظيفة amax() مرة أخرى:', np.amax(a, axis=0))

النتيجة الصادرة هي:

 مجموعتنا هي: [[3 7 5]
  [8 4 3]
  [2 4 9]
 ندعو إلى وظيفة amin(): [3 3 2]
 ندعو إلى وظيفة amin() مرة أخرى: [2 4 3]
 ندعو إلى وظيفة amax(): 9
 ندعو إلى وظيفة amax() مرة أخرى: [8 7 9]

numpy.ptp()

وظيفة numpy.ptp() تقوم بحساب الفرق بين أكبر قيمة وأصغر قيمة في المجموعة (أكبر قيمة - أصغر قيمة).

 import numpy as np 
 a = np.array([[3,7,5],[8,4,3],[2,4,9]]) 
 print('ندعو إلى وظيفة ptp():', np.ptp(a))
 print('ندعو إلى وظيفة ptp() على المحور 1:', np.ptp(a, axis=1))
 print('ندعو إلى وظيفة ptp() على المحور 0:', np.ptp(a, axis=0))

النتيجة الصادرة هي:

 ندعو إلى وظيفة ptp(): 7
 ندعو إلى وظيفة ptp() على المحور 1: [4 5 7]
 ندعو إلى وظيفة ptp() على المحور 0: [6 3 6]

numpy.percentile()

القسط المئوي هو مقياس يستخدم في الإحصاءات ليعكس نسبة القيم التي هي أقل من القيمة المحددة.

numpy.percentile(a, q, axis)

شرح المعلمات:

a: المجموعة المدخلة q: القسط المئوي المراد حسابه، بين 0 و 100 ال محور: المحور الذي يتم حساب القسط المئوي عليه

أولاً، نحدد القسط المئوي:

القسط الأول هو قيمة تجعل على الأقل p% من القيم أقل أو مساوية لها، و على الأقل (100-p)% من القيم أكبر أو مساوية لها.
لنأخذ مثالًا: عادة ما تُعرض النتائج الرسمية للامتحانات الدخول في الجامعات بالشكل المئوي. على سبيل المثال، لنفترض أن نتيجة الطالب في جزء اللغة الصينية في امتحان الدخول هو 54 نقطة. من الصعب معرفة كيفية أداء الطالب مقارنة بالآخرين الذين شاركوا في نفس الإمتحان. ولكن إذا كانت النقطة الأصلية 54 نقطة تساوي الـ 70% من التوزيع، فإننا نعلم أن حوالي 70% من الطلاب لديهم نتيجة أقل من هذا الطالب، وحوالي 30% من الطلاب لديهم نتيجة أعلى.

هنا p = 70.

 import numpy as np 
 a = np.array([[10, 7, 4], [3, 2, 1]])
 # الـ 50% من التوزيع، هي القيمة الوسطى بعد ترتيب a
 print ('دعوة دالة percentile():', np.percentile(a, 50)) 
 # محور axis = 0، في العمود
 print (np.percentile(a, 50, axis=0)) 
 # محور axis = 1، في الصف
 print (np.percentile(a, 50, axis=1)) 
 # الحفاظ على الأبعاد غير المعدومة
 print (np.percentile(a, 50, axis=1, keepdims=True))

النتيجة الصادرة هي:

 دعوة دالة percentile() 3.5
 [6.5 4.5 2.5]
 [7. 2.]
 [[7.]]
 [2.]

numpy.median()

�数ونبليك.متوسط() يستخدم لتحديد متوسط العناصر في المصفوفة a (القيمة الوسطى).

 import numpy as np 
 a = np.array([[30,65,70],[80,95,10],[50,90,60]]) 
 print ('دعوة دالة median():', np.median(a))
 print ('دعوة دالة median() على المحور 0:', np.median(a, axis=0))
 print ('دعوة دالة median() على المحور 1:', np.median(a, axis=1))

النتيجة الصادرة هي:

 دعوة دالة median() 65.0
 دعوة دالة median() على المحور 0: [50. 90. 60.]
 دعوة دالة median() على المحور 1: [65. 80. 60.]

numpy.mean()

�数ونبليك.متوسط() يعود بقيمة المتوسط الحسابي للعناصر في المصفوفة. إذا تم تقديم المحور، يتم حسابها على طول هذا المحور.
القيمة المتوسطة الحسابية هي مجموع العناصر على المحور مقسومًا على عدد العناصر.

 import numpy as np 
 a = np.array([[1,2,3],[3,4,5],[4,5,6]]) 
 print ('调用 mean() 函数:',(np.mean(a))
 اطبع ('استدعاء mean() مرة أخرى: ', (np.mean(a)))
 اطبع ('استدعاء mean() على المحور 0: ', np.mean(a, axis=0))

النتيجة الصادرة هي:

 اطبع ('استدعاء mean() على المحور 1: ', np.mean(a, axis=1))
 استدعاء mean() مرة أخرى: 3.6666666666666665
 استدعاء mean() على المحور 0: [2.66666667 3.66666667 4.66666667]

استدعاء mean() على المحور 1: [2.، 4.، 5.]

numpy.average()
وظيفة numpy.average() تقوم بحساب متوسط الوزن للعناصر في المصفوفة بناءً على الأوزان المقدمة في مصفوفة أخرى.
يمكن لهذه الوظيفة استقبال معامل محور. إذا لم يتم تحديد المحور، يتم فتح المصفوفة.
لتحديد متوسط الوزن الم加权، قم بضرب كل عنصر في المصفوفة في الوزن الم对应، ثم قم بجمع النواتج واقسمها على مجموع الأوزان.

متوسط الوزن الم加权 = (1*4 + 2*3 + 3*2 + 4*1) / (4 + 3 + 2 + 1)
 import numpy as np 
 a = np.array([1, 2, 3, 4]) 
 اطبع ('استدعاء average() مرة أخرى: ', np.average(a))
 # إذا لم يتم تحديد الأوزان، فإنها تشبه دالة mean
 wts = np.array([4, 3, 2, 1]) 
 اطبع ('إعادة التشغيل average() مرة أخرى: ', np.average(a, weights=wts))
 # إذا كان المعامل returned معينًا على أنه True، فإنه يرجع مجموع الأوزان 
 اطبع ('مجموع الأوزان: ', np.average([1, 2, 3, 4], weights=[4, 3, 2, 1], returned=True))

النتيجة الصادرة هي:

 استدعاء average() مرة أخرى: 2.5
 إعادة التشغيل average() مرة أخرى: 2.0
 مجموع الأوزان: (2.0, 10.0)

في مصفوفات متعددة الأبعاد، يمكنك تحديد المحور المستخدمة للحساب.

 import numpy as np 
 a = np.arange(6).reshape(3, 2) 
 wt = np.array([3, 5]) 
 اطبع ('العدد المعدل بعد التعديل: ', np.average(a, axis=1, weights=wt))
 print ('العدد المعدل: ',np.average(a, axis = 1, weights = wt, returned = True))

النتيجة الصادرة هي:

 العدد المعدل: [0.625 2.625 4.625]
 العدد المعدل: (array([0.625, 2.625, 4.625]), array([8., 8., 8.]))

التنسيق

التنسيق هو مقياس لمدى توزيع قيمة المتوسط ل مجموعة البيانات.
التنسيق هو الجذر التربيعي للتنسيق.
صيغة التنسيق هي كما يلي:

 std = sqrt(mean((x - x.mean())**2))

إذا كان التتابع هو [1،2،3،4]، فإن متوسطه هو 2.5. لذلك، مربعات الاختلاف هي [2.25،0.25،0.25،2.25]، وثم الحاصل على جذر المربع للمتوسط وهو sqrt(5/4) وهو 1.1180339887498949.

import numpy as np 
print (np.std([1,2,3,4]))

النتيجة الصادرة هي:

1.1180339887498949

التنسيق

التنسيق في الإحصاء (التنسيق القياسي للعينة) هو متوسط قيمة كل قيمة عينية مرفوعة إلى مربع، أي mean((x - x.mean())** 2).
بعبارة أخرى، هو جذر المربع للمعياري.

import numpy as np 
print (np.var([1,2,3,4]))
1.25