English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية
Pandas Series基本操作
Series结构如下:
pandas.Series( data, index, dtype, copy)
构造函数的参数如下-
data: 数据采用各种形式,例如ndarray,list,常量 index: 索引值必须是唯一且可哈希的,且长度与数据相同。如果未传递索引,则默认为np.arrange(n)。 dtype: dtype用于数据类型。如果为None,则将推断数据类型 نسخ: نسخ البيانات. الافتراض هو لا
يمكن إنشاء Series باستخدام مجموعة متنوعة من المدخلات، مثل
مجموعة دليل قيمة مطلقة أو ثابتة
>>> # قم بتعريف مكتبة pandas وتسميتها >>> import pandas as pd >>> s = pd.Series() >>> print(s) Series([], dtype: float64)
إذا كانت البيانات ndarray، فيجب أن يكون طول المؤشر الذي يتم تقديمه نفس الطول. إذا لم يتم تقديم مؤشر، فإن المؤشر الافتراضي سيكون range(n)، حيث n هو طول النطاق، أي [0, 1, 2, 3…].
# Filename: pandas.py # author by: ar.oldtoolbag.com # استيراد مكتبة pandas واستخدام اسم بديل import pandas as pd import numpy as np data = np.array(['a', 'b', 'c', 'd']) s = pd.Series(data) print(s)
نتيجة التنفيذ:
0 a 1 b 2 c 3 d dtype: object
لم نرسل أي مؤشر، لذا تم تخصيص النطاق الافتراضي للمؤشرات ك范围为 0 إلى len(data)-1، أي 0 إلى 3.
# Filename: pandas.py # author by: ar.oldtoolbag.com # استيراد مكتبة pandas واستخدام اسم بديل import pandas as pd import numpy as np data = np.array(['a', 'b', 'c', 'd']) s = pd.Series(data, index=[100, 101, 102, 103]) print(s)
نتيجة التنفيذ:
100 a 101 b 102 c 103 d dtype: object
نحن نرسل قيم مؤشر هنا. الآن، يمكننا رؤية قيم مؤشرات التحكم المخصصة في الخروج.
يمكن استخدام الدليل كمدخل، إذا لم يتم تحديد المؤشر، فإن مفتاحي الدليل يتم أخذها في ترتيبها لإنشاء المؤشر. إذا تم تقديم المؤشر، فإن القيم التي تتوافق مع علامات المؤشر ستُسحب.
# Filename: pandas.py # author by: ar.oldtoolbag.com # استيراد مكتبة pandas واستخدام اسم بديل import pandas as pd import numpy as np data = {'a': 0., 'b': 1., 'c': 2.} s = pd.Series(data) print(s)
نتيجة التنفيذ:
a 0.0 b 1.0 c 2.0 dtype: float64
استخدام مفتاح الدليل لبناء المؤشر
# Filename: pandas.py # author by: ar.oldtoolbag.com # استيراد مكتبة pandas واستخدام اسم بديل import pandas as pd import numpy as np data = {
نتيجة التنفيذ:
b 1.0 c 2.0 d NaN a 0.0 dtype: float64
ترتبة المؤشرات تظل كما هي، وتُملأ العناصر المفقودة بNaN (غير رقمي)
إذا كانت البيانات قيمة مطلقة، فيجب تقديم المؤشر. سيتم تكرار القيمة لتناسب طول المؤشر
# Filename: pandas.py # author by: ar.oldtoolbag.com # استيراد مكتبة pandas واستخدام اسم بديل import pandas as pd import numpy as np s = pd.Series(5, index=[0, 1, 2, 3]) print(s)
نتيجة التنفيذ:
0 5 1 5 2 5 3 5 dtype: int64
يمكن الوصول إلى البيانات في Series مثل الوصول إلى ndarray.
البحث عن العنصر الأول. من المعروف أن عدادات الأنواع تبدأ من الصفر، مما يعني أن العنصر الأول يتم تخزينه في الموقع الصفر، وبالتالي.
# Filename: pandas.py # author by: ar.oldtoolbag.com # استيراد مكتبة pandas واستخدام اسم بديل import pandas as pd s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e']) # البحث عن البيانات الأولية print(s[0])
نتيجة التنفيذ:
1
البحث عن الثلاثة عناصر الأولى في Series. إذا تم إدراجهما في البداية، فإن جميع العناصر بعد هذا المؤشر سيتم استخراجها. إذا تم استخدام عاملين (مفصولين بثلاث نقاط)، فإن العناصر بين المؤشرين (لا يشمل المؤشر النهائي)
# Filename: pandas.py # author by: ar.oldtoolbag.com # استيراد مكتبة pandas واستخدام اسم بديل import pandas as pd s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e']) # البحث عن الثلاثة عناصر الأولى print(s[:3])
نتيجة التنفيذ:
a 1 b 2 c 3 dtype: int64
البحث عن الثلاثة عناصر الأخيرة.
# Filename: pandas.py # author by: ar.oldtoolbag.com # استيراد مكتبة pandas واستخدام اسم بديل s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e']) # البحث عن الثلاثة عناصر الأخيرة print(s[-3:])
نتيجة التنفيذ:
c 3 d 4 e 5 dtype: int64
Series تشبه قاموس حجم ثابت، يمكن الحصول على وتعيين القيم عبر الاشارات المرجعية
البحث عن عنصر واحد باستخدام علامة مرجعية
# Filename: pandas.py # author by: ar.oldtoolbag.com # استيراد مكتبة pandas واستخدام اسم بديل import pandas as pd s = pd.Series([1,2,3,4,5],index = [
نتيجة التنفيذ:
1
البحث عن عدة عناصر باستخدام قائمة القيم للاشارات المرجعية
# Filename: pandas.py # author by: ar.oldtoolbag.com # استيراد مكتبة pandas واستخدام اسم بديل import pandas as pd s = pd.Series([1,2,3,4,5],index = [
نتيجة التنفيذ:
a 1 c 3 d 4 dtype: int64
إذا لم يكن يحتوي على العلامات، فإنه سيكون هناك استثناء.
# Filename: pandas.py # author by: ar.oldtoolbag.com # استيراد مكتبة pandas واستخدام اسم بديل import pandas as pd s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e']) # البحث عن عدة عناصر print(s['f'])
نتيجة التنفيذ:
... KeyError: 'f'