【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series

2023-07-18

数据索引切片

文章目录前言一、Series的创建1.1列表创建1.2NumPy数组创建1.3字典创建二、Series索引2.1显式索引2.2隐式索引三、Series切片2.1显式切片2.2隐式切片四、Series基本属性和方法4.1属性4.2方法4.3案例——使用bool值去除空值五、Series运算六、Seri

文章目录

前言
一、Series的创建
- 1.1 列表创建
- 1.2 NumPy数组创建
- 1.3 字典创建
二、Series索引
- 2.1 显式索引
- 2.2 隐式索引
三、Series切片
- 2.1 显式切片
- 2.2 隐式切片
四、Series基本属性和方法
- 4.1 属性
- 4.2 方法
- 4.3 案例——使用 bool 值去除空值
五、Series运算
六、Series多层行索引
- 6.1 Series多层索引的构建
- 6.2 Series多层索引的索引和切片操作
结语
相关导读

前言

大家好！我是一朵向阳花（花花花），本期跟大家分享的知识是 pandas 数据结构——Series。

作者的【 Python 数据分析】专栏正在火热更新中，如果本文对您有帮助，欢迎大家点赞 + 评论 + 收藏！

每日金句分享：愿你有一天，能和你最重要的人重逢。』—— 艾拉「可塑性记忆」。

一、Series的创建

Series 是一种类似于一维数组的对象，由下面两部分组成：

values：一组数据，ndarray 类型
index：数据索引

顾名思义，我们在创建 Series 对象时，需要传递一组数据，该数据大多数时候是可迭代对象。因此，下面三种创建方式都是将数据传入到 Series 方法中。

1.1 列表创建

list1 = list('ABCD') # 创建列表
s =pd.Series(list1) # 传递列表数据到 Series 方法中
print(s)
print(type(s.values))
print(type(s.index))
1
2
3
4
5

1.2 NumPy数组创建

n = np.array(range(5,10))
s2 = pd.Series(n)
s2
1
2
3

1.3 字典创建

前两种方式，都是只传递了数据，那么索引是默认索引（0 ~ N-1）；下面的字典创建方式，则是以字典的键为索引，字典的值为数据。

d = {
'a':11,'b':22,'c':33,'d':44
}
s = pd.Series(d)
s
1
2
3
4
5

二、Series索引

从以上 Series 的创建中我们可以看出，Series 的索引是可以修改的 。我们先来探讨以下索引的作用。

获取元素

有多种获取方式，s.索引名，s[‘索引名’]，s.loc[‘索引名’]

允许修改

（为 s.index 重新赋值即可，注意前后数量一致）

显式即表示使用索引名称的方式，隐式即表示使用序号的方式。后面的显式切片和隐式切片也是同理。

2.1 显式索引

取单个值时，三种方式：（假设 Series 对象名为 s）

s.索引名（数字索引不能用这种方式）
s[‘索引名’]
s.loc[‘索引名’]

取多个值时，返回一个新的 Series 对象，两种方式（也就是加中括号）：

s.[[‘索引名1’,‘索引名2’]]
s.loc[[‘索引名1’,‘索引名2’]]

s = pd.Series(np.array(range(5,10)),index=list('abcde'),name='number')
print(s)
display(s.a,s['a'],s.loc['a'])
1
2
3

2.2 隐式索引

隐式索引和显示索引的区别就是它通过数字来获取值。因为是数字，因此 s.number 这种方式肯定 不能用了 ，其他都相同。

取单值，两种方式：

s[number]
s.iloc[number]

取多值，两种方式：

s[[number1,number2]]
s.iloc[[number1,number2]]

s = pd.Series(np.array(range(5,10)),index=list('abcde'),name='number')
print(s)
print('取单值')
print(s[1])
print(s.iloc[1])
print('取多值')
print(s[[1,2]])
print(s.iloc[[1,2]])
1
2
3
4
5
6
7
8

三、Series切片

切片操作是获取一个新的 Series 对象的操作，显式切片是为左闭右臂，隐式切片时为左闭右开。

2.1 显式切片

两种方式：

s[索引名1：索引名2]
s.loc[索引名1：索引名2]

2.2 隐式切片

两种方式：

s[number1：number2]
s.iloc[number1：number2]

s = pd.Series({
'yw':100,
'math':150,
'eng':110,
'Python':130
})
print('数据：',end='')
print('-'*10)
print(s)
print('-'*10)
print('显式切片')
print(s['yw':'math'])
print('-'*10)
print(s.loc['yw':'math'])
print('-'*10)
print('隐式切片')
print(s[0:1])
print('-'*10)
print(s.iloc[0:1])
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

四、Series基本属性和方法

Series基本属性和方法是让我们更好了解数据组成的手段。

4.1 属性

属性	作用
s.shape	查看数据行列
s.ndim	查看维度，Series 就是一维，ndim 恒等于1
s.size	查看数据总数
s.index	查看索引
s.values	查看数据
s.name	查看 Series 对象的 name，若未设定则为空

4.2 方法

方法	功能
s.head()	查看前5条数据，若传入数字 n ，则查看前 n 条
s.tail()	查看后5条数据，若传入数字 n ，则查看后 n 条
s.isnull()	判断数据是否为空，空的为 True ，不空的为 False
s.notnull()	判断数据是否不空，空的为 False ，不空的为 True

4.3 案例——使用 bool 值去除空值

原理：Series 切片可以再传入一个 Series 对象，该 Series 对象索引要和原来相同，那么值为 False 的将不会被取出。

请看示例：

s = pd.Series(['a','e','f','b'])
s[pd.Series([True,True,False,True])]
1
2

如果改为：

s = pd.Series(['a','e','f','b'])
s[pd.Series([True,True,False,True],index=list('abcd'))]
1
2

那么将会报错：

下面是 Series 去除空值的案例。

s = pd.Series(['zhangsan','lisi','a',np.NAN,None])
print('数据：'+'-'*10)
print(s)
conditon = s.isnull()
print('判空情况：'+'-'*10)
print(conditon)
# 使用 bool 值索引过滤数据
s = s[~conditon]
print('过滤结果：'+'-'*10)
print(s)
1
2
3
4
5
6
7
8
9
10

五、Series运算

Series 运算包括算术运算和 Series 对象之间运算。算术运算是针对每一个元素的，有 +、-、*、/、 //、 %、 ** 等，这里不再赘述。Series 对象间的运算，只要记住，索引一个有一个没有时，计算值为 NaN，其他按照算术运算计算即可。

算术运算

s = pd.Series(np.array(range(5,10)))
print(s)
s * 10
1
2
3

Series对象间的运算

s1 = pd.Series(np.array(range(5,10)))
s2 = pd.Series([3,6,10,12])
print(s1)
print(s2)
s1 + s2 # 索引一个有一个没有时，计算值为 NaN
1
2
3
4
5

六、Series多层行索引

6.1 Series多层索引的构建

Series 不仅支持单层索引，还支持多层索引。最简单的实现方式就是将 index 设置成多维。

下面以二级行索引为例：

s = pd.Series(np.random.randint(60,100,6),index=[['语文','语文','语文','数学','数学','数学'],['小明','小红','小丽','小明','小红','小丽']])
print(s)
1
2

6.2 Series多层索引的索引和切片操作

对于 Series 多层索引的索引和切片操作，只要记住以下两点：

要先取第一层，再取第二层，不能直接取第二层索引
获取到第一层之后，就是一个普通的单层索引 Series
隐式索引，直接得到数

具体的方式，还是索引和切片都分为显式和隐式，下面通过一个案例来演示。

索引：

s = pd.Series(np.random.randint(60,100,6),index=[['语文','语文','语文','数学','数学','数学'],['小明','小红','小丽','小明','小红','小丽']])
print(s)
# 索引
print('显式索引：'+'-'*10)
print(s['语文']) # 获取到单层 Series
print(s.loc['语文']) 
print(s['语文']['小明'],s.loc['语文']['小明']) # 获取到单个值
print('隐式索引：'+'-'*10)
print(s.iloc[0])
print(s[0]) # 获取到单个值
1
2
3
4
5
6
7
8
9
10

切片：

s = pd.Series(np.random.randint(60,100,6),index=[['语文','语文','语文','数学','数学','数学'],['小明','小红','小丽','小明','小红','小丽']])
s = s.sort_index()
print(s)
print('显式切片'+'-'*10)
print(s['数学':'语文'])
print(s.loc['数学':'语文'])
print('隐式切片'+'-'*10)
print(s[0:2])
print(s.iloc[0:2])
1
2
3
4
5
6
7
8
9

结语

💕 本期跟大家分享的 “芝士” 就到此结束了，关于 Series 数据结构，你学会了吗？✨

🍻 我是向阳花花花花，在学习的路上一直前行，期待与你一起进步。~ 🍻

🔥如果文中有些地方不清楚的话，欢迎联系我，我会给大家提供思路及解答。🔥

文章直达	链接
上期回顾	【数据分析 - 基础入门之pandas篇①】- pandas介绍
下期预告	【数据分析 - 基础入门之pandas篇③】- pandas数据结构——DataFrame

深圳幻海软件技术有限公司

【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series

文章目录

前言

一、Series的创建

1.1 列表创建

1.2 NumPy数组创建

1.3 字典创建

二、Series索引

2.1 显式索引

2.2 隐式索引

三、Series切片

2.1 显式切片

2.2 隐式切片

四、Series基本属性和方法

4.1 属性

4.2 方法

4.3 案例——使用 bool 值去除空值

五、Series运算

六、Series多层行索引

6.1 Series多层索引的构建

6.2 Series多层索引的索引和切片操作

结语

相关导读

茶余饭后聊聊 Vue3.0 响应式数据那些事儿

STM32编程中枚举和结构体的结合

中国首位游戏设计博士黄石：今日之技术即未来之艺术！所有技术都在加速发展

如何随意切换 NodeJs 版本？

Transformer与看图说话

短信验证码的安全隐患

前端面试题JavaScript篇——2022-09-20

2023年值得推荐的老人机排行榜

深圳幻海软件技术有限公司

【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series

文章目录

前言

一、Series的创建

1.1 列表创建

1.2 NumPy数组创建

1.3 字典创建

二、Series索引

2.1 显式索引

2.2 隐式索引

三、Series切片

2.1 显式切片

2.2 隐式切片

四、Series基本属性和方法

4.1 属性

4.2 方法

4.3 案例——使用 bool 值去除空值

五、Series运算

六、Series多层行索引

6.1 Series多层索引的构建

6.2 Series多层索引的索引和切片操作

结语

相关导读

【算法系列篇】滑动窗口

走进人工智能|深度学习 算法的创世纪

走进人工智能|深度学习算法的创世纪