Python中的一切都是对象。每个对象都有自己的数据属性和与之关联的方法。为了有效和恰当地使用一个对象,我们应该知道如何与它们交互。
列表、元组和集合是三种重要的对象类型。它们的共同点是它们都被用作数据结构。为了创建健壮且性能良好的产品,必须非常了解编程语言的数据结构。
在这篇文章中,我们将看到这些结构如何收集和存储数据,以及我们可以对它们进行的操作。我们将看到它们之间的异同。
让我们先简要解释一下这些对象是什么。然后我们将对每个例子进行详细说明。
- List是Python中的一个内置数据结构。它用方括号中的数据点集合表示。列表可用于存储任何数据类型或不同的数据类型。列表是可变的,这也是它们如此常用的原因之一。
- 元组是用逗号分隔并用括号括起来的值的集合。与列表不同,元组是不可变的。不变性可以看作元组的识别特征。
- Set是不同的不可变对象的无序集合。集合包含唯一的元素。虽然集合是可变的,但是集合的元素必须是不可变的。没有与集合的元素相关联的顺序。因此,它不像列表那样支持索引或切片。
我们现在对这些容器有了基本的了解。下面的示例将介绍如何与这些对象交互。
1.列表与集合
我们可以根据字符串中的字符创建列表或集合。要使用的函数是list和set函数。
text = "Hello World!"
print(list(text))
['H', 'e', 'l', 'l', 'o', ' ', 'W', 'o', 'r', 'l', 'd', '!']
print(set(text))
{'H', 'W', 'o', ' ', 'l', 'r', '!', 'e', 'd'}
结果列表和集合对象的区别:
- 列表包含所有字符,而集合只包含唯一字符。
- 列表是根据字符串中字符的顺序排序的。集合的元素并没有顺序。
2.列表与集合索引
在前面的例子中,我们看到集合不具有顺序。因此,我们不能像处理列表那样对集合进行切片或索引。
text = "Hello World!"
list_a = list(text)
print(list_a[:2])
['H','e']
set_a = set(text)
print(set_a[:2])
TypeError: 'set' object is not subscriptable
对集合进行切片或索引会引发类型错误,因为这是与集合对象类型的属性相关的问题。
3.列表与元组
列表和元组的区别在于易变性。与列表不同,元组是不可变的。例如,我们可以向列表添加项,但元组不行。
list_a = [1,2,3,4]
list_a.append(5)
print(list_a)
[1,2,3,4,5]
tuple_a = (1,2,3,4)
tuple_a.append(5)
AttributeError: 'tuple' object has no attribute 'append'
更改集合的函数(例如append、remove、extend、pop)不适用于元组。
4.元组中的可变元素
不变性可能是元组最具识别性的特征。元组确定后不能改变。
tuple_a = (3, 5, 'x', 5)
tuple_a[0] = 7 # 错误
虽然元组是不可变的,但是它们可以包含可变的元素,比如列表或集合。
tuple_a = ([1,3], 'a', 'b', 8)
tuple_a[0][0] = 99
print(tuple_a)
([99, 3], 'a', 'b', 8)
5.Del函数
Del函数代表delete,因此它用于从集合中删除项。它接受要删除的项的索引。
由于集合是无序的,因此它们中没有项的索引。因此,del函数不能用于集合。
list_a = [1, 2, 3, 4]
del(list_a[0])
print(list_a)
[2, 3, 4]
注意:有两种方法可以索引列表:
- 自始至终:0,1,2,3
- 从尾到头:-1,-2,-3
6.Remove函数
与del函数不同,remove函数可用于列表和集合。我们传递要删除的项而不是其索引。
list_a = ['a','b',3,6]
list_a.remove('a')
print(list_a)
['b', 3, 6]
set_a = {'a','b',3,6}
set_a.remove('a')
print(set_a)
{3, 6, 'b'}
7.Discard函数
Discard也可用于从集合中移除项。但是列表没有discard属性。
当我们试图删除一个不在集合中的项目时,我们会观察到“remove”和“Discard”之间的区别。Remove将引发一个错误,但discard不会发生任何操作。
# remove
a = {1,2,3}
a.remove(5)
KeyError: 5
# Discard
a = {1,2,3}
a.discard(5)
print(a)
{1,2,3}
8.Pop函数
Pop函数可用于列表和集合。但是,它在列表和集合上的工作方式不同。
默认情况下,pop函数从列表中删除最后一项并返回它。因此,我们可以把它赋给一个变量。我们可以将索引传递给pop函数,删除特定索引处的元素。例如,pop(-2)将从末尾删除第二项。
list_a = ['a','b',3,6,4]
item = list_a.pop()
print(list_a)
['a', 'b', 3, 6]
print(item)
4
在集合上使用时,pop函数会删除任意项,因为集合中没有索引或顺序。
set_a = {'a','b',3, 6, 4}
item2 = set_a.pop()
print(set_a)
{4, 6, 'a', 'b'}
print(item2)
3
9.元组或元组列表
这些集合对象可以从一个集合对象转换为另一个集合对象。如名称所示,要使用的函数是list、tuple和set。
a = [1,2,3,'a',1,3,5]
print(tuple(a))
(1, 2, 3, 'a', 1, 3, 5)
print(set(a))
{1, 2, 3, 5, 'a'}
b = {'a',1, 4, 8}
print(list(b))
[8, 1, 4, 'a']
print(tuple(b))
(8, 1, 4, 'a')
10.添加新项目
由于元组是不可变的,我们只能向列表或集合添加新项。
例如,append方法在列表末尾添加一个项。由于集合没有结束或开始的概念,我们不能使用append方法。对于集合,add方法用于添加新项。
a = [1,2,3]
a.append(4)
print(a)
[1,2,3,4]
b = {1,2,3}
b.add(4)
print(b)
{1,2,3,4}
11.将项目插入列表
insert函数还用于向列表中添加元素。但是,它允许指定新元素的索引。例如,我们可以在列表的开头添加一个新元素(index=0)。
a = [1, 2, 3, 4, 5]
a.insert(0, 'a')
a
['a', 1, 2, 3, 4, 5]
因为它需要索引,所以不能对集合使用insert函数。
12.组合两个对象
在某些情况下,我们需要将属于同一个类型的项组合到一起。我们有多个选择来组合列表、元组和集合的对象。
“+”运算符可用于添加列表或元组,但不能用于添加集合。
a = [1,2,3]
b = [11,32,1]
print(a + b)
[1, 2, 3, 11, 32, 1]
print(tuple(a) + tuple(b))
(1, 2, 3, 11, 32, 1)
我们可以用并集运算符合并两个集合。将删除重复的元素。
a = {1,2,3,4}
b = {1,5,6}
print(a.union(b))
{1, 2, 3, 4, 5, 6}
在创建空字典时,我们需要记住这一点。如果我们只使用大括号,里面什么也没有,Python会认为它是一个空字典。我们可以使用set函数创建一个空集。
a = {}
print(type(a))
b = set()
print(type(b))
c = set({})
print(type(c))
13.排序
只有拥有顺序我们才能谈分类。因此,排序适用于列表和元组。集合无法排序,因为没有顺序。
sort函数修改应用它的对象。因此,我们只能在列表中使用它。元组是不可变的,所以我们不能对它们进行排序。
a = [3,1,5,2]
a.sort()
print(a)
[1, 2, 3, 5]
但是,我们可以对元组使用sorted函数。它创建一个排序的列表,其中包含任何iterable。所以我们可以使用它来创建一个基于元组的排序列表。
b = (6,1,4,2)
print(sorted(b))
[1,2,4,6]
- sort:对对象进行排序,但不返回任何内容。
- sorted:返回iterable中已排序项的列表,但不修改原始对象。
14.更新集合
update方法可用于通过其他iterables中的项更新集合。由于集合的性质,更新时会删除重复项。
a = {'x', 1, 4}
b = [3, 4, 1]
c = ('x', 'y', 'z')
a.update(b,c)
print(a)
{1, 3, 4, 'y', 'z', 'x'}
15.长度和计数
len函数返回集合的长度(即项目数)。它适用于列表、元组和集合。
count函数可用于计算特定元素的出现次数。它只用于列表和元组。由于集合不包含任何重复项,因此所有项的计数均为1。
a = [1,4,5,6,1]
b = (3,4)
c = {1,2,3,4}
print(len(a), len(b), len(c))
5 2 4
print(a.count(1), b.count(3))
2 1
结论
我们已经讨论了Python中3种基本数据结构之间的异同。
有更多的方法和操作可以在这些对象上工作。例如,列表生成式在数据分析和操作中非常有用:https://towardsdatascience.com/11-examples-to-master-python-list-comprehensions-33c681b56212 。
全面理解数据结构是非常重要的,因为它们是任何编程语言的基本组成部分。它们也是设计算法的关键因素。