字典是Python语言中的一种数据结构,每一个字典元素是由一对key-value组成的。而字典的key和value分别以集合(Set)形似组织,以便快速查询。集合的存储形似通常是树的结构,所以搜索非常快。我们可以单独通过字典的keys方法和values方法获取键集合和值集合的可迭代对象,代码如下:
- x = {'x':20,'a':12,'b':5}
- print(x.keys())
- print(x.values())
执行这段代码,会输出如下的内容:
- dict_keys(['x', 'a', 'b'])
- dict_values([20, 12, 5])
PS:dict_keys和dict_values是Python的两个内部类,他们都采用了树的结构对数据进行组织。现在的问题是,集合是无序的(因为是以树状结构存储的),但由于某些要求,我们期望得到有序的键值,这就引出了下面的几个问题:
Q1:集合可以排序吗?
Q2:排序后,可以获取成对的key-value吗?
Q3:除了按键值排序,可以按值排序吗?
为了回答这几个问题,请继续看下面的内容。
1. 集合可以排序吗?
这个问题的答案是:No。既然称为集合,由于数据存储形式的原因,肯定是无序的,但我们可以做一个折中的处理。既然集合不能排序,那么可以将集合中的数据排序后,放到一个可以排序的数据结构(例如,列表)里,这样可以在一定程度上解决我们的问题。看下面的代码:
- x = {'x':20,'a':12,'b':5}
- keys = sorted(x.keys())
- values = sorted(x.values())
- print(type(keys))
- print(type(values))
- print(keys)
- print(values)
在这段代码中,使用了sorted函数,该函数可以用于对序列进行排序,并将排序结果放到一个列表中,最后返回这个列表,所以执行这段代码,会输出如下的内容:
- <class 'list'>
- <class 'list'>
- ['a', 'b', 'x']
- [5, 12, 20]
现在我们的第一个问题解决了,使用sorted函数,将集合按升序排列,并以列表形式体现。如果想降序排列,那么需要将reverse参数设置为True,代码如下:
- keys = sorted(x.keys(), reverse=True)
- values = sorted(x.values(), reverse=True)
2. 排序后,可以获取成对的key-value吗?
现在来解决第2个问题。本文讨论的是字典,所以即使对key和value排序,也不是我们期望的,我们期望的是得到字典中的key-value对,而且是已经排序好的key-value对。这个问题也非常好解决,既然已经得到了排好序的key,那么就利用key从字典中获得对应的value,这样就可以组成一对key-value了,代码如下:
- x = {'x':20,'a':12,'b':5}
- keys = sorted(x.keys())
- for key in keys:
- print(f"{key}:{x[key]}")
执行这段代码,会输出如下的内容:
- x:20
- b:5
- a:12
很明显,输出的key-value对是按key升序排列的。
3. 除了按键值排序,可以按值排序吗?
那值排序是没问题的,但排好序的值是没什么用的。因为字典并不能通过value反向获取key。所以通过前面的方法只能获取排好序的值。所以需要为sorted函数的key参数,该参数用于指定使用key还是value进行排序。如果使用的是Python 3.7或以上版本。可以为key参数值指定lambda表达式,代码如下:
- y1 = {k: v for k, v in sorted(x.items(), key=lambda item: item[1])}
- print(y1)
- # 按值降序排列
- y2 = {k: v for k, v in sorted(x.items(), key=lambda item: item[1], reverse=True)}
- print(y2)
这段代码使用了for-in表达式生成了字典,其中x是待排序的字典。items获取了key-value对。而lambda表达式的item就是当前的key-value对。item[0]表示key,item[1]表示value,所以使用item[1],就表示按value排序,而使用item[0],就是按key排序。
执行这段代码,会输出如下的结果:
- {'b': 5, 'a': 12, 'x': 20}
- {'x': 20, 'a': 12, 'b': 5}
如果不想使用for-in表达式,也可以使用dict函数,代码如下:print(dict(sorted(x.items(), key=lambda item: item[1])))如果不想使用lambda表达式,或需要更复杂的排序规则,可以自定义排序规则函数,代码如下:
- def dict_val(x):
- return x[1]
- sorted_x = sorted(x.items(), key=dict_val)
如果读者用的是3.6或以下版本的Python,可以使用下面的代码:
- import operator
- # 按value
- sorted_x = sorted(x.items(), key=operator.itemgetter(1))
- print(type(sorted_x)) # list
- print(sorted_x) # 所以用列表替代
- import operator
- # 按key
- sorted_x = sorted(x.items(), key=operator.itemgetter(0))
- print(sorted_x)
在这段代码中,会返回排好序的列表,列表元素是元组形式,第1个值是key,第2个值是value。当然,你可以将这些数据重新插入新的字典中。执行这段代码,会输出如下内容:
- [('b', 5), ('a', 12), ('x', 20)]
- [('a', 12), ('b', 5), ('x', 20)]
如果仍然想通过key搜索字典中的value,可以利用OrderedDict对象将sorted_x转换为有序字典,代码如下:
- import collections
- sorted_dict = collections.OrderedDict(sorted_x)
- print(type(sorted_dict))
- print(sorted_dict)
- print(sorted_dict.get('b'))
执行这段代码,会输出如下内容:
- <class 'collections.OrderedDict'>
- OrderedDict([('a', 12), ('b', 5), ('x', 20)])
- 5
总结:本文的核心就是sorted函数,通过这个函数,既可以对key和value集合进行排序,也可以对key-value对进行排序,如果是后者,需要通过key指定到底是用key,还是用value排序,sorted函数返回的是排好序的列表,如果要得到排好序的字典,或者使用for-in表达式处理,或者使用dict函数转换。当然,如果只是想通过key搜索value,也可以将数据放到OrderedDict对象中。
本文转载自微信公众号「极客起源」,可以通过以下二维码关注。转载本文请联系极客起源公众号。