Python数据类型在平时的应用中有不少的知识需要大家详细的学习。下面就向大家介绍相关的技术问题。Python数据类型中的set和C#中的集合(collection)不是一个概念,这是翻译的问题。
Python中的集合是指无序的、不重复的元素集,类似数学中的集合概念,可对其进行交、并、差、补等逻辑运算。
常见集合的语法为:
- s = set(['a', 'b', 'c'])
不过set在Python 3.0中发生了较大的变化,创建一个集合的语法变成了:s = {1,2,3},用花括弧的方法,与后边要提到的dict类似。
如果在set中传入重复元素,集合会自动将其合并。这个特性非常有用,比如去除列表里大量的重复元素,用set解决效率很高,示例如下:
- # -*- coding: utf-8 -*-
- a = [11,22,33,44,11,22,11,11,22,22,33,33,33]
- b = set(a)
- print b
- #输出 set([33, 11, 44, 22])
另一个例子,找出两个list里面相同的元素(集合求交,其它类推),代码如下:
- # -*- coding: utf-8 -*-
- a = ["11","22","33"]
- b = ["11","33"]
- c = set(a)&set(b)
- print c
- #输出 set(['11', '33'])
想想你如果自己实现这个算法会怎么写?然后可以找两个大一点的列表,比比和set实现的效率,你就会有体会了。以后在程序里多用set吧。
目前C#的Collections中好像还没有Set,但是C++ STL里是有的,不知道C#为什么不实现这个有趣的东西。
字典(dict)
用过C#中Collections的人对Hashtable应该不会陌生,Python数据类型里的哈希表就是字典(dict)了。与set类似,字典是一种无序存储结构,它包括关键字(key)和关键字对应的值(value)。#t#
C#程序员需要了解的就是,在Python中dict是一种内置的数据类型,定义方式为:dictionary = {key:value},当有多个键值对时,使用逗号进行分割。
字典里的关键字为不可变类型,如字符串、整数、只包含不可变对象的元组,列表等不能作为关键字。字典中一个键只能与一个值关联,对于同一个键,后添加的值会覆盖之前的值。
学过数据结构的人对字典的散列查找效率应该都有认识,所以我建议在可能的情况下尽量多用字典,其它的就不多写了。关于Python数据类型中dict类型(以及list、tuple、set)提供的主要方法,可以参考专门介绍Python的各种书籍,大多会提供一个详细的方法列表。