Python 如何像 awk一样分割字符串?

开发 后端
若你使用过 Shell 中的 awk 工具,会发现用它来分割字符串是非常方便的。特别是多个连续空格会被当做一个处理。

若你使用过 Shell 中的 awk 工具,会发现用它来分割字符串是非常方便的。特别是多个连续空格会被当做一个处理。

[[339186]]

  1. [root@localhost ~]# cat demo.txt 
  2. hello      world 
  3. [root@localhost ~]# 
  4. [root@localhost ~]# awk '{print$1,$2}' demo.txt 
  5. hello world 

可是转换到 Python 上面来呢?结果可能是这样的。

  1. >>> msg='hello    world' 
  2. >>> msg.split(' ') 
  3. ['hello', '', '', '', 'world'] 

与我预想的结果不符,多个空格会被分割多次。

那有什么办法可以达到 awk 一样的效果呢?

有两种方法。

第一种方法

不加参数,这种只适用于将多个空格当成一个空格处理,如果不是以空格为分隔符的场景,这种就不适用了。

  1. >>> msg='hello    world' 
  2. >>> msg.split() 
  3. ['hello', 'world'] 

第二种方法

使用 filter 来辅助,这种适用于所有的分隔符,下面以 - 为分隔符来举例。

  1. >>> msg='hello----world' 
  2. >>> msg.split('-') 
  3. ['hello', '', '', '', 'world'] 
  4. >>> 
  5. >>> filter(None, msg.split('-')) 
  6. ['hello', 'world'] 

是不是很神奇,filter 印象中第一个参数接收的是 函数,这里直接传 None 居然有奇效。

查看了注释,原来是这个函数会适配 None 的情况,当第一个参数是None的时候,返回第二个参数(可迭代对象)中非空的值,非常方便。

换用函数的写法,可以这样

  1. >>> msg='hello----world' 
  2. >>> msg.split('-') 
  3. ['hello', '', '', '', 'world'] 
  4. >>> 
  5. >>> filter(lambda item: True if item else False, msg.split('-')) 
  6. ['hello', 'world'] 

 

责任编辑:赵宁宁 来源: Python编程时光
相关推荐

2017-05-22 10:33:14

PythonJuliaCython

2013-12-31 09:19:23

Python调试

2023-05-23 13:59:41

RustPython程序

2013-12-17 09:02:03

Python调试

2013-08-22 10:17:51

Google大数据业务价值

2015-03-16 12:50:44

2021-05-20 08:37:32

multiprocesPython线程

2023-04-05 14:19:07

FlinkRedisNoSQL

2021-09-07 10:29:11

JavaScript模块CSS

2016-10-08 00:24:53

httptcp实时

2013-07-26 10:15:29

云计算大数据Hadoop

2022-12-21 15:56:23

代码文档工具

2014-09-22 09:27:57

Python

2020-09-30 17:12:09

人工智能技术数据

2017-11-06 14:18:03

2022-12-06 08:27:50

Bash脚本字符串

2011-01-18 10:45:16

乔布斯

2012-06-08 13:47:32

Wndows 8Vista

2015-02-05 13:27:02

移动开发模块SDK
点赞
收藏

51CTO技术栈公众号