哈哈哈,被自己蠢死了,也被 python 的语法给坑死了。没想到还会遇到这种问题。
事情是这样的。
项目中遇到一个字符串替换的问题。
我们知道字符串替换可以直接用replace方法,但这个方法只适合简单的字符替换,就是前提你要明确知道你要替换什么。
例如把“java”去掉
- s = "java python"
- print(s.replace("java", "")) # python
遇到复杂场景就不得不用正则表达式的方法来替换了。
比如有一段html文本
- s = """
- <script>
- !function(e)
- w3i9df
- xxx
- </script>
- <div> 这是html文本</div>
- """
我想把script脚本去掉,只保留html文本。这时候可以正则表达式里面的 re.sub 方法来实现。
- import re
- s = """
- <script>
- !function(e)
- w3i9df
- xxx
- </script>
- <div> 这是html文本</div>
- """
- result=re.sub(r"<script.*?</script>", "", s)
- print(result)