用Python 正则表达式识别楼主的实际操作步骤介绍

开发 后端
以下的文章是对用Python 正则表达式如何识别楼主还有用Python 正则表达式识别一个帖子的起始位置的实际操作方案,以下是文章的相关介绍。

你知道如何用Python 正则表达式来识别楼主吗?如果你想知道用Python 正则表达式来识别楼主的实际应用方案的具体操作的话,你就可以点击以下的文章对其进行了解,望你会有所收获。

识别楼主:

帖子代码片段:<!-- 天涯百宝箱 -->

  1. <script>   
  2. var chrType = "public";   
  3. var intAuthorId = "";   
  4. var chrAuthorName = "GreyHouse";   
  5. var chrTitle = "[光影记录]跳蚤的欧洲之行";   
  6. var chrItem = 'travel';   
  7. var intItem = '0';   
  8. var intArticleId = "191157";   
  9. var tAuthor = 'GreyHouse';   
  10. </script>  

 

使用以下的Python 正则表达式来找到楼主:

  1. rereg_louzhu = re.compile('.*chrAuthorName = "(.*?)"; ' 

设mat为reg_louzhu.match(网页源码html行);则mat.groups()[0] 为楼主名字 GreyHouse

识别一个帖子的起始位置

继续分析html,发现天涯回帖一般都是用作者信息栏作为帖子的起始,那么帖子的尾部就是下一个作者信息栏之前咯。


  1. <
    TABLE cellspacing=0 border=0 bgcolor=f5f9fa 
    width=100><TR><TD WIDTH=100 ALIGN=RIGHT 
    VALIGN=bottom></TD><TD><font size=-1 
    color=green><br><center>作者:<a 
    href="/browse/Listwriter.asp?vid=11288815&vwriter=
    开着坦克逛街&idwriter=0&key=0"
     target=_blank>开着坦克逛街</a>  

以上内容就是对Python 正则表达式与识别一个帖子的起始位置的部分介绍

【编辑推荐】

  1. 在Python Library中Event具体实际操作方案
  2. Python socket编程在具体应用中前两个步骤的介绍
  3. Python矩阵转置中的二维数组的实际操作方案介绍
  4. Python环境的实际应用方案介绍与代码详解
  5. 在PythonS60手机运行过程中的五大步骤

 

责任编辑:佚名 来源: 博客园
相关推荐

2010-03-22 18:20:47

Python正则表达式

2010-03-11 08:55:45

python正则表达式

2011-06-16 16:05:23

正则表达式

2011-06-16 15:40:28

正则表达式

2018-09-27 15:25:08

正则表达式前端

2024-09-14 09:18:14

Python正则表达式

2021-01-27 11:34:19

Python正则表达式字符串

2016-12-05 17:03:59

用法正则表达式

2010-03-11 17:57:48

Python正则表达式

2010-03-25 18:25:36

Python正则表达式

2010-03-19 14:19:58

Python正则表达式

2010-03-18 12:40:47

python正则表达式

2020-09-04 09:16:04

Python正则表达式虚拟机

2009-08-14 17:52:30

C#表达式工具

2019-12-10 10:40:57

Python正则表达式编程语言

2010-03-01 15:51:59

Python则表达式

2020-11-04 09:23:57

Python

2016-11-10 16:21:22

Java 正则表达式

2022-01-04 11:35:03

Linux Shel正则表达式Linux

2009-09-16 17:15:57

正则表达式引擎
点赞
收藏

51CTO技术栈公众号