注册 登录
编程论坛 Python论坛

HTML文件头部信息修改,如何用Python实现?

xxinganling 发布于 2020-09-21 14:06, 1100 次点击
要将如下HTML文件头部:index.html如下
程序代码:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN">
<html><head><title>XX分析表          </title></head>
<body>

 <h3>XX分析表          </h3>
<br><h4>报表生成: <a href="http://www." target="newwin">XX分析表</a></h4><p><table border="1" cellpadding="5"><tr bgcolor="E0E0E1">

改为:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN">
<html><head><title>XX情况明细表          </title></head>
<body>
<br><table border="1" cellpadding="5"><tr bgcolor="E0E0E1">


第一行不动,
第二行“XX分析表”改为“XX情况明细表”,
第三行删除,
第四行删除部分信息。
刚学Python,不知如何入手,请教如何实现,先致谢!


[此贴子已经被作者于2020-9-21 14:11编辑过]

2 回复
#2
fall_bernana2020-09-21 15:03
回复 楼主 xxinganling
程序代码:

import re
htmlstr='''<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN">
<html><head><title>XX分析表          </title></head>
<body>


 <h3>XX分析表          </h3>
<br><h4>报表生成: <a href="http://www. target="newwin">XX分析表</a></h4><p><table border="1" cellpadding="5"><tr bgcolor="E0E0E1">
'''
print(htmlstr)
htmlstr=re.sub(r'(<title>.*)分析表(.*</title>)',r'\1情况明细表\2',htmlstr,re.S)
htmlstr=re.sub(r'<h3>.*分析表.*</h3>','',htmlstr,re.S)
htmlstr=re.sub(r'<h4>.*报表生成.*分析表.*</a></h4><p>','',htmlstr,re.S)
print(htmlstr)

-----------------------------
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN">
<html><head><title>XX情况明细表          </title></head>
<body>


<br><table border="1" cellpadding="5"><tr bgcolor="E0E0E1">
#3
xxinganling2020-09-21 16:00
回复 楼主 xxinganling
谢谢fall_bernana!
学习中
1