BeautifulSoup 用 .find(text=True) 找不到 table 里边的文字 -问答-阿里云开发者社区-阿里云

开发者社区> 问答> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

BeautifulSoup 用 .find(text=True) 找不到 table 里边的文字

2016-06-17 11:42:30 3168 1

.find(text=True)对table里的一些文字没有作用,下边是我的代码:

import urllib
import urllib2
import cookielib
import re
import csv
import codecs
from bs4 import BeautifulSoup

listmain = 'http://gdemba.gicp.net:84/ListMain.asp'
header = {'User-Agent': 'Mozilla/5.0'}
req = urllib2.Request(listmain,headers=header)
page = urllib2.urlopen(req)
soup = BeautifulSoup(page)

table = soup.find(id='Table11')
f = open('table.csv', 'w')
csv_writer = csv.writer(f)
td = re.compile('td')

client = ""
tag = ""
tel = ""
catalogue = ""
region = ""
client_type = ""
email = ""
creater = ""
department = ""
action = ""

for row in table.find_all("tr"):
    cells = row.find_all("td")
    if len(cells) == 10:
        client = cells[0].find(text=True)
        tag = cells[1].find(text=True)
        tel = cells[2].find(text=True)
        catalogue = cells[3].find(text=True)
        region = cells[4].find(text=True)
        client_type = cells[5].find(text=True)
        email = cells[6].find(text=True)
        creater = cells[7].find(text=True)
        department = cells[8].find(text=True)
        action = cells[9].find(text=True)

    csv_writer.writerow([x.encode('utf-8') for x in [client, tag, tel, catalogue, region, client_type, email, creater, department, action]])

f.close()

有一条要处理的

<tr class="ListTableRow" id="Row0" onclick="javascript:setRowFocus(this,false,0);FirstDataFormat('0000008688')" ondblclick="viewcoinfo('interunit','0000008688','{A31618B2-90CC-456F-A2E7-4C5B0D577E25}')">
<td nowrap=""> <span id="spanshare0000008688"></span>深圳营业部</td>
<td id="0000008688sign" nowrap=""> 福田</td>
<td nowrap=""> 0755-66666666</td>
<td nowrap=""> 手机配件</td>
<td nowrap=""> 深圳市</td>
<td nowrap=""> 普通客户</td>
<td nowrap=""> <span class="BlueText" onclick="javascript:EmailTo('0000008688','123456@qq.com')" onmouseout="javascript:this.style.textDecoration=''" onmouseover="javascript:this.style.textDecoration='underline'>123456@qq.com</span></td>
<td nowrap=""> 信息资源部</td>
<td nowrap=""> 信息资源部</td>
<td height="16" nowrap="" style="width: 78px"> </td>
</tr>

screenshot
请问是什么原因,跟标签有关系吗?
但是客户名称和Email两个

里边的text没办法取出来:
取消 提交回答
全部回答(1)
  • 西秦说云
    2019-07-17 19:42:22

    不需要使用cells[0].find(text=True),直接用cells[0].text就行

    0 0
相关问答

1

回答

修改Table Group和Shard Count的场景是什么呀?

2021-12-12 11:14:27 339浏览量 回答数 1

1

回答

map、filter、reduce三者的使用以及区别是什么?

2020-03-18 22:30:01 746浏览量 回答数 1

1

回答

新建的OSS bucket为什么不能使用OSS标准存储包(中国大陆)资源包?

2019-03-21 00:18:23 2297浏览量 回答数 1

0

回答

MPP计算引擎 Cache Table是什么?

2017-10-31 13:18:40 1277浏览量 回答数 0

1

回答

ubuntu如何实现三线三ip

2017-09-04 00:31:58 1934浏览量 回答数 1

1

回答

重新启动下服务器,网页和FTP就连接不上了

2016-10-10 13:07:31 1896浏览量 回答数 1

0

回答

备案需要填写ICP服务商编码

2016-06-20 16:44:59 3794浏览量 回答数 0

1

回答

如何在网页中嵌入youtube或优酷视频 并且自动根据IP位置决定是从youtube或优酷加载

2016-06-14 18:10:39 3456浏览量 回答数 1

1

回答

紧急求助!!!邮箱里存储的全部邮件都没有了!!!

2015-03-13 10:38:43 3001浏览量 回答数 1

2

回答

紧急求助!邮箱里存储的全部邮件都没有了!!!

2015-03-13 10:49:31 3457浏览量 回答数 2
+关注
杨冬芳
IT从业
1
文章
9167
问答
问答排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载