我目前正在制作一个工具来解析Tweepy上的单个用户时间线。这是使用Cursor对象完成作业的for循环。
for status in tweepy.Cursor(self.api.user_timeline,screen_name=self.user, tweet_mode="extended",
include_rts=False,include_entities=True).items():
但是,解析用户时间线可能会花费大量时间,尤其是当他们有大量推文时。我想知道它是否可能只解析时间轴的特定部分,即在第20和第40条推文之间。我浏览了Cursor文档但没有找到任何内容。
我也试过这个:状态
tweepy.Cursor(self.api.user_timeline,screen_name=self.user, tweet_mode="extended",
include_rts=True,include_entities=True).items():
if r>=count and r<=max:
Do operations here
但它并没有缩短花费的时间。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
Cursor只是一个围绕实际分页界面的用户友好包装器。来自文档:
page = 1
while True:
statuses = api.user_timeline(page=page)
if statuses:
for status in statuses:
# process status here
process_status(status)
else:
# All done
break
page += 1 # next page
这样,您可以手动启动具有适当值的页面,并在点之后将其停止。
我检查了Cursor的源代码,虽然可以在那里注入一个开始/结束页面,但这可能更容易。