开发者社区> 问答> 正文

Web抓取和格式化,在Repl.it iOS应用程序上使用SWIFT登录

我正在与几个朋友一起构建一个应用程序,该应用程序基于对数据的抓取,并从几个特定的网站为用户重新格式化,还有一个登录到某个网站,代表用户刮取数据,以使它看起来更好看。我们只有一台苹果电脑可以工作,我们想要分而治之,所以我们决定让一些人在工作的代码端做更多的工作。

我们转向使用Repl.it和在他们的平台上使用快速。我们想要实现的第一个特性是登录特性,我们很快就用python(因为我们更熟悉)解决了它。经过几个小时的尝试,我的第一个问题是,我们应该如何用cookie和CSRF令牌来编写登录到网站的代码,比如在python中是如何使用请求之类的?

在那不起作用之后,我们试图实现我们认为更简单的网络抓取。结果没那么快。我们学习了几个教程并阅读了文档,但不知道为什么代码没有运行。顺便说一句,只是打印出网站的html是行不通的。

这是我们使用的代码:

import Foundation 

let igBaseUrl = "www.example.com/"

let url = URL(string: igBaseUrl)!

let task = URLSession.shared.dataTask(with: url) { (data, response, error) in
  guard let data = data else {
    print("data was nil")
    print()
    return
  }

  guard let htmlString = String(data: data, encoding: String.Encoding.utf8) else {
    print("Cannot cast data into string")
    return
  }

  print(htmlString)
  print(data)
}

task.resume()

如何在repl中运行抓取代码和格式化代码,以便我们能够正确和快速地将文本格式化并将其包含在我们的应用程序中?

提前谢谢你!

展开
收起
游客5akardh5cojhg 2019-12-14 18:03:43 891 0
0 条回答
写回答
取消 提交回答
问答排行榜
最热
最新

相关电子书

更多
Web应用系统性能优化 立即下载
高性能Web架构之缓存体系 立即下载
PWA:移动Web的现在与未来 立即下载