数据采集

首页 标签 数据采集
# 数据采集 #
关注
22186内容
数据中台专栏(四):数据中台设计与数据资产管理
本文作者:王立飞 袋鼠云大数据解决方案专家。专注于云计算、大数据、企业级技术架构(EA)等领域,在互联网、零售、工业等行业有深入的理解和丰富的从业经验,曾带领项目团队完成中金易云、货币网、固德威等企业级大数据项目交付,擅长行业大数据解决方案的咨询与落地。
品《阿里巴巴大数据实践-大数据之路》一书(上)
7月有人推荐阿里巴巴刚出的这本书《阿里巴巴大数据实践-大数据之路》,到亚马逊一看才是预售状态,拍下直到8月才拿到。 翻看目录一看,欢喜的很,正好出差两天就带在身边,由于在机场滞留超过12个小时,就把它读完了。
德哥PG系列课程直播(第14讲):PostgreSQL 数据清洗、采样、脱敏、批处理、合并
知识点 知识点:数据清洗、去重、采样、脱敏、批处理、合并 学习资料 1、PostgreSQL 数据采样与脱敏标签:PostgreSQL , 采样 , 脱敏PostgreSQL 巧妙的数据采样方法 2、PostgreSQL 数据去重大法标签:PostgreSQL , 去重 , 单列去重 , 多列去重.
11个国内外免费域名解析服务
一般域名使用注册商提供的域名解析服务虽然方便,但功能大多有限,特别是目前国内还会针对某些DNS服务器进行屏蔽,造成网站无法解析的情况出现,因此,使用第三方域名解析服务也是中国网站的必要选择,这里就介绍一些常见的免费域名解析服务。
极测未来|淘宝"千人千面"内容下的智能评测技术与实践
本次分享将结合淘宝导购业务,介绍海量的 feeds 流内容,个性化推荐分发,庞大用户群体,碎片化机型环境的挑战下,通过统计学习和视觉技术,从消费侧推荐评估--供给侧素材管控—无线 CVT 测试,如何构建整体内容导购质量体系,进行问题发现,体验度量,丰富和提效测试手段。
“做好大数据测试,我是认真的!”
阿里妹导读:大数据已然是当下的重要课题,大大小小的企业在重视大数据的同时,也渐渐重视大数据质量的问题。阿里巴巴测试开发专家小郅,今天会分享他对数据测试的系统性思考。文章内容架构清晰,内容较长,建议大家收藏阅读哦~
UI2CODE系列文章|如何批量制造高质量样本
作者:闲鱼技术-楚丰 在 UI2CODE 项目中,我们大量使用了深度学习方法来做一些物体检测。而深度学习模型的训练,避免不了需要大量的样本,因此如何制造大量样本,来满足模型训练需要是我们必须要解决的一个问题。
微博python爬虫,每日百万级数据
新浪微博作为一个巨大的、实时的语料库,对微博数据爬取和分析,有重大的意义,本文就将讲述如何抓取微博数据。
免费试用