数据采集

首页 标签 数据采集
# 数据采集 #
关注
20502内容
用Excel利用RFM模型进行客户细分
背景: 一个会员服务的企业,有近1年约1200个会员客户的收银数据。由于公司想针对不同类别不活跃客户进行激活促销;同时,为回馈重点客户,也计划推出一系列针对重点客户的优惠活动,希望保留这些客户,维持其活跃度。因此希望利用该数据进行客户分类研究。 根据客户的需求,RFM模型相对简单并且直接,按照R(Recency-近度)、F(Frequency-频度)和M(Monetary-额度
袋鼠云数据中台专栏(五):数栈,企业级一站式数据中台PaaS
本文作者:江枫 袋鼠云CTO,花名江枫,本名宁海元。 2007年加入淘宝,曾是双十一大促技术指挥部成员,“去IOE”数据库负责人。 打造过千亿级实时日志平台、手机淘宝日志分析创始人、阿里云数加平台技术创始人。
【资料下载】Python 第十讲——xpath元素定位获取及爬虫中使用实例
直播时间:4月2日 20:00——21:00 直播介绍:python是非常适合敏捷开发的语言,用python编写爬虫快速获取数据,并做数据分析,对日常生活和工作能起到一定帮助。而python爬虫有很多种爬取方式,例如Requests+正则表达式、selenium+Chrome/PhantomJS等,xpath定位是其中的一种,以其使用简便、运行高效、应用场景多的优点,被很多爬虫开发者使用。
SHEVDC平台及物联网技术产品选型
本文的整理自2017云栖大会-南京峰会上技术专家李学根的分享讲义,讲义以新能源汽车发展现状与未来前景为背景,介绍SHEVDC平台搭建设计与物联网技术产品选型应用,其分享的重点在于大数据并发与存储解决方案,与平台体系建设未来展望。
DBengine 排名第一,云数据库 InfluxDB 版正式商业化!
产品介绍: 阿里云数据库 InfluxDB® 版正式启动商业化 。 InfluxDB 是 DBengine 官网时序数据库类目上排名第一的数据库产品,是当前业界最流行,使用最广泛的时序数据库。云数据库 InfluxDB 广泛应用于互联网基础资源监控,容器监控,业务运营监控分析,物联网设备远程实时监控,工业安全生产监控,生产质量评估和故障回溯。
10分钟教你使用阿里云API
我也是从13年才正式开始接触阿里云的,在2014年才开始用,当时可能有些自动化的需求一直使用aliyuncli,但是效率太低,而且记得当时有些地方使用不方便,所以自己就写了个简单的通用SDK。最近发现用阿里云的朋友越来越多,今天分享给大家,这里以负载均衡服务为例子。
| |
来自: 云存储
Logtail技术分享(一) : Polling + Inotify 组合下的日志保序采集方案
logtail是阿里云一款进行日志实时采集的Agent,当前几十万台部署logtail的设备运行在各种不同环境上(集团、蚂蚁、阿里云,还有用户部署在公网、IOT设备),每天采集数PB的数据,支撑上千种应用的日志采集。
Python网络爬虫反爬破解策略实战
我们经常会写一 些网络爬虫,想必大家都会有一个感受,写爬虫虽然不难,但是反爬处理却……
ODPS到ADS数据迁移指南
数据同步节点任务是阿里云大数据平台对外提供的稳定高效、弹性伸缩的数据同步云服务。ODPS到数据迁移采用的方式同步数据。 1.     创建源和目标库表结构 初次在同步数据前需要在源库和目标库创建好相应的表结构。
免费试用