阿里云ACE共创空间——大数据方案体验1 日志服务-阿里云开发者社区

阿里云ACE共创空间——大数据方案体验1 日志服务

2018-11-26 1325

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云原生大数据计算服务 MaxCompute，5000CU*H 100GB 3个月

云原生大数据计算服务MaxCompute，500CU*H 100GB 3个月

日志服务 SLS，月写入数据量 50GB 1个月

简介： 阿里云ACE共创空间——大数据方案体验1 日志服务从阿里云官方文档介绍中，可以看到Log service日志服务主要包含三部分的内容：1、实时采集与消费LogHub2、查询分析Search/Analytics3、数据投递与仓库LogShipper进入管理控制台后，需要先开通服务，从创建Porject这个对话框来看和MAXCOMPUTE和DATA IDE的界面和操作方式类似，备注里说明记录该项目下所有资源的操作、访问和计量等日志并保存到Logstore中，类似于DATA IDE中的项目和MAXCOMPUTE中的项目关联方式。

阿里云ACE共创空间——大数据方案体验1 日志服务
screenshot

从阿里云官方文档介绍中，可以看到Log service日志服务主要包含三部分的内容：
1、实时采集与消费LogHub
2、查询分析Search/Analytics
3、数据投递与仓库LogShipper

进入管理控制台后，需要先开通服务，从创建Porject这个对话框来看和MAXCOMPUTE和DATA IDE的界面和操作方式类似，备注里说明记录该项目下所有资源的操作、访问和计量等日志并保存到Logstore中，类似于DATA IDE中的项目和MAXCOMPUTE中的项目关联方式。
screenshot
Project名称这里输入测试项目的编号，在所属的区域选择华东2，下方的红色提醒提示，因为开通运行日志后，日志服务信息需要写入到指定项目的日志库，涉及到写的操作，所以需要在RAM中进行授权。为了方便测试，把测试项目的名称取名为test20181126。
screenshot
创建Project后，可以看到收集来的日志信息是储存在Logstore中的，所以需要创建Logstore即日志库的具体信息，在属性设置中可以看到以下几项关键内容：
1、 Web Tracking：其功能是支持快速采集各种浏览器和设备的访问信息，这个作用是有助于快速的收集用户访问过程中的日志信息。
2、永久保存：生命周期的选择可以是永久保存，也可以关闭永久保存来根据实际需要输入需要保存的时间期限。
3、 Shard数目、自动分裂shard和最大分裂数：shard的定义和其他模块一样，表示的流数据的传输通道，其中自动分裂的功能代表着log service的服务和其他服务一样，有弹性的功能，当数据量超过已有分区能力后，自动分裂功能可以根据数据量来自动增加分区数量，并且用户可以自己选择最大的分裂数。
screenshot
在创建了Logstore日志库后，汇总下目前的情况：
1、创建了测试项目，项目名称为：test20181126
2、在项目下创建了日志库，日志库的名称为：test20181126_store
在日志库中可以对于日志的采集和投递做出进一步配置，包括数据接入向导、日志采集模式、日志消费模式等。先对于数据接入向导进行配置：
screenshot

数据源提供了很多选择，涵盖了云产品日志、自建软件日志和自定义数据的输入，在选择云产品如SLB进行日志收集前同样需要在RAM中进行授权。如果是用户自建软件或者自定义的数据，需要对日志的路径和配置做一定的设置。在日志数据的输入侧，提供了各种输入源的接入方式，能满足用户对于数据输入的各种需要。
screenshot
在设置完成数据接入后，可以在Logtail配置列表中看到所有的配置信息，包括配置的名称、数据来源、配置详情和操作。还可以通过错误信息收集来针对收集过程中的错误做进一步诊断。对于导入的日志信息，可以在界面上进行快速查询、告警配置和仪表盘的设置，方便用户定义监控和报警的需求。
screenshot
在投递方面只支持MAXCOMPUTE和OSS两种输出源，这代表这一部分的内容目前只能输出到离线的处理系统上而不能支持投递到诸如STREAMCOMPUTE和ADS等能支持实时计算的系统。这个是体验后的一个比较大的疑问，因为日志信息中所含的信息量较多，数据本身也会非常大并且时间的敏感性很高，诸如高峰期的日志信息能够越早处理，越能挖掘出其中的价值。其本身日志库作为一个分布式数据库并且能在其中进行查询等操作为何还没能投递到其他输出源的方式，是否是因为日志信息属于半结构化数据所以只能以MAXCOMUPTE和OSS作为输出方需要进一步的研究。

相关实践学习

基于MaxCompute的热门话题分析

本实验围绕社交用户发布的文章做了详尽的分析，通过分析能得到用户群体年龄分布，性别分布，地理位置分布，以及热门话题的热度。

SaaS 模式云数据仓库必修课

本课程由阿里云开发者社区和阿里云大数据团队共同出品，是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法，从场景到实践，体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库，助力开发者学习了解先进的技术栈，并能在实际业务中敏捷的进行大数据分析，赋能企业业务。通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景，可应用MaxCompute实现数仓搭建，快速进行大数据分析。适合大数据工程师、大数据分析师大量数据需要处理、存储和管理，需要搭建数据仓库？学它！没有足够人员和经验来运维大数据平台，不想自建IDC买机器，需要免运维的大数据平台？会SQL就等于会大数据？学它！想知道大数据用得对不对，想用更少的钱得到持续演进的数仓能力？获得极致弹性的计算资源和更好的性能，以及持续保护数据安全的生产环境？学它！想要获得灵活的分析能力，快速洞察数据规律特征？想要兼得数据湖的灵活性与数据仓库的成长性？学它！出品人：阿里云大数据产品及研发团队专家产品 MaxCompute 官网 https://www.aliyun.com/product/odps 

阿里云ACE共创空间——大数据方案体验1 日志服务

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

阿里云ACE共创空间——大数据方案体验1 日志服务

热门文章

最新文章

相关课程

相关电子书

相关实验场景