多家公司布局大数据基金 策略模型待检验

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

2016年伊始,大数据基金开始进入密集发售期。1月份截至目前,已有海富通、泰达宏利、大成三家公募基金开始发售大数据基金。此外,另有11只大数据相关基金已申报或获得批复即将发售。

从2014年开始,大数据作为一种新概念基金开始逐步出现在公募市场。今年以来,多家公募基金公司纷纷布局大数据基金,分别与不同数据平台合作推出大数据产品,以期在这片新市场分得一杯羹。

截至2015年底,市场上共有包括广发百发100、南方大数据100、博时中证淘金大数据等12只大数据基金产品。

但过去一年,大数据基金的规模并未出现增长,反而有所下降,业绩也出现了较大幅度的回撤。有基金公司人士坦言,从过往业绩来看,大数据基金并未跑赢大多数基金,这也是这类基金募集起来比较困难的原因。

前广发基金电商部门负责人、现盈米财富总裁肖雯对财新记者表示,大数据基金发展的关键还是在于对数据进行有效利用,选取合适的策略和量化模型,这都需要时间的检验,而更多的基金公司参与也能够促进大数据基金的研究和发展。

所谓大数据基金,是指基金公司与数据平台合作,通过对数据库进行充分利用以及模型量化,挖掘出能适用于选股的因素,并运用到后期的选股策略中。

海富通基金量化投资管理部副总监陈甄璞对财新记者表示,大数据基金是能够利用大数据和量化模型,发现哪一些指数表现比较好,然后找到比较好的投资策略;比如利用与投资者情绪高度相关的指数汇总,做出一个移动平均线,并以其变化作为指标。

最早的大数据指数产品是银河定投宝中证腾安指数(519677)。该基金成立于去年3月,标的指数为中证腾安价值100指数。随后,广发、南方、博时三家基金公司分别和百度、新浪以及阿里巴巴合作开发了大数据指数,成立广发百发100、南方大数据100、南方大数据300A和博时中证淘金大数据100A。

此外,包括东方证券和和国金证券资管团队也于去年先后发布两只大数据券商基金,分别是东方红京东大数据灵活配置混合型证券投资基金和国金百度大数据基金。

今年以来,更多基金公司参与到大数据基金发行的队伍中。从证监会公布的基金募集申请核准进度公示表也能看到众多大数据基金的身影。

据财新记者统计,目前已有包括泰达宏利同顺大数据量化优选灵活配置混合型、中欧基金大数据灵活配置混合型、中证银联智策大数据100指数基金等7只产品通过审批;另有建信基金中证东方财富大数据188指数基金、大成中证雪球社交投资精选大数据指数基金等6只产品已在去年底申报。

从各家公司的布局上来看,目前多数基金公司仍以尝试为主,推出少数大数据基金。博时基金在这方面的布局则走得更为超前,截至目前,博时基金已推出和正在申请的大数据基金有6只,分别与雪球网、房天下、银联等数据平台合作。

华宝证券分析师李真表示,大数据基金的发展与中国市场散户为主有关,导致个股定价权转向个股的趋势,散户投资者行为值得研究。

陈甄璞表示,目前市面上的大数据基金所选择的数据平台多以投资者关注度作为数据来源,比如通过搜索量来检验目前的热门股票。以海富通为例,主要运用东方财富股吧的数据,通过在股吧、网页、行情软件或APP对于个股添加关注或自选,形成“关注度”指标,抓取动态的关注变化。

他进一步解释,通过对过去数据并运用量化模型进行回溯发现,关注度会伴随着股价的上升而上升,但到达一定关注度后,无法再延续下去,往往这时候代表股价需要进行调整。“因此,从投资角度看,我们希望选择的是,关注度的数据小幅微增,或者说它们在排名里面是比较靠后的,关注度不高而股价在小幅度上涨的股票。我们的策略是选择关注度微增、股价也微增的股票,它们上涨的概率是最高的。”

但作为一种新概念基金,投资者对大数据基金并不熟悉,观望情绪浓厚。有研究基金人士对财新记者表示,近期确实有很多投资者在询问有关大数据基金的情况,多数对此并不熟悉,因此无法下定决心申购类似产品。

此外,目前大盘仍处震荡期,也对大数据基金的募集产生了一定的影响。有基金公司人士对财新记者表示,预期本期募集额为约2亿元左右。与其他类似基金首次募集规模相比,基金销售端有一定的压力。

事实上,最早发行的大数据基金产品也曾受到投资者的热捧。比如广发百发100一天半即热卖18亿元,南方大数据100首日认购即吸引了36亿元的认购资金,远超10亿元募集上限。

但过去一年,大数据基金的规模并未出现增长,反而有所下降。以已披露数据的三季度末数据统计来看,广发百度百发的规模从2014年底的11.27亿份,在2015年前三季度规模逐渐缩减至7.74亿份、7.75亿份、5.26亿份;南方大数据100从2015年6月的101.36亿份缩减至9月的85.21亿份;天弘云端生活优选从8.81亿份缩减至6.47亿份;仅有少数基金实现规模小幅增长。

有基金公司人士坦言,从过往业绩来看,大数据基金并未跑赢大多数基金,这也是这类基金募集起来比较困难的原因。

前期成立的大数据基金产品多为指数型产品,单从业绩来看,去年年内也出现了较大幅度的回撤。以去年跑完一整年的广发百发100指数A的业绩来看,2015年该基金年内最大回撤为60.21%,目前基金净值为0.854元;另一只银河定投宝中证腾安指数年内最大回撤为50.42%,目前净值为1.4570。

陈甄璞坦言,目前来看,大数据基金仍然无法规避系统性风险,呈现同涨同跌。

鉴于指数型基金风险较高、操作被动,后期多家基金公司推出主动型产品,主要强调仓位的灵活性,希望在股市出现系统性风险时能够有所规避。

目前,大多数大数据基金运行时间并不长。陈甄璞表示,大数据基金理论上应该持股很多,在某种意义上,评判它优劣的标准,应该是以半年或一年为考察期,看它能否超越同期表现最好的指数。“比方说,作为我们这类基金,至少去年要跟上创业板指数,这是在我们不看仓位、只看指数的情况下。”

此外,大数据模型通常具有一定的滞后性。所谓滞后性是指基金经理是否能够感受热点行情启动,从而调整量化模型。“大数据基金的关键在于模型是否能够不断修正,从而快速适应市场的变化。”陈甄璞表示。

但大数据基金的推出还是受到业界的肯定。

肖雯认为,从长期来看,大数据基金在方向上仍值得探索,目前虽然时长不够,但随着时间的推移,将大数据运用至基金选股中,并且逐渐探索出一定的逻辑和有效的量化策略,对基金行业是有利的,能够丰富基金产品,增加选择性。

济安金融副总经理王群航则对财新记者表示,大数据基金的发展也是大势所趋,并且丰富了基金的选择。在他看来,大数据的挖掘有利于把握市场持续性较长的热点。“一般来说,只要热点持续性比较长,通过大数据发现,有助于跟住市场中长期的热点。因此,从长期来看,还是能够跑赢的。”

但他也同时指出,网站的大小、尤其是股票频道的活跃度,基本上决定了大数据基金的“颜值”。如果相关网站股票频道的客户数量众多、访问行为多,其给出的市场热点数据就更加接近市场的实际情况,数据有效性也就更高。事实上,高质量的大数据基金数据库实际上并不多,能有效结合选股因子的则更少,这或许也将成为制约大数据基金发展的一个方面。

王群航提醒,目前大多数大数据基金仍为指数类型,比较适合处于上升期的市场,而下行周期时压力也会更大,这也十分考验投资者的择时能力。

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
打赏
0
0
0
0
16429
分享
相关文章
大数据-83 Spark 集群 RDD编程简介 RDD特点 Spark编程模型介绍
大数据-83 Spark 集群 RDD编程简介 RDD特点 Spark编程模型介绍
83 4
大数据-107 Flink 基本概述 适用场景 框架特点 核心组成 生态发展 处理模型 组件架构
大数据-107 Flink 基本概述 适用场景 框架特点 核心组成 生态发展 处理模型 组件架构
237 0
针对MaxCompute经典网络域名下线,Dataphin应对策略的公告
针对MaxCompute经典网络域名下线,Dataphin应对策略的公告
331 7
大数据环境下的性能优化策略
大数据环境下的性能优化策略
167 2
阿里云MaxCompute-XGBoost on Spark 极限梯度提升算法的分布式训练与模型持久化oss的实现与代码浅析
本文介绍了XGBoost在MaxCompute+OSS架构下模型持久化遇到的问题及其解决方案。首先简要介绍了XGBoost的特点和应用场景,随后详细描述了客户在将XGBoost on Spark任务从HDFS迁移到OSS时遇到的异常情况。通过分析异常堆栈和源代码,发现使用的`nativeBooster.saveModel`方法不支持OSS路径,而使用`write.overwrite().save`方法则能成功保存模型。最后提供了完整的Scala代码示例、Maven配置和提交命令,帮助用户顺利迁移模型存储路径。
大数据-67 Kafka 高级特性 分区 分配策略 Ranger、RoundRobin、Sticky、自定义分区器
大数据-67 Kafka 高级特性 分区 分配策略 Ranger、RoundRobin、Sticky、自定义分区器
102 3
大数据模型的应用
大数据模型在多个领域均有广泛应用。在金融领域,它可用于风险评估与预测、智能营销及反欺诈检测,助力金融机构做出更加精准的决策;在医疗领域,大数据模型能够协助疾病诊断与预测、优化医疗资源管理和加速药物研发;在交通领域,该技术有助于交通流量预测、智能交通管理和物流管理,从而提升整体交通效率;电商领域则借助大数据模型实现商品推荐、库存管理和价格优化,增强用户体验与企业效益;此外,在能源和制造业中,大数据模型的应用范围涵盖从需求预测到设备故障预测等多个方面,全面推动了行业的智能化转型与升级。
ly~
653 2
大数据-47 Redis 缓存过期 淘汰删除策略 LRU LFU 基础概念
大数据-47 Redis 缓存过期 淘汰删除策略 LRU LFU 基础概念
140 2
大数据革新在即,阿里云EMR如何布局DeltaLake引领行业潮流?
【8月更文挑战第26天】大数据时代,实时处理与分析能力对企业至关重要。Delta Lake 作为高性能、可靠且支持 ACID 事务的开源存储层,已成为业界焦点。阿里云 EMR 深度布局 Delta Lake,计划深化集成、强化数据安全、优化实时性能,并加强生态建设与社区贡献。通过与 Spark 的无缝对接及持续的技术创新,阿里云 EMR 致力于提供更高效、安全的数据湖解决方案,引领大数据处理领域的发展新方向。
100 3
面向业务增长的数据平台构建策略
【8月更文第13天】为了构建一个能够支持企业业务增长的数据平台,我们需要考虑几个关键的方面:数据的收集与整合(数据集成)、存储、处理和分析。本文将详细介绍这些步骤,并提供具体的代码示例来帮助理解。
292 1
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等