中金易云:为出版社找到下一本《解忧杂货店》

简介: 以供给侧结构性改革的角度来看,出版社即是最直接的供给侧,出版高质量、畅销度高的图书,建立出产高质量图书及图书IP的体系,即是提高供给体系质量。中金易云出版发行大数据平台正是以数字化转型为核心思路,以大数据中台与智能算法为基础的出版业供给侧结构性改革的成果。

2016年,全国出版、印刷和发行服务实现营业收入23 595.8亿元,较2015年增长9.0%,利润总额1 792.0亿元,增长7.8%,在图书出版方面,2016年,全国共出版图书50.0万种,较2015年增长5.1%,总印数90.4亿册(张),增长4.3%,定价总金额1 581.0亿元,增长7.1%。全年图书出版实现营业收入832.3亿元,增长1.2%,利润总额134.3亿元,增长7.2%。

总体来说,全国图书出版努力实现社会效益与经济效益相统一,图书出版、总印数和销售营业收入呈现稳步增长,经济效益维持在稳定水平上,确保了行业的持续发展,但图书出版业同样面临着严峻的挑战和实际的压力,在出版、发行、营销三大业务区划中,仅出版端就已经存在四大难题:

一、图书库存量居高不下,图书出版质量亟待提高:

图书出版业“新畅销书”一书难求,以虚构类畅销书榜单为例,2014年出版的《解忧杂货店》在2016年和2017年两度成为最畅销的虚构类图书。不仅如此,紧随其后的《追风筝的人》和《摆渡人》也都是畅销多年的热门小说。此外,“新畅销书”一书难求的现象,也折射出优秀作者难寻的行业普遍问题。也正是因为畅销书一书难求,“旧书新出”与“公版书泛滥”的情况在国内图书出版业很明显,《三国演义》《红楼梦》《水浒传》《安徒生童话》等中外经典图书的出版品种都在数百种以上。库存增速大于生产增速,总库存占年度出版图书定价金额的比例也从71.1%增至72.3%,形成了行业内“每出版2本图书就要库存1本”的行业共识。

1520410405589

二、“新畅销书”一书难求,难寻优秀作者:

图书出版业“新畅销书”一书难求,以虚构类畅销书榜单为例,2014年出版的《解忧杂货店》在2016年和2017年两度成为最畅销的虚构类图书,此外,“新畅销书”一书难求的现象,也折射出优秀作者难寻的行业普遍问题。

三、大众图书出版利润率低,盈利手段单一

由于图书出版业盈利模式单一,出版社基本上只是一次售卖图书内容,大众图书出版的普遍利润率仅为3~5%,与国际出版业同行有着显著差距,以美国著名出版集团企鹅兰登书屋为例,其利润率已经多年保持在14%的水平线上;

四、图书销量数据预测难、反馈慢、视野窄,市场响应迟滞

目前,传统图书销量预测准确率不高,出版社-发行渠道-书店-读者之间的数据反馈机制不准确且效率低下,出版社很难及时有效的得到出版图书的全盘数据,这造成出版社对市场需求的响应犹豫、谨慎且存在长时间的迟滞。

出版业数字化转型三大共识

近年来,图书出版业者近年来不断积极探索解决办法与发展路径,逐渐形成了图书出版业在出版端的数字化转型的三大共识:

1、瞄准图书IP化机遇,精准定位读者需求,寻找优秀作者(特别是畅销书作者),出版新畅销书,形成图书出版业的“爆款”,并向影视制作、文化消费等领域进行二次、三次售卖;

2、积极贴近市场,实时、全量的了解图书出版、发行、营销及评价数据,提高图书销量预测准确性,加快市场响应速度,做到“畅销书早备货,滞销品种早预警”;

3、以新畅销书为核心,以图书IP化为手段,结合准确的市场预测和及时的市场反馈能力,提高图书出版业利润率。

为什么是中金易云?

中金易云是2017年由浙江省新华书店集团(以下简称浙江新华)和中金数据系统两家公司共同成立的图书行业大数据科技公司,得益于浙江新华和中金数据的注入,中金易云拥有图书出版业数字化转型的四大基础支柱:

1、强健的信息系统:中金数据与浙江新华在ERP平台上的积累和能力,为中金易云收集真实的、细颗粒化、及时的业务数据进行数据分析与洞察提供了坚实的基础;

2、领先的物流及合作网络:在浙江新华的支持下,中金易云与超过1000家出版机构拥有深度供应链合作,与15家发行集团建立了战略联盟;

3、全量书目数据与真实业务数据:浙江新华自上世纪90年代起陆续投资建设ERP、产品库系统,拥有国内首屈一指的全量书目数据库,同时,通过行业深度合作,中金易云拥有20个省以上的真实业务数据基础,将全国三分之一市场盘面数据囊括其中。

4、行业理解:浙江新华与中金数据皆是图书出版业的“老字号”,有着对行业发展、行业创新深刻的理解,早在2016年,浙江新华就已经开始了行业调研。

成立之后,中金易云以开放互补的发展思路,希望寻找具有优势互补效应的外部合作伙伴共同构建“中金易云出版发行大数据平台”,在调研了行业内多家潜在合作伙伴之后,最终中金易云选择与阿里云合作。

中金易云副总裁朱英认为,此次合作花落阿里云有两点主要的原因:

1、阿里云在云计算、大数据领域有着强大、广泛的影响力,同时提供了功能完善、服务多样、地域广阔、技术完备的云计算服务,与阿里云合作为中金易云在全国范围内提供服务提供了可靠的支撑;

2、阿里云在人工智能领域积累深厚,拥有先进的数据智能算法,可以快速实现业务应用,确保图书销量预测、图书选题及作者推荐等项目关键功能的有效性;

此外,中金易云创新应用中心总经理俞国忠表示,阿里云为中金易云提供了宝贵的市场及运营经验的分享,同时,在运维保障上做出了2小时响应的承诺,“无论是对中金易云出版发行大数据平台还是出版社,都是值得信任的保障。”

经过中金易云与阿里云的紧密协调和深度沟通,双方制定了“(出版发行)大数据中台 + 数据智能(人工智能算法)”的技术实施方案:

出版发行大数据中台

1、数据上云:将来自浙江新华书店ERP系统、中金ERP系统以及其他中盘提供的数据,与来自爬虫系统的数据,统一汇总到阿里云数加MaxCompute的企业大数据仓库,实现数据上云;

2、爬虫系统:开发互联网数据爬虫系统,爬取图书销售、书评、商品评价、类目交互、作家相关信息、舆情等侧重领域的数据,形成对中金易云内部数据的有效补充;

3、云上大数据架构建设:对从ERP和爬取的数据进行数据仓库建设,并通过该数据仓库,通过算法和模型建设相应的标签体系,打造不同层次用户、客户的画像,最终对数据应用层提供数据访问;

此外,阿里云为中金易云提供了大数据应用产品和应用系统web端和H5页面的开发。

人工智能算法开发:

1、标签生产算法模型:使用fasttext等深度学习算法,根据空白分类书本的相关描述属性,例如,简介,读者分类,题材等,自动分析推荐出书本标签;

2、图书销量预测模型:通过图书多维度信息,设计更适合特定品种类别的预测误差评定标准,最后根据图书品种历史销量数据、网络舆情数据、电商平台销售及评论数据,综合利用统计优化模型、机器学习模型、时间序列预测模型等多种不同算法模型对不同图书品种类别的销量进行图书销量预测模型建模;

3、个性化推荐系统模型:基于个性化推荐系统原理,根据不同的应用场景,利用基于用户/商品的协同过滤、矩阵分解、有监督学习方法进行推荐系统建模,如针对出版端智能选题场景建立选题推荐模型;

4、库存优化模型:基于大数据策略和库存优化算法计算出最优的中盘图书库存各品种备货数量,提供有针对性的库存优化解决方案,同时根据海量的历史库存数据,建立库存分析预警的机器学习模型。

image
大数据中台+数据智能,用数据解答出版社编辑“畅销书从何而来?”的疑问

在I期项目中,中金易云与阿里云重点完成了针对出版端的技术开发与方案实施,在产品服务角度上达成三大阶段性成果:

1、出版社数据上云及数据标准化:截止目前完成10个省的图书发行数据上云,计划到今年底覆盖20+省份,并且以数据中台思路方法论帮助出版社高效数据上云工作,并完成行业数据规范化与标准化工作,大大提升图书行业数据收集与整合效率;

2、数据智能化:基于400万书目数据,过亿条销售数据,千万级爬取数据,百万作者库数据,定制研发超过8种智能算法,构建了“提炼标签-建立模型-确立关系-生成洞察”的核心能力:

2.1 建立出版社多维度画像模型、出版物标签体系及画像模型、作者多维度画像、读者画像模型;

2.2利用人工智能算法,进行作者画像与出版物畅销指数、读者画像与出版物标签特征的交叉比对,打通“作者-出版物-出版社-读者”四维关系图谱;

3、消除信息孤岛:覆盖全国1000+出版社,形成出版社与中盘发行的连接,打通营销上行路线、订货下行路线,并整合网络电商渠道,形成可分层可对比可互动的出版发行网络;

出版社业务战略朝“以技术+IP为中心”转向

近年来,出版社已经从以出版人为中心,转向了以管理为中心,出版社入驻中金易云出版发行大数据平台之后,“以技术+IP为中心”的战略转型,将随着出版社对平台的深度使用而逐渐发生。

首先,大数据中台 + 数据智能为出版社赋能,让出版社认识到技术能力在图书出版业的重要作用,并将技术能力的提升和对中金易云出版发行大数据平台等第三方平台技术能力的吸收,作为业务战略的重要组成部分。面向出版社的技术赋能将从如下三方面展开:

全面直观展现数据 洞悉经营情况:深度整合出版社全维度经营和行业市场数据,通过精细设计的GUI,出版社管理人员可以通过图形界面直接的获知行业趋势与本机构经营概况;

image

及时获悉脱销、滞销风险 及时响应市场需求:出版社及发行渠道将及时获得畅销书备货不足品种的预警(畅销预警)和备货过量的滞销品种预警(滞销预警),避免发行渠道类型的错配,做到“畅销书早备货,滞销品种早预警”,实现动态、准确的库存优化。

image
脱销告警,及时发现畅销书销售热点,避免断货

选题助手精准辅助 选好题 选好作者 做好选题:

1、找到畅销书:以选题多维参数为依据,智能匹配品种,生成图书出版畅销书潜力、销售预测等报告,找到最有可能成为畅销书的选题,快速完成“多题选做(对多个选题做出取舍)”的工作;

编辑人员将拥有大量数据洞察支撑和数字化手段辅助,投入大力度进行“专题精做(大力支持畅销书)”,做出比肩《解忧杂货铺》的“新畅销书”;

image

2、发现好作者:以结合出版历史、销量走势、网络舆情以及作者综合能力画像等信息,综合判定作者是否具有优秀作者(及畅销书)的潜力,从而达成选题合作或在作者成名前建立关系紧密的作者储备;

image
洞悉作者情况,并进一步生成作者画像,找到好作者

3、做好“选题多卖”:出版发行的选题资源形成多次延伸开发、多媒体协同的综合效应,以畅销书内容打造“文化IP、故事IP”,实现图书IP化,向影视制作、文化消费等领域进行二次、三次售卖,做到“一题多做”。

进一步的转变将随着出版社以大数据中台 + 数据智能为基础的图书IP化支撑和加速逐渐展开,大数据中台 + 数据智能 将显著改善出版社图书IP化工作的投入准确率,为出版社带来更高的投资收益,出版社系统、可见、批量的实践图书IP化成为可能,随着出版社在图书IP化上获得远超以往的收益,图书IP化及图书内容的二次、三次售卖将成为出版社的重要收入来源。

最终,出版社将实现“以技术+IP为中心”的业务战略转向:以技术赋能业务,创造和挖掘新的畅销图书IP,继而通过图书IP的销售,获得远超以往传统图书码洋数十乃至数百倍的收入,而这些收入还将进一步提高出版社对技术的投入水平,形成图书出版业发展的良性循环。

image

目前,随着平台I期项目的上线,中金易云“以大数据思维方法论重构出版发行行业”的战略愿景获得了坚实的大数据中台与智能算法基础,磨铁图书和中国地图出版社两家出版社已经进行业务测试,并取得了良好的效果,预计在今年6月会向全国图书出版业进行推广。

出版社组织战略的转变:成数据驱动型组织

大数据中台 + 数据智能 的图书出版业数字化转型趋势将对出版社的组织架构产生影响:

老编辑将大幅度减少原本需要经手的无效、低畅销度选题,逐渐成为出版社的“畅销书”把关人,将工作重心转移到图书的专题精做、一题多做上,集中精力进行图书IP化的工作,变身“图书IP化”的“操盘手”;

新编辑除快速提升专业技能之外,将有大量的时间、精力进行畅销书选题、优秀作者的筛选,将挖掘选题和作者的视野逐渐放大,逐渐成为出版社的“星探”;

在可预测的未来3-5年,有技术、有想法、有积累的出版社,如浙江新华,将依托中金易云出版发行大数据平台,成长为“数据驱动型组织”,构建以输出图书IP为核心的高盈利知识服务体系。

需要指出的是,数据智能,即人工智能算法(数据智能算法),是“数据驱动型组织”有效、高效利用数据的必要条件。阿里云拥有强大的人工智能技术储备和研发力量,不仅在算法方面拥有深厚积累,更可以从具体的场景和问题出发,研发算法系统,为客户提供定制化的数据智能算法及配套的云平台构建、数据集成与数据治理、可视化大屏展现等解决方案。

新一期项目即将开始 中金易云要让“天下买书和卖书都没有困难”

中金易云出版发行大数据平台的II期工程即将开始,新的一期项目将针对图书出版业的发行端、零售端、运营端提供大数据平台和数据智能,中金易云副总裁朱英表示:“新一期项目将打通‘内容(生产端)与读者(C端)’,做到‘让读者选择内容IP’,并最终在图书零售市场打造出智慧书城,形成从出版、发行,到零售、营销的全流通文化供应链。”

在发行端,支持构建全国范围内的数据驱动的结合智能算法的发行端大数据中台,协助打造发行集团“服务中心”智能;在零售端,针对图书门店选品困难、服务不对位、图书摆放粗狂的问题,致力于打造极致单店零售网点。

后记 中金易云要为图书出版业做事情 实践供给侧改革

在案例调研的深度访谈中,中金易云副总裁朱英不断强调,中金易云的目标不是仅仅搞业务、搞销售,而是要认认真真的为图书出版业做点事情,他谈到,浙江新华原董事长周立伟早在90年代构建浙江新华的ERP系统、产品库及全量书目数据时就有一个梦想,那就是“浙江新华积累的业务数据,迟早要服务于整个行业。”因此,朱英表示:“中金易云的目标,不只是为浙江新华解决问题,而是要为整个行业解决问题。”

以供给侧结构性改革的角度来看,出版社即是最直接的供给侧,出版高质量、畅销度高的图书,建立出产高质量图书及图书IP的体系,即是提高供给体系质量。中金易云出版发行大数据平台正是以数字化转型为核心思路,以大数据中台与智能算法为基础的出版业供给侧结构性改革的成果。

在供给侧的“终端”——书店,在中金易云正在为浙江新华的智慧书城提供数据支撑,并参与到方案设计当中:浙江新华正在嘉兴投资5.5亿建设8万平米的文化综合体,包括影院、培训中心、酒店和一万多平米的智慧书城,作为未来书店领域的标杆,浙江新华正致力于将其打造为具备科技时尚特征,“融合了线上书店业态的2.0版线下书店”,不仅为图书行业理清“人、货、场”的关系提供样板,更以大数据技术赋能,帮助书店做好选品;以大数据和人工智能技术赋予各种设备以“智能”,搭建起读者和图书互动体验的全新桥梁。

相关实践学习
使用CLup和iSCSI共享盘快速体验PolarDB for PostgtreSQL
在Clup云管控平台中快速体验创建与管理在iSCSI共享盘上的PolarDB for PostgtreSQL。
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
相关文章
|
6月前
|
算法
数值分析学习笔记——绪论【华科B站教程版本】
数值分析学习笔记——绪论【华科B站教程版本】
109 0
|
10月前
|
数据可视化 Java 关系型数据库
某学院校园网站的设计与实现(论文+源码)_kaic
摘  要 使用旧方法对冀中工程技师学院网站的信息进行系统化管理已经不再让人们信赖了,把现在的网络信息技术运用在冀中工程技师学院网站的管理上面可以解决许多信息管理上面的难题,比如处理数据时间很长,数据存在错误不能及时纠正等问题。这次开发的冀中工程技师学院网站对字典管理、留言板管理、新闻资讯信息管理、师资力量管理、师资力量收藏管理、师资力量留言管理、单页数据管理、校园风光管理、校园风光收藏管理、校园风光留言管理、学生管理、管理员管理等进行集中化处理。经过前面自己查阅的网络知识,加上自己在学校课堂上学习的知识,决定开发系统选择B/S模式这种高效率的模式完成系统功能开发。这种模式让操作员基于浏览器的方
|
10月前
|
算法 C语言
【CSDN编程竞赛·第四期】个人参赛经历和个人建议
大家好,我前不久参加了官方举办的CSDN编程比赛,官方举办了四期,第一期的时候没看到,错过了,后面的每一期我都参加了,总的感觉来说,还可以。下面我具体说说第四期相关经验吧。
82 0
|
11月前
|
存储 人工智能 NoSQL
案例酷 | 华东师范大学:计算机实训课拍了拍你,说“云上见”
编者按: 教育是国之大计、党之大计。教育信息化是实现教育现代化的必由之路,数字化转型为教育信息化指明了方向。针对如何在疫情期间也能提供给师生线下般的实训体验,华东师范大学和阿里云在战略合作框架下聚合形成了水杉无影桌面实训环境,完成了在教育数字化改革中的一次重要尝试。 全文约2714字,建议阅读时间9分钟。
219 0
|
存储 SQL 调度
江苏大学 数据库系统原理 考研复试/期末考试 概念题要点整理
江苏大学 数据库系统原理 考研复试/期末考试 概念题要点整理
172 0
江苏大学 数据库系统原理 考研复试/期末考试 概念题要点整理
|
敏捷开发 算法 架构师
【备战软考架构师系列笔记 · 001】软件工程篇 —— 软件开发方法的主要分类 ⭐
# 软件开发方法### 分类- 按功能 - 水平原型(针对界面) - 垂直原型(针对复杂算法)
196 0
【备战软考架构师系列笔记 · 001】软件工程篇 —— 软件开发方法的主要分类 ⭐
|
数据挖掘
|
存储 设计模式 Java
十一长假我肝了这本超硬核PDF,现决定开源!!
在 【冰河技术】 微信公众号中的【互联网工程】专题,更新了不少文章,有些读者反馈说,在公众号中刷 历史文章不太方便,有时会忘记自己看到哪一篇了,当打开一篇文章时,似乎之前已经看过了,但就是不知道具体该看哪一篇了。相信很多小伙伴都会有这样的问题。那怎么办呢?最好的解决方案就是我把这些文章整理成PDF电子书,免费分享给大家,这样,小伙伴们看起来就方便多了。希望这本电子书能够给大家带来实质性的帮助。
104 0
十一长假我肝了这本超硬核PDF,现决定开源!!
|
小程序 算法 JavaScript
计算机毕业设计选题
java 小程序 vue uniapp android 毕业设计源码
464 0
|
物联网
崮德好文连载 - 工作语言
在人与人的相处中,一句话,可能会说者无意,听者有心。我记得我刚入职阿里巴巴第二天,我去请教一位PD同学,关于IoT这个工作的细节,他虽然会和我解释工作细节,但是一旦我问到某些更深入的细节,他会说,这个不关你的事情,你不要管。