中金易云:为出版社找到下一本《解忧杂货店》

本文涉及的产品
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 以供给侧结构性改革的角度来看,出版社即是最直接的供给侧,出版高质量、畅销度高的图书,建立出产高质量图书及图书IP的体系,即是提高供给体系质量。中金易云出版发行大数据平台正是以数字化转型为核心思路,以大数据中台与智能算法为基础的出版业供给侧结构性改革的成果。

2016年,全国出版、印刷和发行服务实现营业收入23 595.8亿元,较2015年增长9.0%,利润总额1 792.0亿元,增长7.8%,在图书出版方面,2016年,全国共出版图书50.0万种,较2015年增长5.1%,总印数90.4亿册(张),增长4.3%,定价总金额1 581.0亿元,增长7.1%。全年图书出版实现营业收入832.3亿元,增长1.2%,利润总额134.3亿元,增长7.2%。

总体来说,全国图书出版努力实现社会效益与经济效益相统一,图书出版、总印数和销售营业收入呈现稳步增长,经济效益维持在稳定水平上,确保了行业的持续发展,但图书出版业同样面临着严峻的挑战和实际的压力,在出版、发行、营销三大业务区划中,仅出版端就已经存在四大难题:

一、图书库存量居高不下,图书出版质量亟待提高:

图书出版业“新畅销书”一书难求,以虚构类畅销书榜单为例,2014年出版的《解忧杂货店》在2016年和2017年两度成为最畅销的虚构类图书。不仅如此,紧随其后的《追风筝的人》和《摆渡人》也都是畅销多年的热门小说。此外,“新畅销书”一书难求的现象,也折射出优秀作者难寻的行业普遍问题。也正是因为畅销书一书难求,“旧书新出”与“公版书泛滥”的情况在国内图书出版业很明显,《三国演义》《红楼梦》《水浒传》《安徒生童话》等中外经典图书的出版品种都在数百种以上。库存增速大于生产增速,总库存占年度出版图书定价金额的比例也从71.1%增至72.3%,形成了行业内“每出版2本图书就要库存1本”的行业共识。

1520410405589

二、“新畅销书”一书难求,难寻优秀作者:

图书出版业“新畅销书”一书难求,以虚构类畅销书榜单为例,2014年出版的《解忧杂货店》在2016年和2017年两度成为最畅销的虚构类图书,此外,“新畅销书”一书难求的现象,也折射出优秀作者难寻的行业普遍问题。

三、大众图书出版利润率低,盈利手段单一

由于图书出版业盈利模式单一,出版社基本上只是一次售卖图书内容,大众图书出版的普遍利润率仅为3~5%,与国际出版业同行有着显著差距,以美国著名出版集团企鹅兰登书屋为例,其利润率已经多年保持在14%的水平线上;

四、图书销量数据预测难、反馈慢、视野窄,市场响应迟滞

目前,传统图书销量预测准确率不高,出版社-发行渠道-书店-读者之间的数据反馈机制不准确且效率低下,出版社很难及时有效的得到出版图书的全盘数据,这造成出版社对市场需求的响应犹豫、谨慎且存在长时间的迟滞。

出版业数字化转型三大共识

近年来,图书出版业者近年来不断积极探索解决办法与发展路径,逐渐形成了图书出版业在出版端的数字化转型的三大共识:

1、瞄准图书IP化机遇,精准定位读者需求,寻找优秀作者(特别是畅销书作者),出版新畅销书,形成图书出版业的“爆款”,并向影视制作、文化消费等领域进行二次、三次售卖;

2、积极贴近市场,实时、全量的了解图书出版、发行、营销及评价数据,提高图书销量预测准确性,加快市场响应速度,做到“畅销书早备货,滞销品种早预警”;

3、以新畅销书为核心,以图书IP化为手段,结合准确的市场预测和及时的市场反馈能力,提高图书出版业利润率。

为什么是中金易云?

中金易云是2017年由浙江省新华书店集团(以下简称浙江新华)和中金数据系统两家公司共同成立的图书行业大数据科技公司,得益于浙江新华和中金数据的注入,中金易云拥有图书出版业数字化转型的四大基础支柱:

1、强健的信息系统:中金数据与浙江新华在ERP平台上的积累和能力,为中金易云收集真实的、细颗粒化、及时的业务数据进行数据分析与洞察提供了坚实的基础;

2、领先的物流及合作网络:在浙江新华的支持下,中金易云与超过1000家出版机构拥有深度供应链合作,与15家发行集团建立了战略联盟;

3、全量书目数据与真实业务数据:浙江新华自上世纪90年代起陆续投资建设ERP、产品库系统,拥有国内首屈一指的全量书目数据库,同时,通过行业深度合作,中金易云拥有20个省以上的真实业务数据基础,将全国三分之一市场盘面数据囊括其中。

4、行业理解:浙江新华与中金数据皆是图书出版业的“老字号”,有着对行业发展、行业创新深刻的理解,早在2016年,浙江新华就已经开始了行业调研。

成立之后,中金易云以开放互补的发展思路,希望寻找具有优势互补效应的外部合作伙伴共同构建“中金易云出版发行大数据平台”,在调研了行业内多家潜在合作伙伴之后,最终中金易云选择与阿里云合作。

中金易云副总裁朱英认为,此次合作花落阿里云有两点主要的原因:

1、阿里云在云计算、大数据领域有着强大、广泛的影响力,同时提供了功能完善、服务多样、地域广阔、技术完备的云计算服务,与阿里云合作为中金易云在全国范围内提供服务提供了可靠的支撑;

2、阿里云在人工智能领域积累深厚,拥有先进的数据智能算法,可以快速实现业务应用,确保图书销量预测、图书选题及作者推荐等项目关键功能的有效性;

此外,中金易云创新应用中心总经理俞国忠表示,阿里云为中金易云提供了宝贵的市场及运营经验的分享,同时,在运维保障上做出了2小时响应的承诺,“无论是对中金易云出版发行大数据平台还是出版社,都是值得信任的保障。”

经过中金易云与阿里云的紧密协调和深度沟通,双方制定了“(出版发行)大数据中台 + 数据智能(人工智能算法)”的技术实施方案:

出版发行大数据中台

1、数据上云:将来自浙江新华书店ERP系统、中金ERP系统以及其他中盘提供的数据,与来自爬虫系统的数据,统一汇总到阿里云数加MaxCompute的企业大数据仓库,实现数据上云;

2、爬虫系统:开发互联网数据爬虫系统,爬取图书销售、书评、商品评价、类目交互、作家相关信息、舆情等侧重领域的数据,形成对中金易云内部数据的有效补充;

3、云上大数据架构建设:对从ERP和爬取的数据进行数据仓库建设,并通过该数据仓库,通过算法和模型建设相应的标签体系,打造不同层次用户、客户的画像,最终对数据应用层提供数据访问;

此外,阿里云为中金易云提供了大数据应用产品和应用系统web端和H5页面的开发。

人工智能算法开发:

1、标签生产算法模型:使用fasttext等深度学习算法,根据空白分类书本的相关描述属性,例如,简介,读者分类,题材等,自动分析推荐出书本标签;

2、图书销量预测模型:通过图书多维度信息,设计更适合特定品种类别的预测误差评定标准,最后根据图书品种历史销量数据、网络舆情数据、电商平台销售及评论数据,综合利用统计优化模型、机器学习模型、时间序列预测模型等多种不同算法模型对不同图书品种类别的销量进行图书销量预测模型建模;

3、个性化推荐系统模型:基于个性化推荐系统原理,根据不同的应用场景,利用基于用户/商品的协同过滤、矩阵分解、有监督学习方法进行推荐系统建模,如针对出版端智能选题场景建立选题推荐模型;

4、库存优化模型:基于大数据策略和库存优化算法计算出最优的中盘图书库存各品种备货数量,提供有针对性的库存优化解决方案,同时根据海量的历史库存数据,建立库存分析预警的机器学习模型。

image
大数据中台+数据智能,用数据解答出版社编辑“畅销书从何而来?”的疑问

在I期项目中,中金易云与阿里云重点完成了针对出版端的技术开发与方案实施,在产品服务角度上达成三大阶段性成果:

1、出版社数据上云及数据标准化:截止目前完成10个省的图书发行数据上云,计划到今年底覆盖20+省份,并且以数据中台思路方法论帮助出版社高效数据上云工作,并完成行业数据规范化与标准化工作,大大提升图书行业数据收集与整合效率;

2、数据智能化:基于400万书目数据,过亿条销售数据,千万级爬取数据,百万作者库数据,定制研发超过8种智能算法,构建了“提炼标签-建立模型-确立关系-生成洞察”的核心能力:

2.1 建立出版社多维度画像模型、出版物标签体系及画像模型、作者多维度画像、读者画像模型;

2.2利用人工智能算法,进行作者画像与出版物畅销指数、读者画像与出版物标签特征的交叉比对,打通“作者-出版物-出版社-读者”四维关系图谱;

3、消除信息孤岛:覆盖全国1000+出版社,形成出版社与中盘发行的连接,打通营销上行路线、订货下行路线,并整合网络电商渠道,形成可分层可对比可互动的出版发行网络;

出版社业务战略朝“以技术+IP为中心”转向

近年来,出版社已经从以出版人为中心,转向了以管理为中心,出版社入驻中金易云出版发行大数据平台之后,“以技术+IP为中心”的战略转型,将随着出版社对平台的深度使用而逐渐发生。

首先,大数据中台 + 数据智能为出版社赋能,让出版社认识到技术能力在图书出版业的重要作用,并将技术能力的提升和对中金易云出版发行大数据平台等第三方平台技术能力的吸收,作为业务战略的重要组成部分。面向出版社的技术赋能将从如下三方面展开:

全面直观展现数据 洞悉经营情况:深度整合出版社全维度经营和行业市场数据,通过精细设计的GUI,出版社管理人员可以通过图形界面直接的获知行业趋势与本机构经营概况;

image

及时获悉脱销、滞销风险 及时响应市场需求:出版社及发行渠道将及时获得畅销书备货不足品种的预警(畅销预警)和备货过量的滞销品种预警(滞销预警),避免发行渠道类型的错配,做到“畅销书早备货,滞销品种早预警”,实现动态、准确的库存优化。

image
脱销告警,及时发现畅销书销售热点,避免断货

选题助手精准辅助 选好题 选好作者 做好选题:

1、找到畅销书:以选题多维参数为依据,智能匹配品种,生成图书出版畅销书潜力、销售预测等报告,找到最有可能成为畅销书的选题,快速完成“多题选做(对多个选题做出取舍)”的工作;

编辑人员将拥有大量数据洞察支撑和数字化手段辅助,投入大力度进行“专题精做(大力支持畅销书)”,做出比肩《解忧杂货铺》的“新畅销书”;

image

2、发现好作者:以结合出版历史、销量走势、网络舆情以及作者综合能力画像等信息,综合判定作者是否具有优秀作者(及畅销书)的潜力,从而达成选题合作或在作者成名前建立关系紧密的作者储备;

image
洞悉作者情况,并进一步生成作者画像,找到好作者

3、做好“选题多卖”:出版发行的选题资源形成多次延伸开发、多媒体协同的综合效应,以畅销书内容打造“文化IP、故事IP”,实现图书IP化,向影视制作、文化消费等领域进行二次、三次售卖,做到“一题多做”。

进一步的转变将随着出版社以大数据中台 + 数据智能为基础的图书IP化支撑和加速逐渐展开,大数据中台 + 数据智能 将显著改善出版社图书IP化工作的投入准确率,为出版社带来更高的投资收益,出版社系统、可见、批量的实践图书IP化成为可能,随着出版社在图书IP化上获得远超以往的收益,图书IP化及图书内容的二次、三次售卖将成为出版社的重要收入来源。

最终,出版社将实现“以技术+IP为中心”的业务战略转向:以技术赋能业务,创造和挖掘新的畅销图书IP,继而通过图书IP的销售,获得远超以往传统图书码洋数十乃至数百倍的收入,而这些收入还将进一步提高出版社对技术的投入水平,形成图书出版业发展的良性循环。

image

目前,随着平台I期项目的上线,中金易云“以大数据思维方法论重构出版发行行业”的战略愿景获得了坚实的大数据中台与智能算法基础,磨铁图书和中国地图出版社两家出版社已经进行业务测试,并取得了良好的效果,预计在今年6月会向全国图书出版业进行推广。

出版社组织战略的转变:成数据驱动型组织

大数据中台 + 数据智能 的图书出版业数字化转型趋势将对出版社的组织架构产生影响:

老编辑将大幅度减少原本需要经手的无效、低畅销度选题,逐渐成为出版社的“畅销书”把关人,将工作重心转移到图书的专题精做、一题多做上,集中精力进行图书IP化的工作,变身“图书IP化”的“操盘手”;

新编辑除快速提升专业技能之外,将有大量的时间、精力进行畅销书选题、优秀作者的筛选,将挖掘选题和作者的视野逐渐放大,逐渐成为出版社的“星探”;

在可预测的未来3-5年,有技术、有想法、有积累的出版社,如浙江新华,将依托中金易云出版发行大数据平台,成长为“数据驱动型组织”,构建以输出图书IP为核心的高盈利知识服务体系。

需要指出的是,数据智能,即人工智能算法(数据智能算法),是“数据驱动型组织”有效、高效利用数据的必要条件。阿里云拥有强大的人工智能技术储备和研发力量,不仅在算法方面拥有深厚积累,更可以从具体的场景和问题出发,研发算法系统,为客户提供定制化的数据智能算法及配套的云平台构建、数据集成与数据治理、可视化大屏展现等解决方案。

新一期项目即将开始 中金易云要让“天下买书和卖书都没有困难”

中金易云出版发行大数据平台的II期工程即将开始,新的一期项目将针对图书出版业的发行端、零售端、运营端提供大数据平台和数据智能,中金易云副总裁朱英表示:“新一期项目将打通‘内容(生产端)与读者(C端)’,做到‘让读者选择内容IP’,并最终在图书零售市场打造出智慧书城,形成从出版、发行,到零售、营销的全流通文化供应链。”

在发行端,支持构建全国范围内的数据驱动的结合智能算法的发行端大数据中台,协助打造发行集团“服务中心”智能;在零售端,针对图书门店选品困难、服务不对位、图书摆放粗狂的问题,致力于打造极致单店零售网点。

后记 中金易云要为图书出版业做事情 实践供给侧改革

在案例调研的深度访谈中,中金易云副总裁朱英不断强调,中金易云的目标不是仅仅搞业务、搞销售,而是要认认真真的为图书出版业做点事情,他谈到,浙江新华原董事长周立伟早在90年代构建浙江新华的ERP系统、产品库及全量书目数据时就有一个梦想,那就是“浙江新华积累的业务数据,迟早要服务于整个行业。”因此,朱英表示:“中金易云的目标,不只是为浙江新华解决问题,而是要为整个行业解决问题。”

以供给侧结构性改革的角度来看,出版社即是最直接的供给侧,出版高质量、畅销度高的图书,建立出产高质量图书及图书IP的体系,即是提高供给体系质量。中金易云出版发行大数据平台正是以数字化转型为核心思路,以大数据中台与智能算法为基础的出版业供给侧结构性改革的成果。

在供给侧的“终端”——书店,在中金易云正在为浙江新华的智慧书城提供数据支撑,并参与到方案设计当中:浙江新华正在嘉兴投资5.5亿建设8万平米的文化综合体,包括影院、培训中心、酒店和一万多平米的智慧书城,作为未来书店领域的标杆,浙江新华正致力于将其打造为具备科技时尚特征,“融合了线上书店业态的2.0版线下书店”,不仅为图书行业理清“人、货、场”的关系提供样板,更以大数据技术赋能,帮助书店做好选品;以大数据和人工智能技术赋予各种设备以“智能”,搭建起读者和图书互动体验的全新桥梁。

相关实践学习
阿里云百炼xAnalyticDB PostgreSQL构建AIGC应用
通过该实验体验在阿里云百炼中构建企业专属知识库构建及应用全流程。同时体验使用ADB-PG向量检索引擎提供专属安全存储,保障企业数据隐私安全。
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
相关文章
|
3月前
|
Java C++ Python
【杂谈】在大学如何学得计算机知识,浅谈大一经验总结
【杂谈】在大学如何学得计算机知识,浅谈大一经验总结
|
4月前
|
Python
京东技术团队撰写的整整986页《漫画学Python》到底有什么魅力?
这是一本Python入门书。无论您是想学习编程的小学生,还是想参加计算机竞赛的中学生,抑或是计算机相关专业的大学生,甚至是正在从事软件开发的职场人,本书都适合您阅读和学习。但您若想更深入地学习Python并进行深层次应用,则需要选择其他相关图书。
|
监控 项目管理
PMP备考之路 - 汪博士第一章(引论)(下)
PMP备考之路 - 汪博士第一章(引论)(下)
59 0
|
监控 项目管理
PMP备考之路 - 汪博士第一章(引论)(上)
PMP备考之路 - 汪博士第一章(引论)
65 0
|
存储 分布式计算 算法
江苏大学 操作系统 知识点提纲 期末考试/考研 复习
江苏大学 操作系统 知识点提纲 期末考试/考研 复习
281 0
|
前端开发 JavaScript 程序员
我们相约,这份学习指南请您收好。
我们相约,这份学习指南请您收好。
|
数据挖掘
|
Web App开发 存储 缓存
身家过亿的帝都王子来到1024盛宴-小码农献上linux进阶知识点一篇
身家过亿的帝都王子来到1024盛宴-小码农献上linux进阶知识点一篇
132 0
身家过亿的帝都王子来到1024盛宴-小码农献上linux进阶知识点一篇
|
SQL 算法 前端开发
撕书吧!编程小白!你也能学的哈佛CS50,全美最受欢迎计算机入门课
【新智元导读】自学计算机,到底如何入门?哈佛大学计算机导论课程 CS50推荐给编程小白们,这门课是哈佛最受欢迎的课程之一,老师风趣幽默,带你少走弯路,直奔编程大门。
454 0
撕书吧!编程小白!你也能学的哈佛CS50,全美最受欢迎计算机入门课