文/张申宇
将行业知识与数字化技术相结合,从而赋能自身业务发展,并且凭借能力外溢打造行业样板与底座,是很多大型企业成立数科公司后业务独立运营的考验,但究竟如何才能取得显著成绩,各方仍在持续探索。
中远海运集团是全球最大的航运公司之一,覆盖了船舶设计、船舶制造、航运服务的全生态产业链。在航运这一垂直领域,中远海运集团绝对具备充足的行业 Know-how,如何将企业能力转化成为整个行业的能力?这一任务落到了集团下属科技板块中远海运科技股份有限公司(下称“中远海科”)肩上。
近年来,中远海科不断在数字化技术以及 AI 大模型应用领域积极探索。通过与擅长技术的阿里云携手合作,构建起服务于整个海运行业的全新数智底座 —— 船视宝,已然在数字化技术与 AI 大模型的尝试中迈出了领先的步伐。
航运数字化转型的时代命题
在交通领域之中,尤以航运行业的数字化进程最为复杂。
海运行业虽然传统,但它蕴含了大量的数据,包括各个港口的物流信息,运输的船舶信息,以及物流供应链的变化情况等。比如,一条船最多可以装 27000 个集装箱货柜,每个柜子里可能有上万票货,整条船蕴含的数据量就更加庞大。而且,海运承担了 90% 的全球贸易量,其蕴含的数据足以反映全球物流供应链变化、甚至全球经济发展走势。此外,当前中国企业出海也需要航运数字新基建来完善全球的供应链管理,打造海运数字新基建势在必行。
作为行业龙头,中远海运更是切身感受到行业面临的挑战。中远海科研发创新中心总经理韩懿介绍,中远海运集团的数字化目标主要有三个,即提高航运安全性、实现低碳的可持续发展目标,以及赋能供应链发展。
“航运业的业务数据量大,且数据主体还非常复杂且众多。”韩懿指出,“在数字化之初,我们也面临着如何汇聚海量业务数据,深挖数据资产价值等问题。”
其实,整个行业船舶的自动化程度非常高,全球公共开发的数据包含船位数据、港口档案、船舶档案等,只要大家愿意付出一定的经济成本都可以获取。
但难点在于利用这些信息进行整合分析,为决策提供助力。比如通过解析一条船的过去、现在和未来的全生命周期行为,进而实现安全、效率等管理决策,优化能耗、碳排放,决定技术改造、拆旧换新等;结合天气数据、位置信息、港口数据等预测运力、路线情况,为运力规划、航线判断以及航行中面临的各种未知风险提供参考。
基于上述痛点,中远海科推出了“船视宝”,通过综合应用大数据、云计算、人工智能等技术,建立了基于全球船舶位置信息的航运数据中台,自主研发出面向海事监管、航行安全、船队运营、全球供应链优化等领域庞大的数字化产品集,为行业用户提供更智能、便利、敏捷和低成本的数字化服务。
大数据 + 云计算,打造航运数字底座
作为航运大数据平台,船视宝有一套完整的从感知到识别、分析、应用的全链路业务逻辑。
在船视宝可视界面的诸多集成应用背后,是以多源异构数据的实时采集与融合技术、船舶行为和态势智能感知与识别技术为基础,进一步实现航运业务智能理解与推断。
整体来说,第一步是对多源异构信息进行实时采集与融合。通过研究多源异构大数据的高效融合、表征、存储和检索方法,构建了时空索引和湖仓一体数据中台。
比如,针对船、岸、星各类船舶位置数据,形成了流批一体的数据实时接入与高效解码方法,研究了基于深度学习的数据质量控制技术,高效识别和处理船舶船位数据重复、MMSI (Maritime Mobile Service Identity,水上移动业务标识码)套牌、MMSI 更换、船位数据缺失等数据异常和质量问题。并针对船舶档案数据,重点研究基于相似船舶聚类分析的船舶异常字段识别和处理技术,缺失数据回填技术等。还对港口与海洋专题数据采集与预处理,构建了全球电子海图数据、洋流、气象等数据的采集、处理和时空配准、对齐和融合方法。
第二步是对船舶行为和态势进行智能感知与识别,实现复杂交通环境下海洋运输行为态势的智能感知。
通过融合多源异构信息构建时空数据库,基于语义推理和空间计算,构建了准确完备的船舶行为状态标识模型,对船舶行为状态进行时空标识。基于此,针对船舶各自独立行为进行综合时序分析,结合多源数据融合和深度学习理论与迁移学习理论,对海量数据自主标注,提出了船舶综合行为理解方法。
由此,可实现船舶常态与非常态行为特征提取。例如研究常态化场景(如加油、装卸等)在不同水域的行为特征,建立分析模型;针对非常态行为(如船舶失踪、偏离航线等),通过大数据分析、人机交互和人工智能技术,获取航行规律,监测异常行为。
以上构成了船视宝对航运业务进行智能理解和推断的基础。
最早,中远海科用开源物联网数据库 TiDB 处理全球的公共数据,当数据量到了八十多亿条记录的时候,整个系统就瘫痪了,靠传统数据库根本无法支撑。
后来中远海科则利用阿里云提供的云原生数据库引擎和阿里云时空数据库引擎 Ganos,为大数据的实时查询加速以及多项轨迹管理挖掘功能提供了强有力的支撑。
基于阿里云的 PolarDB-PostgreSQL 云原生数据库产品,实现了海量船位数据实时写入、基于原始数据的基本处理、Ganos 相关计算场景,以及定时任务多表关联查询、航运大数据指标分析、Ganos 实时热力图场景等功能。
“在海上没有路网,如何进行路径规划和智能推荐,以及实时显示数十万艘船舶最新的位置点,并进行动态更新是个难题。”韩懿指出。
与此同时,如何进行区域船舶聚类分析与轨迹实时热力图绘制也是在应用过程中不可避免需要面对的挑战。
在这个过程中,中远海运依托于阿里云提供的时空数据库引擎 Ganos,支撑船视宝多项轨迹管理挖掘功能,实现了亿级船舶轨迹数据管理挖掘。
之后,在第三步分析阶段,以融合的多源数据为驱动,以机器学习、关联学习算法为工具,深度挖掘数据中的隐藏模式和规律,并关联协同各业务场景,探寻生产经营指标间的内在逻辑,开发了运营效率对比指数、空载船舶指标、船舶能耗、港口拥堵等描述型数据服务体系。 同时结合阿里云大数据技术,实现了航运数据在云上的价值分析,赋能安全、运营和航运配套。
最后是产业应用集成与部署阶段。通过汇集各业务场景下的算法开发与应用操作,集中管理数据、代码、算法模型等资源,并针对产业需求研发集成应用平台系统,涵盖船舶调度、搜索、管理、安全、应急、商品、指数、竞争等应用。
应用集成也非常灵活,通过微服务架构(Microservice Architect)模式,将架构中的各应用划分成一组小的服务,服务之间互相协调、互相配合。此外,还引入前后端分离的架构风格,后端负责业务/数据接口,前端负责展现/交互逻辑,同一份数据接口,可以快速定制开发多种版本。
由此,船视宝航运大数据平台一方面形成了实时的远程监控、远程调度的基础能力;另一方面,基于服务航运行业多年来的业务经验,加上模型和算法的能力,可以监测、甚至预测一艘船的“健康”状况,并根据数据分析,帮助船舶经营公司提升船舶维修保养的辅助决策能力。
与此同时,还可以通过动静态结合的数据为海上的船舶提供实时的信息,比如根据对气象数据的分析,告知海运企业所属船舶在运输过程中可能遇到什么样的风险。
以阿里云的大数据与云计算技术为底座,再加上中远海运在航运行业多年积累的行业 Know-How,船视宝一经推出,就受到了业内众多的好评。
从 2019 年 9 月开始研发,2019 年 12 月第一个产品“调度宝”上线运行,船视宝经过 4 年多 250 多个版本迭代发布,发展至今上线 16 个 SaaS 产品、43 个小程序、46 个 APP、100 多个场景组件、310 个功能、1000 多个 API,服务 1300 多家企业用户、PC 端用户 2.8 万人、小程序用户 9.7 万人。
同时,“船视宝”正与航运相关产业开展链式互动,例如,与中远海运能源船舶管理平台、中远海运散运“船货易” 平台、宁波海事局深蓝智享平台等项目对接,为其提供数字化服务。
GenAI 已至,大模型赋能航运智能化新时代
随着生成式 AI 的问世,新一轮人工智能革命正在重塑各行各业,航运行业也加速步入“智能化新时代”。在船视宝使用 AI 大模型赋能应用方面,中远海运也在与阿里云展开深入的探索。
早期,中远海运与阿里云基于通义千问开源大模型,对船视宝进行了“AI 升级”。
与通用大模型不同的是,针对航运行业而言,需要利用大量行业专有数据对大模型进行训练,虽然模型的参数并不需要很大,但是在训练和调优的过程中,需要大量优质的航运行业专有的数据。
除了专有的知识型数据以外,企业还需要将大模型的能力与原有产品结合的能力,这个过程中就需要很多实时性的数据。
以海运行业为例,海运船舶需要实时的掌握全球航道的信息。比如问大模型红海现在通行情况?如果没有这些实时的数据源,任何大模型都答不上来。而这恰恰是行业大模型的重要特点和显著优势。
面对行业大模型落地的挑战,中远海运一方面通过整合航运业务经验、航运专业语料及信息数据,构建全面的航运知识图谱,形成了专业的知识数据集。
进而,再通过阿里云通义千问算法工程师的介入,将知识图谱与通义千问大模型关联,最终实现智能对话功能,向用户提供准确的航运信息及决策支持。由此,中远海运自主研发的航运领域垂直大模型 Hi-Dolphin 应运而生。
“有了 Hi-Dolphin 大模型加持后的船视宝,极大提升了数据处理的实时性与响应能力,支撑航运企业的数字化转型。”韩懿如是说。
比如航运知识层面,通过整合航运业务经验、航运专业语料及信息数据,构建全面的航运知识图谱,包含海事法律法规超过 1000 条,并将知识图谱与通义干问大模型关联,实现智能对话功能,向用户提供准确的航运信息及决策支持,极大提升了数据处理的实时性与响应能力。
航运数据层面,通过大模型对接了数十个航运数据分析 API 接口,提供实时可靠的航运数据查询服务,包括智能找船、船舶档案、船舶事件、港口动态,将通义干问的语言理解能力、概括表达能力结合了搜索插件,有效解决新知识难更新、时事类问答容易“张冠李戴”等问题。
运力预测层面,通过大模型语义理解能力,可以通过自然语言与系统交互,快速获取所需的航运信息和建议。通过融合船舶与港口全生命周期数据、气象数据和地理信息数据等多源异构数据,利用大模型对数据中的时空信息实现深度挖掘和综合学习,能够实现对未来多港预测和预抵时间等下游多种任务的精准预测。
智能应用层面,智能化升级了事件回溯、AI 探索等多个应用,以“角色模拟”应用为例,用户根据自身在航运领域中的特定角色,如船长、轮机长等,进行针对性的专业问答,大模型通过深入理解各个角色的专业需求和日常操作流程,为用户提供定制化的信息检索和决策支持服务。无论是关于航线规划、货物管理、船舶维护还是海事法规咨询,都能够提供精准、及时的问答服务。
展望未来,在韩懿看来,大模型在企业中的应用主要要发挥两个作用,“一种是应用模型,相当于一个‘实习生’,获取数据、整理数据并且进行文书表达;另一种是加入科学计算模型,加入运力模型,进行预测决策,成为真正的‘骨干和专家’。”
目前,航运大模型对外服务着船视宝行业客户的 10 万多个用户;对内,有包括散货、特货、能源、物流、港口等板块在内的众多中远海运二级企业。
随着中远海科与阿里云共同推进数据治理和 AI 大模型应用不断深入,船视宝应用日趋完善,发挥着航运业数智新底座的作用,距离中远海科成为“交通与航运科技创新和数字化产业标杆企业”、打造集团科技创新和数字化产业平台的愿景也更近一步。