中国人工智能学会通讯——金融机构的市场机遇与实践 1.4 人工智能——系统实现关键

简介:

1.4 人工智能——系统实现关键

最后一页是我的机器学习在金融科技中的实践体会。人工智能在书本里有比较清楚的定义,但是在工程中,这个定义就变得非常模糊和难以把握。我这里讲最基本的四个步骤:数据处理、特征提取、模型训练和评价测试。

image

工程的数据处理中,很多时候删除样本比增加样本更加重要。今天谭院士讲人工智能不是万能的,最关键的是把技术边界做好,能做的做,不能做的投降,这样最后系统的准确率和稳定性就提高了。但是数据删除,也就是挑选数据或者是过滤数据,好比是在数据中砍几刀。我们认为能够正确砍出这几刀的人,在公司的价值是非常大的,目的就是划定技术边界。

第二个就是特征提取,要对交易的本质非常清楚。

第三个是模型训练。进入模型训练很麻烦,做过搜索和推荐的都知道,最大的痛苦就是天真地相信了这份数据,然后训练出一个模型,后来发现,开始认为对的数据,实际上是不那么好的模型serve出来的,这是一个循环。

最后,评价是最重要的。如果你评价做不好,整个方向就错了,你越努力就越错得厉害。例如两位老师讲的Explore&Exploit,评价非常难,如果数据集不够,评价就没法儿做。

在金融行业里,我们目前和中国顶级的金融客户在合作。在合作的过程中,我们也遇到了很多的问题。首先就是数据的问题。传统的软件和客户是怎样合作的?传统软件开发,只要有一个小的样本数据、有非常清楚的产品需求就可以做了。但是在大数据人工智能时代,由于金融行业的特殊性,客户不会实现给你数据,但是,对于机器学习来说,只有拿到数据一切才刚刚开始,大量的工作会在数据预处理环节。反过来,你还没开始时,用户为什么让你进场拿数据?这不就是一个死结吗?这是非常大的挑战,我们有一个很好的优势,就是有这么多的模拟数据和自有交易数据,我可以先“闭门造车”搞出模型和系统,八九不离十,到客户那儿再调一下,这样就可以快速地切入进去。

(本报告根据速记整理)

相关文章
|
8月前
|
机器学习/深度学习 人工智能 测试技术
EdgeMark:嵌入式人工智能工具的自动化与基准测试系统——论文阅读
EdgeMark是一个面向嵌入式AI的自动化部署与基准测试系统,支持TensorFlow Lite Micro、Edge Impulse等主流工具,通过模块化架构实现模型生成、优化、转换与部署全流程自动化,并提供跨平台性能对比,助力开发者在资源受限设备上高效选择与部署AI模型。
659 9
EdgeMark:嵌入式人工智能工具的自动化与基准测试系统——论文阅读
|
机器学习/深度学习 人工智能 算法
猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法
宠物识别系统使用Python和TensorFlow搭建卷积神经网络,基于37种常见猫狗数据集训练高精度模型,并保存为h5格式。通过Django框架搭建Web平台,用户上传宠物图片即可识别其名称,提供便捷的宠物识别服务。
1325 55
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
眼疾识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了4种常见的眼疾图像数据集(白内障、糖尿病性视网膜病变、青光眼和正常眼睛) 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Django框架搭建了一个Web网页平台可视化操作界面,实现用户上传一张眼疾图片识别其名称。
688 5
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
|
7月前
|
人工智能 IDE 开发工具
拔俗人工智能辅助评审系统:如何用技术为“把关”提效
人工智能辅助评审系统融合大模型、提示工程与业务流程,实现上下文深度理解、场景化精准引导与无缝集成。通过自动化基础审查,释放专家精力聚焦核心决策,提升评审效率与质量,构建人机协同新范式。(239字)
569 0
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
拔俗AI人工智能评审管理系统:用技术为决策装上“智能导航”
AI评审系统融合NLP、知识图谱与机器学习,破解传统评审效率低、标准不一难题。通过语义解析、智能推理与风险预判,构建标准化、可复用的智能评审流程,助力项目质量与效率双提升。(238字)
492 0
|
机器学习/深度学习 人工智能 自然语言处理
人工智能的边界拓展:从理论到实践的飞跃####
本文探讨了人工智能(AI)技术的最新进展,特别是深度学习领域的创新如何推动AI从理论研究走向广泛应用。通过分析几个关键领域的实际应用案例,如医疗健康、自动驾驶和自然语言处理,本文揭示了AI技术的潜力及其对社会和经济的深远影响。文章还讨论了当前面临的挑战,包括伦理问题和技术瓶颈,并展望了未来的发展趋势。 ####
|
人工智能 自然语言处理 API
MCP与A2A协议比较:人工智能系统互联与协作的技术基础架构
本文深入解析了人工智能领域的两项关键基础设施协议:模型上下文协议(MCP)与代理对代理协议(A2A)。MCP由Anthropic开发,专注于标准化AI模型与外部工具和数据源的连接,降低系统集成复杂度;A2A由Google发布,旨在实现不同AI代理间的跨平台协作。两者虽有相似之处,但在设计目标与应用场景上互为补充。文章通过具体示例分析了两种协议的技术差异及适用场景,并探讨了其在企业工作流自动化、医疗信息系统和软件工程中的应用。最后,文章强调了整合MCP与A2A构建协同AI系统架构的重要性,为未来AI技术生态系统的演进提供了方向。
1734 62
|
人工智能 算法 计算机视觉
【01】opencv项目实践第一步opencv是什么-opencv项目实践-opencv完整入门以及项目实践介绍-opencv以土壤和水滴分离的项目实践-人工智能AI项目优雅草卓伊凡
【01】opencv项目实践第一步opencv是什么-opencv项目实践-opencv完整入门以及项目实践介绍-opencv以土壤和水滴分离的项目实践-人工智能AI项目优雅草卓伊凡
547 63
【01】opencv项目实践第一步opencv是什么-opencv项目实践-opencv完整入门以及项目实践介绍-opencv以土壤和水滴分离的项目实践-人工智能AI项目优雅草卓伊凡
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
害虫识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了12种常见的害虫种类数据集【"蚂蚁(ants)", "蜜蜂(bees)", "甲虫(beetle)", "毛虫(catterpillar)", "蚯蚓(earthworms)", "蜚蠊(earwig)", "蚱蜢(grasshopper)", "飞蛾(moth)", "鼻涕虫(slug)", "蜗牛(snail)", "黄蜂(wasp)", "象鼻虫(weevil)"】 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Djan
734 1
基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
|
数据采集 人工智能 缓存
深挖“全栈智算”之力 中兴通讯开启AI普惠新纪元
深挖“全栈智算”之力 中兴通讯开启AI普惠新纪元
341 1