开发者社区大数据文章正文

【Spark Summit East 2017】使用机器学习注释器和大规模深度学习本体进行语义自然语言理解

2017-02-19 2485

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本讲义出自David Talby在Spark Summit East 2017上的演讲，主要介绍了一个通过自由文本格式的病人记录给出临床诊断推理和实时的参考意见的端到端系统，该系统的架构是构建在Kafka与Spark Streaming之上的，该系统可以实时地对于数据进行获取和加工，并使用Spark & MLLib进行建模，并通过Elasticsearch使得用户可以低延迟地对于结果进行访问。

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data；此外，通过Maxcompute及其配套产品，低廉的大数据分析仅需几步，详情访问https://www.aliyun.com/product/odps。

本讲义出自David Talby在Spark Summit East 2017上的演讲，主要介绍了一个通过自由文本格式的病人记录给出临床诊断推理和实时的参考意见的端到端系统，该系统的架构是构建在Kafka与Spark Streaming之上的，该系统可以实时地对于数据进行获取和加工，并使用Spark & MLLib进行建模，并通过Elasticsearch使得用户可以低延迟地对于结果进行访问。

96c895b2eb9749409e9b5163be8f2c9e5cfcbdb0

602e0725b542d1a480f7d198d6ec2bf789b9d64e

ad93c543a64b3049a5726dfcbbd28e3762b176cd

0df85301dd6428ad6e54a3404539d183914a6792

8d31b999a6c1bef1e3bd5918a38e527d0501aded

75fcba7cd526ecdfac2363d4530403f5a9ad5b28

6390db3ae16253c1df29dd31c8422591338ab0e1

766570c44bc312e0cfc2f12aba64695df27ae581

cbc094350f0e7b6cd25c2e51c3bc35926372cd00

773a8e027c4cab2908c2443f960ade22638810e6

6d0e5d5dd6d652529976257028efdba0fded748d

84904cfbacb187c21e663a943c7c7f59a5e1ec93

a456059e8183c9cb2c11a00bbea7496fff9439ef

b4428bfdf247df471cf8cb8e4489ce709df4743f

561797fbbabe1d0daea6dcde628111e0df818850

b4b729316a1e709f284c7409614ddc255f1c4f5c

a01be1365adb58fb44346b8b86f7bbb8aae71785

c3903ad4e507356822a23c8aabd47af5f7c6827b

a9ad4d3a417051bdfb91ff3d736ce95d74793dea

909975b39548e87e0efc52896e1507aa7c4c66c4

c5c5d79fd29833d7b206ff6239e2a1806d3d129e

34f50ee74537b5f8c57380b405b985fd0b11ecb7

文章标签：

自然语言处理

机器学习/深度学习

大数据

分布式计算

Spark

自然语言处理

消息中间件

流计算

Kafka

MaxCompute

关键词：

人工智能平台 PAI深度学习

机器学习深度学习

apache spark机器学习

spark人工智能平台 PAI

人工智能平台 PAI自然语言

小猫吃鱼569

martinzh717

机器学习/深度学习人工智能供应链

从概念到商业价值：AI、机器学习与深度学习全景指南

在这个科技飞速发展的时代🚀，人工智能正以惊人的速度渗透到我们的生活和工作中👀。但面对铺天盖地的AI术语和概念，很多人感到困惑不已😣。"AI"、"机器学习"、"深度学习"和"神经网络"到底有什么区别？它们如何相互关联？如何利用这些技术提升工作效率和创造价值？

martinzh717

684 0 0

阿里云大数据

机器学习/深度学习分布式计算大数据

阿里云 EMR Serverless Spark 在微财机器学习场景下的应用

面对机器学习场景下的训练瓶颈，微财选择基于阿里云 EMR Serverless Spark 建立数据平台。通过 EMR Serverless Spark，微财突破了单机训练使用的数据规模瓶颈，大幅提升了训练效率，解决了存算分离架构下 Shuffle 稳定性和性能困扰，为智能风控等业务提供了强有力的技术支撑。

阿里云大数据

762 15 15

天下无贼001

机器学习/深度学习人工智能算法

探索机器学习：从线性回归到深度学习

本文将带领读者从基础的线性回归模型开始，逐步深入到复杂的深度学习网络。我们将通过代码示例，展示如何实现这些算法，并解释其背后的数学原理。无论你是初学者还是有经验的开发者，这篇文章都将为你提供有价值的见解和知识。让我们一起踏上这段激动人心的旅程吧！

天下无贼001

326 3 3

阿里云Clouder认证师

机器学习/深度学习人工智能算法

机器学习与深度学习：差异解析

机器学习与深度学习作为两大核心技术，各自拥有独特的魅力和应用价值。尽管它们紧密相连，但两者之间存在着显著的区别。本文将从定义、技术、数据需求、应用领域、模型复杂度以及计算资源等多个维度，对机器学习与深度学习进行深入对比，帮助您更好地理解它们之间的差异。

阿里云Clouder认证师

896 0 0

Echo_Wish

机器学习/深度学习运维安全

深度学习在安全事件检测中的应用：守护数字世界的利器

Echo_Wish

584 22 22

强了一点

机器学习/深度学习编解码人工智能

计算机视觉五大技术——深度学习在图像处理中的应用

深度学习利用多层神经网络实现人工智能，计算机视觉是其重要应用之一。图像分类通过卷积神经网络（CNN）判断图片类别，如“猫”或“狗”。目标检测不仅识别物体，还确定其位置，R-CNN系列模型逐步优化检测速度与精度。语义分割对图像每个像素分类，FCN开创像素级分类范式，DeepLab等进一步提升细节表现。实例分割结合目标检测与语义分割，Mask R-CNN实现精准实例区分。关键点检测用于人体姿态估计、人脸特征识别等，OpenPose和HRNet等技术推动该领域发展。这些方法在效率与准确性上不断进步，广泛应用于实际场景。

强了一点

1571 64 65

Echo_Wish

机器学习/深度学习传感器数据采集

深度学习在故障检测中的应用：从理论到实践

Echo_Wish

1386 6 6

Echo_Wish

机器学习/深度学习人工智能运维

深度学习在流量监控中的革命性应用

Echo_Wish

520 40 40

奔跑的数据

机器学习/深度学习数据采集存储

深度学习在DOM解析中的应用：自动识别页面关键内容区块

本文探讨了如何通过深度学习模型优化东方财富吧财经新闻爬虫的性能。针对网络请求、DOM解析与模型推理等瓶颈，采用代理复用、批量推理、多线程并发及模型量化等策略，将单页耗时从5秒优化至2秒，提升60%以上。代码示例涵盖代理配置、TFLite模型加载、批量预测及多线程抓取，确保高效稳定运行，为大规模数据采集提供参考。

奔跑的数据

461 0 0

【Spark Summit East 2017】使用机器学习注释器和大规模深度学习本体进行语义自然语言理解

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

【Spark Summit East 2017】使用机器学习注释器和大规模深度学习本体进行语义自然语言理解

热门文章

最新文章

相关课程

相关电子书

相关实验场景