异构计算

首页 标签 异构计算
# 异构计算 #
关注
19771内容
拍立淘---试妆魔镜 OpenGL ES 2.0 框架及性能优化
手机淘宝(搜索框->摄像头->试妆魔镜): 最初的设计原型及性能问题: 单线程模型,优先级过低:从Camera获取到CMSampleBufferRef YUV图像帧,拷贝像素数据到内存(多了一次拷贝内存的开销)进行美妆渲染以及一些其他的检测计算,导致的render线程性能消耗过多,CPU负
何为真正的 FaaS ?阿里舜天平台做了四大创新
数据中心和云计算的超高增速,AI、视频、基因测序等应用对于算力的无尽渴求和摩尔定律发展事实上已经停滞的现实,均给异构加速带来了巨大的应用潜力和商机。
用GPU进行TensorFlow计算加速
小编说:将深度学习应用到实际问题中,一个非常大的问题在于训练深度学习模型需要的计算量太大。为了加速训练过程,本文将介绍如何如何在TensorFlow中使用单个GPU进行计算加速,也将介绍生成TensorFlow会话(tf.Session)时的一些常用参数。
弹性计算双周刊 第3期
ECS主动运维2.0,体验升级,事半功倍;ECS已过期实例续费变配功能上线;Clear Linux镜像在云市场发布;ESS控制台发布新功能:伸缩实例支持standby的操作;干货视频分享,可在线下载。
人工智能PK金牌速记员之实战录
引言 在2016年3月23日阿里云年会上,2000余名同学们见证了一场人机大战的好戏--阿里云iDST团队的实时语音识别系统在现场演讲分享环节实时挑战世界速记比赛亚军, 马总御用金牌速录师姜毅先生。这位神一般的速录师, 拥有超人的短时记忆功能, 超级的打字速度和惊人的正确率.要PK这样的对
浅析GPU通信技术(中)-NVLink
1.  背景 上一篇文章《浅析GPU通信技术(上)-GPUDirect P2P》中我们提到通过GPUDirect P2P技术可以大大提升GPU服务器单机的GPU通信性能,但是受限于PCI Expresss总线协议以及拓扑结构的一些限制,无法做到更高的带宽,为了解决这个问题,NVIDIA提出了NVLink总线协议。
弹性计算双周刊 第 5 期
阿里云弹性裸金属服务器(神龙)于2018年5月16日在北京举行产品发布会,再度引起行业关注热潮,技术专家狒哥作为嘉宾和大家作了精彩的分享。FPGA-F3的经典使用场景及极大简化FPGA开发部署流程的深度解析爆出干货,专有宿主机(Dedicated Host)开放测试名额申请,这是一个基于阿里云公共云虚拟化技术对ECS的另一种产品售卖形态,通过向用户出售整体物理主机的资源,提供物理独享的单租户环境。
| |
来自: 云原生
开源工具GPU Sharing:支持Kubernetes集群细粒度
问题背景 全球主要的容器集群服务厂商的Kubernetes服务都提供了Nvidia GPU容器调度能力,但是通常都是将一个GPU卡分配给一个容器。这可以实现比较好的隔离性,确保使用GPU的应用不会被其他应用影响;对于深度学习模型训练的场景非常适合,但是如果对于模型开发和模型预测的场景就会比较浪费。
阿里云智能技术战略架构师陈绪:透视2019云计算酣战
精彩观点:通过开放API管理混合云会更受大客户欢迎,客户倾向于用云存储灾备技术保障数据可靠性,Kubernetes和Kata Containers会成为业界主流,中国出现第一家真正全面云化的大型公司,云端GPU计算在业务中应用的广度和深度将成为未来十年衡量企业竞争力的新标尺等。
读光OCR-文字识别技术解读与应用案例分析
大数据上云特惠活动系列直播,阿里巴巴高级算法专家永攀对读光OCR-文字识别技术和行业应用进行讲述。OCR的本质是识别图片中的文字,即在复杂的图片背景下中对所需目标文字进行识别提取。主要从OCR商业应用场景、OCR算法和读光产品进行了介绍。展示读光OCR在在文字识别中强大的应用。
免费试用