|
SQL Web App开发 流计算
|

Flink入坑指南第五章 - 语法糖 view

Flink入坑指南系列文章,从实际例子入手,一步步引导用户零基础入门实时计算/Flink,并成长为使用Flink的高阶用户。本文属个人原创,仅做技术交流之用,笔者才疏学浅,如有错误,欢迎指正。 什么是view(视图):视图无非就是存储在数据库中并具有名字的 SQL 语句,或者说是以预定义的 SQL 查询的形式存在的数据表的成分。

4217 1
来自: 实时计算 Flink  版块
|
运维 监控 安全
|

【ELK入门】Elastic中文社区运维监控实战之架构篇

阿里云MVP曾勇撰写的《ELK运维监控入门实战》系列,以Elasticsearch中文社区网站运维监控体系搭建作为案例,讲解了ELK监控系统的相关原理和技术实现,可作为对ELK感兴趣的同学的入门级文章。本篇作为第一篇,介绍了项目背景和技术架构。

6841 0
|
8天前
|
监控 搜索推荐 数据挖掘
|

淘宝店铺所有商品API说明

淘宝店铺商品API支持通过店铺ID获取商品详情,涵盖ID、标题、价格、销量等信息,具备分页与多维度排序功能,数据实时更新。适用于数据分析、竞品监控、第三方应用开发及商家管理,助力电商生态高效运作,提升运营效率与开发灵活性。

55 3
|
9天前
|
数据采集 JSON 搜索推荐
|

淘宝商品评论的情感分析实战:API数据驱动用户洞察

淘宝商品评论API是淘宝开放平台提供的数据接口,支持通过Python高效获取商品的用户评价信息。可返回结构化数据,包含评论内容、评分、时间、图片及商家回复等,支持多维度筛选与分页,适用于竞品分析、用户画像与市场研究。

88 1
|
10天前
|
机器学习/深度学习 算法 搜索推荐
|

京东图片识别搜索API,搜索相似商品用于多模态数据训练

京东图片识别搜索API(拍立淘)基于深度学习,通过CNN提取图像特征,结合近似最近邻算法实现以图搜图。支持图片URL/Base64输入,返回结构化商品信息,具备多维度筛选与智能排序功能,提升视觉购物体验。(238字)

55 1
|
30天前
|
分布式计算 Kubernetes 调度
|

Kubeflow-Spark-Operator-架构学习指南

本指南系统解析 Spark Operator 架构,涵盖 Kubebuilder 开发、控制器设计与云原生集成。通过四阶段学习路径,助你从部署到贡献,掌握 Kubernetes Operator 核心原理与实战技能。

97 0
|
2月前
|
安全 物联网 数据处理
|

去中心化不只是区块链:智能设备的“分布式大脑”

去中心化不只是区块链:智能设备的“分布式大脑”

251 2
|
2月前
|
存储 JSON 数据处理
|

Flink基于Paimon的实时湖仓解决方案的演进

本文源自Apache CommunityOverCode Asia 2025,阿里云专家苏轩楠分享Flink与Paimon构建实时湖仓的演进实践。深度解析Variant数据类型、Lookup Join优化等关键技术,提升半结构化数据处理效率与系统可扩展性,推动实时湖仓在生产环境的高效落地。

271 0
来自: 实时计算 Flink  版块
|
2月前
|
JSON 监控 API
|

速卖通商品列表API秘籍!轻松获取商品列表数据

速卖通商品列表API支持关键词搜索、分类筛选、多语言返回及分页排序功能,适用于比价系统、库存监控、市场研究等场景。开发者可快速获取商品数据,构建自动化应用。

105 4
|
4月前
|
安全 Java 网络安全
|

Java 实现 SMTP 协议调用的详细示例及实战指南 SMTP Java 调用示例

本文介绍了如何使用Java调用SMTP协议发送邮件,涵盖SMTP基本概念、JavaMail API配置、代码实现及注意事项,适合Java开发者快速掌握邮件发送功能集成。

374 0
|
4月前
|
机器学习/深度学习 数据采集 算法
|

贝叶斯状态空间神经网络:融合概率推理和状态空间实现高精度预测和可解释性

本文将BSSNN扩展至反向推理任务,即预测X∣y,这种设计使得模型不仅能够预测结果,还能够探索特定结果对应的输入特征组合。在二元分类任务中,这种反向推理能力有助于识别导致正负类结果的关键因素,从而显著提升模型的可解释性和决策支持能力。

349 42
|
4月前
|
API
|

1688图片搜索API详解

1688图片搜索接口通过上传图片实现相似商品匹配,适用于电商比价、商品溯源。支持按图搜同款或相似商品,返回商品ID、标题、价格等信息,并可设置分页、排序与筛选参数。核心参数包括图片URL/Base64(imgid)、搜索模式(search_type)及排序方式(sort_type)。

304 3
|
5月前
|
机器学习/深度学习 移动开发 供应链
|

基于时间图神经网络多的产品需求预测:跨序列依赖性建模实战指南

本文展示了如何通过学习稀疏影响图、应用图卷积融合邻居节点信息,并结合时间卷积捕获演化模式的完整技术路径,深入分析每个步骤的机制原理和数学基础。

179 1
|
6月前
|
机器学习/深度学习 数据采集 算法
|

智能限速算法:基于强化学习的动态请求间隔控制

本文分享了通过强化学习解决抖音爬虫限速问题的技术实践。针对固定速率请求易被封禁的问题,引入基于DQN的动态请求间隔控制算法,智能调整请求间隔以平衡效率与稳定性。文中详细描述了真实经历、问题分析、技术突破及代码实现,包括代理配置、状态设计与奖励机制,并反思成长,提出未来优化方向。此方法具通用性,适用于多种动态节奏控制场景。

202 6
|
6月前
|
机器学习/深度学习 算法 搜索推荐
|

数据不忽悠:如何用大数据预测未来?

数据不忽悠:如何用大数据预测未来?

303 12
|
7月前
|
文字识别 算法 小程序
|

【项目总结】快瞳医疗化验单的OCR识别

快瞳科技通过图像识别技术,成功解决了医疗化验单OCR识别难题。项目要求精准识别表格内容,尤其是化验数值和名称,准确率达85%以上。针对化验单来源多样、干扰因素多的问题,团队采用智能文档抽取模型、opencv技术(如霍夫变换)进行图片扶正与裁剪,优化识别精度。最终,项目不仅达到药企要求,还实现超越,为医疗行业智能化转型提供了高性价比解决方案,助力快瞳科技在医疗信息化领域树立良好口碑。

373 43
|
7月前
|
机器学习/深度学习 数据可视化 机器人
|

比扩散策略更高效的生成模型:流匹配的理论基础与Pytorch代码实现

扩散模型和流匹配是生成高分辨率数据(如图像和机器人轨迹)的先进技术。扩散模型通过逐步去噪生成数据,其代表应用Stable Diffusion已扩展至机器人学领域形成“扩散策略”。流匹配作为更通用的方法,通过学习时间依赖的速度场将噪声转化为目标分布,适用于图像生成和机器人轨迹生成,且通常以较少资源实现更快生成。 本文深入解析流匹配在图像生成中的应用,核心思想是将图像视为随机变量的实现,并通过速度场将源分布转换为目标分布。文中提供了一维模型训练实例,展示了如何用神经网络学习速度场,以及使用最大均值差异(MMD)改进训练效果。与扩散模型相比,流匹配结构简单,资源需求低,适合多模态分布生成。

452 13
|
7月前
|
缓存 前端开发 API
|

开发体育比分网站有哪些坑需要注意

开发体育比分网站需克服多方面挑战:数据来源上避免侵权,选用合法API;实时性上采用WebSocket等技术确保秒级更新;优化用户体验,极简设计配合实时动画;技术架构中使用缓存与微服务应对高并发;SEO方面通过SSR和服务端结构化数据提升搜索流量。示例代码展示了比赛数据的基本处理逻辑,包括设置比赛ID、状态、赢家信息及计划标记等功能。

210 62
|
8月前
|
供应链 搜索推荐 API
|

一文读懂:京东、淘宝、拼多多 API 接口,功能大不同,场景各有招

本文深入解析京东、淘宝、拼多多三大电商巨头的API接口特点与差异。京东API以商品管理、订单处理和物流跟踪见长,适合电商平台及零售商;淘宝API功能丰富,涵盖商品查询、订单管理与用户认证,适用多场景电商业务;拼多多API聚焦社交电商,提供拼团、砍价等特色玩法,助力商家提升曝光与销量。开发者和商家需根据自身需求选择合适的API接口,并关注其安全性与稳定性。随着技术进步,这些API将持续优化,推动电商行业蓬勃发展。

905 4
|
8月前
|
传感器 人工智能 物联网
|

穿戴科技新风尚:智能服装设计与技术全解析

穿戴科技新风尚:智能服装设计与技术全解析

650 85
|
8月前
|
机器学习/深度学习 人工智能 搜索推荐
|

技术革新下的培训新趋势:案例解析

从最初的“试试看”,到如今的“非做不可”,企业培训已经成为央国企和上市公司不可或缺的战略环节。无论是AI与大模型的赋能,DeepSeek,还是具身智能、智算技术和数据科学的实战应用,这些课程都在为企业打开新的可能性。

358 2
|
8月前
|
存储 监控 数据挖掘
|

淘宝店铺所有商品数据接口全攻略

淘宝开放平台提供`taobao.items.onsale.get`接口,可批量获取店铺在售商品列表,包括商品ID、标题、价格等信息,适用于商品管理、竞品监控等场景。调用流程:注册账号、创建应用、申请权限。核心参数有nick、page_no、page_size等。Python示例代码展示如何通过API获取商品数据,并处理分页和异常。注意事项包括权限申请、频率限制及数据安全。扩展应用如结合商品详情接口进行数据分析。

619 3
|
9月前
|
机器学习/深度学习 搜索推荐 异构计算
|

LLM模型添加自定义Token代码示例:为Llama 3.2模型添加思考与回答标记

本文将介绍如何为大型语言模型(LLM)添加自定义token并进行训练,使模型能够有效地利用这些新增token。以Llama 3.2模型为基础,实现了类似DeepSeek R1中think和answer标记功能的扩展方法,通过监督微调使模型学习使用这些标记进行推理过程与答案输出的区分

537 0
|
9月前
|
机器学习/深度学习 人工智能 缓存
|

云上玩转DeepSeek系列之五:实测优化16%, 体验FlashMLA加速DeepSeek-V2-Lite推理

DeepSeek-AI 开源的 FlashMLA 是一个优化多层注意力机制的解码内核,显著提升大语言模型的长序列处理和推理效率。本文介绍了如何在 PAI 平台上安装并使用 FlashMLA 部署 DeepSeek-V2-Lite-Chat 模型。通过优化后的 FlashMLA,实现了约 16% 的性能提升。

713 10
来自: 人工智能平台PAI  版块
|
9月前
|
SQL 数据可视化 atlas
|

低空经济新基建!DataV Atlas 如何用大模型玩转空间数据?

阿里云DataV Atlas推出搭载通义千问最新2.5 Max大模型「时空SQL智能小助手」,通过自然语言生成专业SQL,简化空间数据分析流程,助力智慧农田、城市低空交通及应急调度等领域,推动精准决策和智能化管理。零门槛体验空间智能分析革命,开启“会思考的天空网络”新时代。

604 4
来自: 数据可视化DataV  版块
|
9月前
|
人工智能 自然语言处理 监控
|

大语言模型的解码策略与关键优化总结

本文系统性地阐述了大型语言模型(LLMs)中的解码策略技术原理及其应用。通过深入分析贪婪解码、束搜索、采样技术等核心方法,以及温度参数、惩罚机制等优化手段,为研究者和工程师提供了全面的技术参考。文章详细探讨了不同解码算法的工作机制、性能特征和优化方法,强调了解码策略在生成高质量、连贯且多样化文本中的关键作用。实例展示了各类解码策略的应用效果,帮助读者理解其优缺点及适用场景。

866 20
|
9月前
|
编解码 缓存 Prometheus
|

「ximagine」业余爱好者的非专业显示器测试流程规范,同时也是本账号输出内容的数据来源!如何测试显示器?荒岛整理总结出多种测试方法和注意事项,以及粗浅的原理解析!

本期内容为「ximagine」频道《显示器测试流程》的规范及标准,我们主要使用Calman、DisplayCAL、i1Profiler等软件及CA410、Spyder X、i1Pro 2等设备,是我们目前制作内容数据的重要来源,我们深知所做的仍是比较表面的活儿,和工程师、科研人员相比有着不小的差距,测试并不复杂,但是相当繁琐,收集整理测试无不花费大量时间精力,内容不完善或者有错误的地方,希望大佬指出我们好改进!

577 16
|
9月前
|
人工智能 自然语言处理 搜索推荐
|

现在最火的AI是怎么应用到体育行业的

AI在体育行业的应用日益广泛,涵盖数据分析、伤病预防、观众体验、裁判辅助等多个领域。通过传感器和可穿戴设备,AI分析运动员表现,提供个性化训练建议;预测伤病风险,制定康复方案;优化比赛预测和博彩指数;提升观众的个性化内容推荐和沉浸式观赛体验;辅助裁判判罚,提高准确性;发掘青训人才,优化训练计划;智能管理场馆运营和票务;自动生成媒体内容,提供实时翻译;支持电竞分析和虚拟体育赛事;并为运动员提供个性化营养和健康管理方案。未来,随着技术进步,AI的应用将更加深入和多样化。

704 3
|
10月前
|
缓存 监控 数据处理
|

Flink 四大基石之窗口(Window)使用详解

在流处理场景中,窗口(Window)用于将无限数据流切分成有限大小的“块”,以便进行计算。Flink 提供了多种窗口类型,如时间窗口(滚动、滑动、会话)和计数窗口,通过窗口大小、滑动步长和偏移量等属性控制数据切分。窗口函数包括增量聚合函数、全窗口函数和ProcessWindowFunction,支持灵活的数据处理。应用案例展示了如何使用窗口进行实时流量统计和电商销售分析。

1916 28
来自: 实时计算 Flink  版块
|
10月前
|
人工智能 搜索推荐 算法
|

解决方案评测|主动式智能导购AI助手构建

阿里云的主动式智能导购AI助手是电商商家提升用户体验和销量的利器。它能实时分析用户行为,提供个性化推荐,支持多渠道无缝对接,并具备语音和文本交互功能。通过注册阿里云账号、开通服务、配置项目、设置推荐策略、集成到平台并测试优化,商家可以轻松部署这一工具。关键代码示例帮助理解API对接和数据处理。建议增强个性化推荐算法、优化交互体验并增加自定义选项,以进一步提升效果。

651 11
|
11月前
|
人工智能 自然语言处理 搜索推荐
|

智能语音助手的发展与未来:开启人机交互的新篇章

智能语音助手的发展与未来:开启人机交互的新篇章

1724 28
|
11月前
|
数据挖掘 Python
|

时间序列分析中的互相关与相干性分析:前导-滞后关系的理论基础与实际应用

时间序列数据在现代数据分析中广泛应用,从金融市场到生物医学领域。本文重点介绍两种分析工具:互相关和相干性分析。互相关用于量化两个时间序列的时域关系,揭示前导-滞后关系;相干性分析则评估信号在频率域的相关性,适用于脑电图等研究。通过实际案例和Python代码示例,展示了这两种方法的应用价值。

1092 8
|
11月前
|
安全 API 数据安全/隐私保护
|

淘宝店铺所有商品数据接口(Taobao.item_search_shop)

淘宝开放平台提供的 `Taobao.item_search_shop` 接口用于获取指定淘宝店铺的所有商品数据。请求参数包括 `seller_id`(必需)、`page`(可选,默认为1)和 `sort`(可选,排序方式如新品、价格、销量)。响应参数包括商品的唯一标识符、主图URL、标题、价格、销量等。使用步骤包括注册账号、创建应用、获取权限、构建请求、分页获取商品列表和获取商品详细信息。注意遵守调用频率限制和相关法律法规。

407 5
|
机器学习/深度学习 算法 安全
|

大模型进阶微调篇(二):基于人类反馈的强化学习RLHF原理、优点介绍,但需要警惕LLMs的拍马屁行为

本文探讨了基于人类反馈的强化学习(RLHF)方法的优缺点。作者指出,虽然RLHF能够使模型更好地满足用户需求,但也存在缺乏多样性、创新不足、偏好固化和难以适应动态变化等问题。文章通过具体实验和示例代码,详细解析了RLHF的工作原理,并强调了其在实际应用中的潜在风险。

1016 6
来自: 人工智能平台PAI  版块
|
移动开发 数据可视化 Python
|

【10月更文挑战第13天】「Mac上学Python 24」小学奥数篇10 - 数列求和

本篇将通过 Python 和 Cangjie 双语实现数列求和的计算。通过这个题目,学生将学会如何通过公式法和循环法求解等差数列与等比数列的和。

371 3
|
供应链 安全 API
|

常见的京东商品接口类型

京东商品接口是京东开放平台提供的一系列API,支持商品详情查询、商品搜索、评价查询、库存管理和订单处理等功能。开发者需注册获取API密钥,并按文档要求构造请求。这些接口助力开发者构建丰富的电商应用,提升用户体验。使用时需遵守平台规定,确保数据安全。

311 0
|
机器学习/深度学习 数据采集 供应链
|

Python实现深度学习模型:智能库存管理系统

【10月更文挑战第5天】 Python实现深度学习模型:智能库存管理系统

915 9
|
存储 自然语言处理 文字识别
|

纯前端RAG:使用Transformers.js实现纯网页版RAG(一)

本文将分两部分教大家如何在网页中实现一个RAG系统,本文聚焦于深度搜索功能。通过浏览器端本地执行模型,可实现文本相似度计算和问答匹配,无需依赖服务器。RAG搜索基于高维向量空间,即使不完全匹配也能找到意义相近的结果。文中详细介绍了如何构建知识库、初始化配置、向量存储及相似度计算,并展示了实际应用效果。适用于列表搜索、功能导航、文档查询及表单填写等多种场景。

1435 0
|
机器学习/深度学习 算法 机器人
|

多代理强化学习综述:原理、算法与挑战

多代理强化学习是强化学习的一个子领域,专注于研究在共享环境中共存的多个学习代理的行为。每个代理都受其个体奖励驱动,采取行动以推进自身利益;在某些环境中,这些利益可能与其他代理的利益相冲突,从而产生复杂的群体动态。

771 5
|
数据采集 人工智能 监控
|

揭秘数据治理:七步工作法&十大准则全解析

数据治理的“七步工作法”与“十大准则”为企业构建科学、系统、高效的数据治理体系提供了重要的指导和借鉴。企业应结合自身实际情况,灵活运用这些方法和准则,充分挖掘数据潜能,赋能业务创新,实现数字化转型的稳健推进。

1179 0
|
分布式计算 大数据 Serverless
|

云栖实录 | 开源大数据全面升级:Native 核心引擎、Serverless 化、湖仓架构引领云上大数据发展

在2024云栖大会开源大数据专场上,阿里云宣布推出实时计算Flink产品的新一代向量化流计算引擎Flash,该引擎100%兼容Apache Flink标准,性能提升5-10倍,助力企业降本增效。此外,EMR Serverless Spark产品启动商业化,提供全托管Serverless服务,性能提升300%,并支持弹性伸缩与按量付费。七猫免费小说也分享了其在云上数据仓库治理的成功实践。其次 Flink Forward Asia 2024 将于11月在上海举行,欢迎报名参加。

673 6
来自: 实时计算 Flink  版块
|
存储 JSON 搜索推荐
|

“我在云栖大会等你”—来PAI Artlab定格你的云栖记忆!

在云栖大会上,通过PAI Artlab的ComfyUI,轻松生成个性化数字影像。只需几个简单步骤,即可将你的肖像融入大会经典场景,创造独特回忆。快来加入我们,让PAI Artlab为你的云栖之行增添一抹亮色!

412 17
来自: 人工智能平台PAI  版块
|
数据采集 Web App开发 JavaScript
|

Puppeteer的高级用法:如何在Node.js中实现复杂的Web Scraping

随着互联网的发展,网页数据抓取已成为数据分析和市场调研的关键手段。Puppeteer是一款由Google开发的无头浏览器工具,可在Node.js环境中模拟用户行为,高效抓取网页数据。本文将介绍如何利用Puppeteer的高级功能,通过设置代理IP、User-Agent和Cookies等技术,实现复杂的Web Scraping任务,并提供示例代码,展示如何使用亿牛云的爬虫代理来提高爬虫的成功率。通过合理配置这些参数,开发者可以有效规避目标网站的反爬机制,提升数据抓取效率。

965 4
|
存储 边缘计算 人工智能
|

云上物联网:连接万物,驱动智能未来

标准化与互操作性:随着物联网设备的不断增多和应用场景的日益广泛,标准化和互操作性将成为云上物联网发展的重要趋势。通过制定统一的标准和规范,实现不同品牌、不同型号物联网设备之间的互联互通和互操作,将大大提升云上物联网的灵活性和可扩展性。 边缘计算与云端协同:未来的云上物联网将更加注重

416 7
|
监控 安全 网络安全
|

装机安全设置全攻略:打造坚不可摧的系统防线

装机安全设置是一个涉及多个方面的复杂过程,需要我们在操作系统选择、硬件配置、软件安装、网络安全、数据备份以及物理安全等多个层面进行综合考虑和实施。通过本文的介绍,我们希望能够帮助您构建一个更加安全、稳定的系统环境,保护您的数据和隐私免受威胁。记住,安全是一个持续的过程,需要定期审查和更新您的安全设置和实践,以适应不断变化的威胁环境。

343 1
|
存储 监控 数据挖掘
|

ERP系统中的客户满意度调查与反馈处理解析

【7月更文挑战第25天】 ERP系统中的客户满意度调查与反馈处理解析

1057 0
|
机器学习/深度学习 人工智能 自动驾驶
|

实战案例分析:AI在特定行业的深度应用

【7月更文第20天】随着人工智能技术的飞速发展,其在各行各业的应用日益广泛且深入,不仅推动了产业创新,也极大地提升了服务效率与质量。本文将聚焦于金融、教育、和交通三大领域,通过具体案例与技术解析,展现AI如何在这三个行业中发挥着革命性的作用。

2098 0
|
数据采集 JSON JavaScript
|

JS逆向-反反爬案例

破解爬虫JS加密反爬, 逆向JS解析

462 0
|
自然语言处理 算法 搜索推荐
|

字符串相似度算法完全指南:编辑、令牌与序列三类算法的全面解析与深入分析

在自然语言处理领域,人们经常需要比较字符串,这些字符串可能是单词、句子、段落甚至是整个文档。如何快速判断两个单词或句子是否相似,或者相似度是好还是差。这类似于我们使用手机打错一个词,但手机会建议正确的词来修正它,那么这种如何判断字符串相似度呢?本文将详细介绍这个问题。

829 1

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
67384
内容
127
活动
439366
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 日志服务
  • 检索分析服务 Elasticsearch版