|
10月前
|
算法 API 开发者
|

跨境卖家必看:1688商品列表页面数据接口抓取攻略

1688平台提供商品列表数据接口(1688.item_search),支持通过关键词搜索商品,返回商品ID、标题、价格、销量、图片等信息。参数包括关键词q、页码page、每页数量page_size等。开发者需注意签名机制与调用频率限制,确保稳定获取数据。

559 5
|
10月前
|
机器学习/深度学习 移动开发 供应链
|

基于时间图神经网络多的产品需求预测:跨序列依赖性建模实战指南

本文展示了如何通过学习稀疏影响图、应用图卷积融合邻居节点信息,并结合时间卷积捕获演化模式的完整技术路径,深入分析每个步骤的机制原理和数学基础。

351 1
|
10月前
|
算法 自动驾驶 机器人
|

基于Astar的复杂栅格地图路线规划算法matlab仿真

本项目基于A*算法实现复杂栅格地图的路径规划,适用于机器人导航、自动驾驶及游戏开发等领域。通过离散化现实环境为栅格地图,每个栅格表示空间区域属性(如可通行性)。A*算法利用启发函数评估节点,高效搜索从起点到终点的近似最优路径。项目在MATLAB2022a中运行,核心程序包含路径回溯与地图绘制功能,支持障碍物建模和路径可视化。理论结合实践,该方法具有重要应用价值,并可通过技术优化进一步提升性能。

325 0
|
10月前
|
机器学习/深度学习 数据可视化 算法
|

数据分布不明确?5个方法识别数据分布,快速找到数据的真实规律

本文深入探讨了数据科学中分布识别的重要性及其实践方法。作为数据分析的基础环节,分布识别影响后续模型性能与分析可靠性。文章从直方图的可视化入手,介绍如何通过Python代码实现分布特征的初步观察,并系统化地讲解参数估计、统计检验及distfit库的应用。同时,针对离散数据、非参数方法和Bootstrap验证等专题展开讨论,强调业务逻辑与统计结果结合的重要性。最后指出,正确识别分布有助于异常检测、数据生成及预测分析等领域,为决策提供可靠依据。作者倡导在实践中平衡模型复杂度与实用性,重视对数据本质的理解。

759 3
|
10月前
|
消息中间件 缓存 小程序
|

婚恋交友相亲公众号app小程序系统源码「脱单神器」婚恋平台全套代码 - 支持快速二次开发

这是一套基于SpringBoot + Vue3开发的婚恋交友系统,支持微信公众号、Uniapp小程序和APP端。系统包含实名认证、智能匹配、视频相亲、会员体系等功能,适用于婚恋社交平台和相亲交友应用。后端采用SpringBoot 3.x与MyBatis-Plus,前端使用Vue3与Uniapp,支持快速部署和二次开发。适合技术团队或有经验的个人创业者使用。

668 8
|
10月前
|
数据采集 存储 Web App开发
|

Python爬虫技巧:设置Cookie永不超时的详细指南

Python爬虫技巧:设置Cookie永不超时的详细指南

528 1
|
10月前
|
数据采集 算法 数据可视化
|

DROPP算法详解:专为时间序列和空间数据优化的PCA降维方案

DROPP(Dimensionality Reduction for Ordered Points via PCA)是一种专为有序数据设计的降维方法,通过结合协方差分析与高斯核函数调整,有效融入数据顺序特性。本文详细解析了DROPP的理论基础、实现步骤及其应用。算法核心在于利用相邻元素间的相似性特征,关注局部邻域信息以降低噪声影响,适用于时间序列或空间序列数据。文中通过模拟数据示例展示了算法的具体实现过程,并总结了其在气候研究和分子动力学等领域的广泛应用潜力。

298 0
|
10月前
|
机器学习/深度学习 人工智能 算法
|

学会线性回归,告别买房踩坑,轻松实现资产增值

想知道AI如何预测房价吗?本文通过一个完整的房价预测案例,生动展示线性回归的全过程。从数据收集到模型部署,让你轻松掌握这个经典算法的实战应用!

176 0
|
10月前
|
Java 数据库连接 API
|

互联网大厂校招 JAVA 工程师笔试题解析及常见考点分析

本文深入解析互联网大厂校招Java工程师笔试题,涵盖基础知识(数据类型、流程控制)、面向对象编程(类与对象、继承与多态)、数据结构与算法(数组、链表、排序算法)、异常处理、集合框架、Java 8+新特性(Lambda表达式、Stream API)、多线程与并发、IO与NIO、数据库操作(JDBC、ORM框架MyBatis)及Spring框架基础(IoC、DI、AOP)。通过技术方案讲解与实例演示,助你掌握核心考点,提升解题能力。

377 2
|
11月前
|
边缘计算 人工智能 JavaScript
|

如何选择正确的体育电竞数据接口服务商?

想开发体育或电竞App却因数据接口问题头疼?数据延迟、更新慢、覆盖不全?本文教你挑选可靠的数据接口服务商,关注核心指标:实时性(<0.5秒延迟)、准确性(错误率<0.1%)、稳定性(99.99% SLA)。避坑指南助你远离劣质服务,优质接口应具备全链路解决方案、电竞专属优化及7x24技术支持。选对服务商,让数据为你的App赋能!

242 0
|
11月前
|
机器学习/深度学习 算法 测试技术
|

图神经网络在信息检索重排序中的应用:原理、架构与Python代码解析

本文探讨了基于图的重排序方法在信息检索领域的应用与前景。传统两阶段检索架构中,初始检索速度快但结果可能含噪声,重排序阶段通过强大语言模型提升精度,但仍面临复杂需求挑战

366 0
|
11月前
|
存储 安全 Android开发
|

HarmonyOS实战:一招搞定保存图片到相册

本文介绍了在鸿蒙系统中实现保存图片到相册的功能,包括申请权限和使用系统安全控件两种方式。文中详细讲解了如何通过网络请求下载图片并保存为本地文件,以及如何将指定布局生成图片并保存。鸿蒙系统对权限管理较为严格,推荐使用系统提供的安全控件(如 SaveButton)以保护用户隐私,避免手动申请权限。此外,文章还对比了鸿蒙与 Android/iOS 的实现差异,指出鸿蒙在功能实现上更简单,但需注意权限规范以确保项目顺利上线。

1258 0
|
11月前
|
人工智能 搜索推荐 定位技术
|

让兵马俑“活”过来——增强现实正在悄悄改变我们的旅游体验

让兵马俑“活”过来——增强现实正在悄悄改变我们的旅游体验

390 11
|
11月前
|
供应链 API 开发者
|

1688 商品数据接口终极指南:Python 开发者如何高效获取标题 / 价格 / 销量数据(附调试工具推荐)

1688商品列表API是阿里巴巴开放平台提供的服务,允许开发者通过API获取1688平台的商品信息(标题、价格、销量等)。适用于电商选品、比价工具、供应链管理等场景。使用时需构造请求URL,携带参数(如q、start_price、end_price等),发送HTTP请求并解析返回的JSON/XML数据。示例代码展示了如何用Python调用该API获取商品列表。

525 18
11月前
|
大数据
|

查询加速 MaxQA 功能解读及使用演示

为满足现代数据分析和业务应用中对低延迟的需求,阿里云推出 MaxQA 查询加速功能,显著减少查询响应时间,适用于&nbsp;BI 场景、交互式分析以及近实时数仓等对延迟要求高且稳定的场景。​ ​ 本视频为大家介绍MaxQA在性能、稳定性及使用成本上的核心优势以及相较于MCQA1.0的能力升级,还有产品专家实操演示教学。 公测期间可申请100CU(价值15000元)计算资源用于测试(加入钉群申领:87535025714)

467 0
来自: 大数据计算 MaxCompute  版块
|
11月前
|
数据采集 Web App开发 前端开发
|

Python+Selenium爬虫:豆瓣登录反反爬策略解析

Python+Selenium爬虫:豆瓣登录反反爬策略解析

630 6
|
11月前
|
JSON 监控 API
|

深度解析淘宝天猫店铺所有商品API接口,一文带你吃透

本文介绍如何通过淘宝开放平台的API获取店铺所有商品信息,适用于电商数据分析、竞品监控等场景。核心接口为`tb.items.onsale.get`(出售中商品)和`tb.items.inventory.get`(库存商品列表)。接口采用HTTP POST请求,返回JSON格式数据,包含商品总数、列表及各商品的ID、标题、价格、图片URL等关键信息,并提供Python实现示例,助力开发者高效获取与处理数据。

413 3
|
11月前
|
人工智能 边缘计算 5G
|

5G时代,别让能耗成为“隐形杀手”——聊聊5G网络的能耗管理

5G时代,别让能耗成为“隐形杀手”——聊聊5G网络的能耗管理

650 13
|
11月前
|
资源调度 Kubernetes 调度
|

网易游戏 Flink 云原生实践

本文分享了网易游戏在Flink实时计算领域的资源管理与架构演进经验,从Yarn到K8s云原生,再到混合云的实践历程。文章详细解析了各阶段的技术挑战与解决方案,包括资源隔离、弹性伸缩、自动扩缩容及服务混部等关键能力的实现。通过混合云架构,网易游戏显著提升了资源利用率,降低了30%机器成本,小作业计算成本下降40%,并为未来性能优化、流批一体及智能运维奠定了基础。

624 9
来自: 实时计算 Flink  版块
|
11月前
|
人工智能 JSON 算法
|

【解决方案】DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践

DistilQwen 系列是阿里云人工智能平台 PAI 推出的蒸馏语言模型系列,包括 DistilQwen2、DistilQwen2.5、DistilQwen2.5-R1 等。本文详细介绍DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践。

483 7
来自: 人工智能平台PAI  版块
|
11月前
|
机器学习/深度学习 数据采集 安全
|

防止交叉验证中的数据泄露:提升模型在实际环境中的性能

本文探讨了机器学习模型从开发到部署过程中可能出现的性能断崖问题,重点分析了**数据泄露**和**类别不平衡**两大主要原因。数据泄露可能源于预处理、特征工程或目标变量的不当操作,导致模型在测试阶段表现优异但实际应用中失效。同时,类别不平衡会使得常规交叉验证结果不可靠,需采用分层K折等方法应对。文章还介绍了通过Scikit-learn的Pipeline和ColumnTransformer防止数据泄露的最佳实践,并强调重采样技术(如SMOTE)应在数据划分后执行。最后,总结了构建可靠模型评估流程的核心原则,包括使用管道、分层验证及独立保留集等,帮助开发者构建在真实场景中性能稳定的模型。

444 56
|
11月前
|
机器学习/深度学习 人工智能 算法
|

大数据与机器学习:数据驱动的智能时代

本文探讨了大数据与机器学习在数字化时代的融合及其深远影响。大数据作为“新时代的石油”,以其4V特性(体量、多样性、速度、真实性)为机器学习提供燃料,而机器学习通过监督、无监督、强化和深度学习等技术实现数据价值挖掘。两者协同效应显著,推动医疗、金融、零售、制造等行业创新。同时,文章分析了数据隐私、算法偏见、可解释性及能耗等挑战,并展望了边缘计算、联邦学习、AutoML等未来趋势。结语强调技术伦理与实际价值并重,倡导持续学习以把握智能时代机遇。

468 13
|
12月前
|
大数据
|

“你朋友圈的真面目,大数据都知道!”——用社交网络分析看透人情世故

“你朋友圈的真面目,大数据都知道!”——用社交网络分析看透人情世故

456 16
|
12月前
|
人工智能 自然语言处理 DataWorks
|

Qwen3 X DataWorks :为数据开发与分析加满Buff !

阿里云DataWorks平台正式接入Qwen3模型,支持最大235B参数量。用户可通过DataWorks Copilot智能助手调用该模型,以自然语言交互实现代码生成、优化、解释及纠错等功能,大幅提升数据开发与分析效率。Qwen3作为最新一代大语言模型,具备混合专家(MoE)和稠密(Dense)架构,适应多种应用场景,并支持MCP协议优化复杂任务处理。目前,用户可通过DataWorks Data Studio新版本体验此功能。

889 27
|
12月前
|
数据采集 人工智能 大数据
|

演讲实录:中小企业如何快速构建AI应用?

AI时代飞速发展,大模型和AI的应用创新不断涌现,面对百花齐放的AI模型,阿里云计算平台大数据AI解决方案总监魏博文分享如何通过阿里云提供的大数据AI一体化平台,解决企业开发难、部署繁、成本高等一系列问题,让中小企业快速搭建AI应用。

865 3
来自: 人工智能平台PAI  版块
|
12月前
|
存储 消息中间件 Kafka
|

中原银行实时场景企业级解决方案

中原银行实时数据开发平台负责人杜威科在Flink Forward Asia 2024分享了银行业实时数据处理的经验。内容涵盖需求分析、解决方案、场景案例与现状展望。银行业需构建全链路、全场景的企业级实时数据平台,解决动账场景下的复杂计算需求。通过Flink+Paimon方案,实现高效更新、低成本存储与便捷查询。案例包括账户表实时更新入湖、交易协同优化、实时图应用、海量数据存储及业务人员易用性建设。未来目标是实现上千张表实时入湖,缩短延迟并探索AI结合的新场景。

473 2
来自: 实时计算 Flink  版块
|
12月前
|
人工智能 自动驾驶 物联网
|

5G到底有多牛?一文看懂它的原理与优势!

5G到底有多牛?一文看懂它的原理与优势!

869 19
|
12月前
|
JSON 数据挖掘 API
|

深入研究:京东商品评论API详解

京东商品评论API助力电商数据分析与优化。通过该接口,开发者可获取商品评论内容、时间、评分等详细信息,以及好评率、差评率等统计数据。适用于用户体验分析、市场调研等场景。使用前需注册开发者账号、申请权限,并正确配置参数(如app_key、商品ID等)。返回数据为JSON格式,便于解析与应用。

558 10
|
12月前
|
数据采集 搜索推荐 API
|

Python 原生爬虫教程:京东商品列表页面数据API

京东商品列表API是电商大数据分析的重要工具,支持开发者、商家和研究人员获取京东平台商品数据。通过关键词搜索、分类筛选、价格区间等条件,可返回多维度商品信息(如名称、价格、销量等),适用于市场调研与推荐系统开发。本文介绍其功能并提供Python请求示例。接口采用HTTP GET/POST方式,支持分页、排序等功能,满足多样化数据需求。

648 5
|
12月前
|
数据采集 存储 监控
|

Python 原生爬虫教程:网络爬虫的基本概念和认知

网络爬虫是一种自动抓取互联网信息的程序,广泛应用于搜索引擎、数据采集、新闻聚合和价格监控等领域。其工作流程包括 URL 调度、HTTP 请求、页面下载、解析、数据存储及新 URL 发现。Python 因其丰富的库(如 requests、BeautifulSoup、Scrapy)和简洁语法成为爬虫开发的首选语言。然而,在使用爬虫时需注意法律与道德问题,例如遵守 robots.txt 规则、控制请求频率以及合法使用数据,以确保爬虫技术健康有序发展。

1508 31
|
12月前
|
机器学习/深度学习 人工智能 JSON
|

【解决方案】DistilQwen2.5-R1蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践

阿里云的人工智能平台 PAI,作为一站式的机器学习和深度学习平台,对DistilQwen2.5-R1模型系列提供了全面的技术支持。无论是开发者还是企业客户,都可以通过 PAI-ModelGallery 轻松实现 Qwen2.5 系列模型的训练、评测、压缩和快速部署。本文详细介绍在 PAI 平台使用 DistilQwen2.5-R1 蒸馏模型的全链路最佳实践。

585 63
来自: 人工智能平台PAI  版块
|
16天前
|
数据采集 运维 资源调度
|

别再被 SaaS“温柔绑架”了:一份接地气的自建数据平台迁移路线图(附避坑指南)

别再被 SaaS“温柔绑架”了:一份接地气的自建数据平台迁移路线图(附避坑指南)

113 2
|
1月前
|
Java
|

java工具:Long转String(时间毫秒数转日期格式字符串)

java工具:Long转String(时间毫秒数转日期格式字符串)

181 2
|
2月前
|
人工智能 自然语言处理 机器人
|

2026数字助理时代真的要来临了——直接自然语言操作AI助理,马斯克预言真的来了

AI自动开浏览器抢12306车票!这不仅是聊天机器人,而是能“看屏、点鼠、敲键”的数字员工——绕过API限制,直接操作任何GUI软件。马斯克力推的MacroHard(Digital Optimus),正颠覆传统软件逻辑,宣告“数字助理时代”真正来临。

190 1
|
2月前
|
存储 分布式计算 Apache
|

数据湖上跑模型训练?别再“豪横烧钱”了,这样优化性能和成本才靠谱

数据湖上跑模型训练?别再“豪横烧钱”了,这样优化性能和成本才靠谱

117 1
|
2月前
|
人工智能 自然语言处理 安全
|

为什么祝福场景里,关系证据比祝福模板重要得多

祝福生成的关键不在“好模板”,而在“真关系”。模板让输出更安全却更空洞;关系证据(如共同经历、专属细节)才能激活真诚。RAG应检索“你们之间发生了什么”,而非“别人怎么祝福”。删掉模板若效果反升,说明它一直在拖后腿——因为祝福的灵魂,从来不是像祝福,而是像你。

161 9
|
2月前
|
数据采集 人工智能 自然语言处理
|

场景判断:什么情况下值得做微调?三个维度帮你做决策

本文提出微调选型三维度决策框架:任务复杂度(知识查询/格式遵从/能力涌现)、风格要求(可选→固定→品牌级)、数据可得性(量、质、多样性),并对比提示词工程、RAG等轻量替代方案,助技术决策者科学评估微调必要性,避免资源浪费。

146 4
|
2月前
|
人工智能 Kubernetes 物联网
|

轻量化部署:让你的祝福模型在小显卡上跑起来

本文揭秘春节祝福AI的轻量化部署:无需昂贵GPU,消费级显卡即可运行!通过INT4量化(模型缩至1/8)、LoRA微调(仅训MB级参数)及QLoRA组合,搭配vLLM推理优化与K8s弹性扩缩容,7B小模型高效生成祝福语。低成本、低门槛、高可用——大模型应用,人人可及。

214 0
|
2月前
|
数据采集 缓存 边缘计算
|

隧道 HTTP 代理与正向 HTTP 代理:适用场景与原理对比

隧道HTTP代理通过建立加密隧道实现透明传输,主打穿透性、隐私保护与通用兼容;正向HTTP代理则直接解析转发请求,侧重缓存加速、访问控制与内网管理。二者原理、功能与场景迥异,选型需据需求而定。

149 0
|
2月前
|
数据采集 JSON 监控
|

京东宝贝评论数据采集指南

京东商品评论API提供结构化评论数据,涵盖评分、晒单、追评、商家回复等20+字段,支持多维筛选与排序,适用于舆情监控、竞品分析、用户画像等场景,需认证后合规调用。(239字)

176 11
|
2月前
|
SQL 人工智能 自然语言处理
|

指标中台选型技术实测:如何通过 NoETL 语义层驾驭复杂 SQL 生成

支持“存量挂载、增量原生、存量替旧”的渐进式策略,平衡价值与风险,平滑实现架构升级。

127 1

切分 + TopK:最容易被一起调坏的一对参数

RAG系统“慢性失效”常源于切分与TopK的错误联动:切分过碎导致语义碎片化,盲目调大TopK则放大噪声与冲突,而非提升效果。二者非独立参数,而是相互放大的风险组合——切分决定知识完整性,TopK决定坏信息进入决策层的数量。

109 1
|
3月前
|
数据采集 人工智能 自然语言处理
|

在Claude code上的MCP数据爬虫具体怎么实现呀?

134 0
|
3月前
|
人工智能 监控 API
|

Opus 4.5、GPT-5.2 与 Gemini 3 Pro:企业级场景下的大模型工程表现对比

本文从工程与生产视角,对比Opus 4.5、GPT-5.2、Gemini 3 Pro三款大模型在输出一致性、可控性、长上下文、接口确定性等维度的表现,强调企业级AI选型应重稳定性与系统友好度,而非单纯比拼能力。

264 4
来自: 人工智能平台PAI  版块
|
3月前
|
运维 Linux 定位技术
|

别只看 QPS:一级 NTP 时间服务器在工程现场到底靠什么兜底

本文以NTS-H-442002为例,剖析企业级Stratum 1时间服务器的关键设计:x86高并发架构保障稳定授时;GPS/北斗+蜂窝多源冗余提升可用性;高稳OCXO实现失锁后72小时<1ms守时精度;1PPS/10MHz/TOD物理接口满足硬同步需求;双电源、热备、加密与运维能力确保长期可靠。

146 4
|
3月前
|
自然语言处理 监控
|

RAG 效果差,80% 的问题和模型无关

RAG效果差,往往错不在模型,而在检索环节:切分不当、检索不相关、TopK过载、缺乏Rerank等。本文揭示RAG本质是“自然语言检索系统”,80%问题源于数据组织与检索质量,而非模型能力。重拾工程思维,先夯实检索,再谈生成。

161 7
|
3月前
|
量子技术 芯片 异构计算
|

量子芯片为什么这么难造?从“画电路”到“跑量子态”,中间全是坑

量子芯片为什么这么难造?从“画电路”到“跑量子态”,中间全是坑

211 3
|
3月前
|
安全 物联网
|

LoRA 不是“免费午餐”:你省下的算力,往往会在别的地方还回去

LoRA因轻量、易上手成为新手微调首选,但它并非“零代价”方案:虽节省显存与算力,却无法规避目标模糊、数据偏差、行为过拟合、表达能力受限等本质问题。它适合快速验证方向,而非替代系统性微调设计。

124 2
|
3月前
|
存储 人工智能 运维
|

AI Agent 搭建师破局指南:从工具使用者到逻辑架构师的职业进化

AI Agent搭建师面临模型迭代快、低代码冲击与落地难等职业焦虑。本文从矛盾解构、能力升级到职业锚定,提出向业务逻辑架构师跃迁的体系化路径,助力开发者在AGI浪潮中构建不可替代性。(239字)

132 3

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69327
内容
128
活动
439807
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务