|
9月前
|
机器学习/深度学习 人工智能 测试技术
|

【ICML2025】大模型后训练性能4倍提升!阿里云PAI团队研究成果ChunkFlow中选

阿里云 PAI 团队、通义实验室联合中国科学院大学在 ICML 2025 发表论文,提出 ChunkFlow 方案,实现变长及超长序列数据的高效训练。该方案显著提升 Qwen 模型训练性能,端到端性能最高提升 4.53 倍,大幅降低 GPU 成本。

422 0
|
9月前
|
存储 安全 Java
|

Java 学习路线 35 掌握 List 集合从入门到精通的 List 集合核心知识

本文详细解析Java中List集合的原理、常用实现类(如ArrayList、LinkedList)、核心方法及遍历方式,并结合数据去重、排序等实际应用场景,帮助开发者掌握List在不同业务场景下的高效使用,提升Java编程能力。

563 0
|
9月前
|
机器学习/深度学习 算法 Java
|

Java 大视界 -- Java 大数据机器学习模型在舆情分析中的情感倾向判断与话题追踪(185)

本篇文章深入探讨了Java大数据与机器学习在舆情分析中的应用,重点介绍了情感倾向判断与话题追踪的技术实现。通过实际案例,展示了如何利用Java生态工具如Hadoop、Hive、Weka和Deeplearning4j进行舆情数据处理、情感分类与趋势预测,揭示了其在企业品牌管理与政府决策中的重要价值。文章还展望了多模态融合、实时性提升及个性化服务等未来发展方向。

375 0
|
9月前
|
监控 API 数据处理
|

淘宝商品详情API响应数据解析的详细说明

本内容介绍了淘宝商品详情API的调用与数据解析方法,涵盖商品基础信息、价格、库存、规格、促销、物流等关键数据的获取方式。提供了核心接口如taobao.item.get、taobao.itemprops.get、taobao.item.sku.get的功能说明及Python请求示例,适用于跨平台数据整合、价格监控、自动化运营等场景,并提示了字段兼容性、错误处理及数据更新等注意事项。

299 0
|
9月前
|
人工智能 缓存 并行计算
|

《VGSP-C (Virtual GPU Scheduling Platform on CPU):基于CPU的虚拟GPU调度平台》

VGSP-C(基于CPU的虚拟GPU调度平台)提出通过“软仿真+并行调度+多机协同”三大路径,在普通CPU上模拟GPU并行计算行为。适用于资源受限或低成本场景,支持单机推理、分布式训练与极简CPU集群部署,提供统一编程接口与弹性扩展能力,助力AI普惠与算力再平衡。

328 0
|
9月前
|
存储 人工智能 监控
|

别再用U盘传CT片了!聊聊区块链+医疗记录共享的那些事儿

别再用U盘传CT片了!聊聊区块链+医疗记录共享的那些事儿

201 3
|
9月前
|
存储 供应链 调度
|

构建面向电子行业的垂直信息采集系统:Digikey元器件搜索实战

本文介绍了一个面向电子行业的自动化信息采集系统,以Digikey平台为例,实现从关键词搜索、代理请求、页面解析到数据存储的全流程抓取。系统采用模块化设计,支持定时采集与数据归档,助力企业提升采购决策效率与数据化水平。

211 0
|
9月前
|
分布式计算 监控 大数据
|

大数据之路:阿里巴巴大数据实践——离线数据开发

该平台提供一站式大数据开发与治理服务,涵盖数据存储计算、任务调度、质量监控及安全管控。基于MaxCompute实现海量数据处理,结合D2与DataWorks进行任务开发与运维,通过SQLSCAN与DQC保障代码质量与数据准确性。任务调度系统支持定时、周期、手动运行等多种模式,确保高效稳定的数据生产流程。

394 0
|
9月前
|
存储 算法 API
|

还社交一个自由的未来:去中心化社交网络,会是下一个“推特”吗?

还社交一个自由的未来:去中心化社交网络,会是下一个“推特”吗?

270 5
|
9月前
|
机器学习/深度学习 人工智能 PyTorch
|

零基础入门CNN:聚AI卷积神经网络核心原理与工业级实战指南

卷积神经网络(CNN)通过局部感知和权值共享两大特性,成为计算机视觉的核心技术。本文详解CNN的卷积操作、架构设计、超参数调优及感受野计算,结合代码示例展示其在图像分类、目标检测等领域的应用价值。

495 7
|
9月前
|
传感器 算法 安全
|

机器人路径规划和避障算法matlab仿真,分别对比贪婪搜索,最安全距离,RPM以及RRT四种算法

本程序基于MATLAB 2022A实现机器人路径规划与避障仿真,对比贪婪搜索、最安全距离、RPM和RRT四种算法。通过地图模拟环境,输出各算法的路径规划结果,展示其在避障性能与路径优化方面的差异。代码包含核心路径搜索逻辑,并附有测试运行图示,适用于机器人路径规划研究与教学演示。

1009 64
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
|

OpenSearch 视频 RAG 实践

本文介绍了 OpenSearch LLM 版中视频 RAG 的具体实现流程。

901 4
来自: 智能搜索推荐  版块
|
9月前
|
SQL JSON 分布式计算
|

Spark SQL架构及高级用法

Spark SQL基于Catalyst优化器与Tungsten引擎,提供高效的数据处理能力。其架构涵盖SQL解析、逻辑计划优化、物理计划生成及分布式执行,支持复杂数据类型、窗口函数与多样化聚合操作,结合自适应查询与代码生成技术,实现高性能大数据分析。

586 2
|
9月前
|

淘宝图搜接口功能解析

淘宝图搜是基于图像识别的便捷购物工具,支持通过图片查找商品,省去手动输入关键词的麻烦。本文详解其功能、常见问题及解决方法,助你高效使用这一工具。

645 0
|
9月前
|
数据采集 人工智能 自然语言处理
|

DistillQwen-ThoughtY:通过变长思维链蒸馏,全面提升模型推理能力!

阿里云 PAI 团队基于 EasyDistill 框架,创新性地采用推理冗余度(RV)和认知难度(CD)双指标筛选机制,实现思维链与模型能力的精准匹配,发布新一代推理模型 DistillQwen-ThoughtY。相关模型和数据集已在 hugging face/ModelScope 等开源社区开放,配套 EasyDistill 框架支持高效知识蒸馏。近期内将推出 DistillQwen-ThoughtY 模型在 PAI-ModelGallery 的一键部署、训练和评测实践。

829 2
来自: 人工智能平台PAI  版块
|
10月前
|
开发者
|

HarmonyOS实战:GIF图下载突破5M限制保存到相册

本文介绍了在鸿蒙开发中解决图片下载问题的方法,包括突破5M流限制及识别图片真实格式(如GIF)。通过分段下载和类型判断,有效解决了大图下载失败及格式错误问题,适合开发者参考实践。

269 0
|
10月前
|
存储 人工智能 运维
|

企业级MLOps落地:基于PAI-Studio构建自动化模型迭代流水线

本文深入解析MLOps落地的核心挑战与解决方案,涵盖技术断层分析、PAI-Studio平台选型、自动化流水线设计及实战构建,全面提升模型迭代效率与稳定性。

433 6
|
10月前
|
人工智能 自然语言处理 前端开发
|

AI + 低代码,程序员的副驾还是替代者?

AI + 低代码,程序员的副驾还是替代者?

357 0
|
10月前
|
缓存 人工智能 负载均衡
|

PAI 重磅发布模型权重服务,大幅降低模型推理冷启动与扩容时长

阿里云人工智能平台PAI 平台推出模型权重服务,通过分布式缓存架构、RDMA高速传输、智能分片等技术,显著提升大语言模型部署效率,解决模型加载耗时过长的业界难题。实测显示,Qwen3-32B冷启动时间从953秒降至82秒(降幅91.4%),扩容时间缩短98.2%。

634 1
来自: 人工智能平台PAI  版块
|
10月前
|
JSON API 数据格式
|

深入研究:淘宝天猫关键词搜索接口详解

淘宝和天猫提供关键词搜索商品的API接口,支持开发者按关键词获取商品列表及相关数据。功能包括通过搜索关键词(q)返回商品基本信息,如ID、标题、价格、图片、销量等。支持排序(sort)、分页(page_no/page_size)、价格区间筛选(start_price/end_price)及分类搜索(cat)。返回JSON格式数据,含商品ID、标题、价格、图片链接、详情页链接和销量等字段。

429 0
|
10月前
|
API 开发者
|

1688API接口终极宝典:列表、详情全掌握,图片搜索攻略助你一臂之力

1688为开发者提供涵盖商品、交易、物流等核心业务的丰富API。商品类API支持搜索、详情获取及图片搜索等功能;交易类API可实现订单创建、查询与支付;物流类API提供报价、轨迹查询及服务商列表获取等服务,满足多样化开发需求。

380 0
|
10月前
|
JSON 监控 API
|

深入研究:shopee商品详情API接口Python攻略

Shopee 商品详情 API 是用于获取 Shopee 平台商品详细信息的接口,支持开发者提取商品标题、价格、库存、描述和图片等多维度数据。该接口适用于电商数据分析、比价工具开发及商品监控等场景。请求方式为 GET,需提供 itemid(商品 ID)和 shopid(店铺 ID),返回格式为 JSON。部分功能可能需要 API 密钥或访问令牌认证。以马来西亚站点为例,URL 为 shopee.com.myapi/v4/item/get,不同国家站点域名可能有所不同。

318 5
|
10月前
|
机器学习/深度学习 监控 Android开发
|

AppTrace技术全景:开发者视角下的工具链与实践经验

本文全面介绍了AppTrace技术,涵盖其核心价值、实现方案及实战经验。通过性能剖析、行为分析、异常诊断和优化验证等功能,开发者可深入了解应用行为并解决性能问题。文章详细解析了iOS与Android平台的原生工具(如Signpost API、Android Profiler)以及跨平台解决方案(如Firebase Performance Monitoring)。同时分享了列表滚动卡顿优化和内存泄漏排查等实战案例,并探讨商业级APM工具与开源工具的应用场景。最后展望了AI驱动异常检测、端侧机器学习分析等未来趋势,强调在追踪深度与用户隐私间寻求平衡的重要性。

167 2
|
10月前
|
数据采集 Python
|

如何通过requests和time模块限制爬虫请求速率?

如何通过requests和time模块限制爬虫请求速率?

371 3
|
10月前
|
监控 安全 测试技术
|

5步快速获取电商API接口

电商API接口是实现电商平台数据交互的重要工具。获取途径主要包括电商平台开放平台(如淘宝、京东等)和第三方API市场,涵盖商品管理、订单处理等功能。获取步骤包括:明确需求、选择服务、注册开发者账号、获取API密钥、阅读文档、开发测试、部署上线及监控优化。过程中需注意法律法规、使用限制和技术支持,确保接口安全稳定运行,满足业务需求。

668 1
|
11月前
|
XML 数据挖掘 API
|

1688商品详情API接口指南

1688 商品详情 API 是阿里巴巴提供的开发者接口,用于获取 1688 平台商品的详细信息,包括 ID、标题、价格、销量、评价、SKU 等。通过构造 HTTP 请求并使用 App Key 和 App Secret 验证,可实现安全调用。该接口适用于电商网站、内容管理系统、数据分析工具及第三方开发场景,助力商品信息同步、市场分析与应用开发。

554 0
|
11月前
|
JSON 算法 API
|

淘宝天猫店铺商品API接口全方位接入指南

本攻略介绍淘宝天猫店铺商品API接口的使用方法,涵盖接口概述、请求方式、参数说明及响应数据等内容。核心接口如`tb.items.onsale.get`和`tb.items.inventory.get`,支持获取出售中或库存商品信息,采用HTTP POST请求,返回JSON格式数据。通用参数包括`app_key`、`timestamp`等,业务参数涉及`seller_nick`、分页设置等。响应数据包含商品ID、标题、价格、图片URL等关键信息,助力开发者高效整合与分析店铺商品数据,并提供Python请求示例方便实践。

392 3
|
11月前
|
Java 开发者
|

华为仓颉语言初识:结构体struct和类class的异同

华为仓颉语言是一种基于鸿蒙系统的新型编程语言,结合了Java和C的特点,支持与ArkTs互相调用,提升应用性能。本文详细对比了仓颉语言中结构体(struct)和类(class)的区别:struct不支持继承,赋值时为值传递;而class支持单继承、多实现,赋值时为引用传递。两者均支持构造函数及成员访问修饰符,但struct新增internal修饰符限制包内访问。开发者需根据实际需求选择合适的使用场景。

409 3
|
11月前
|
存储 缓存 测试技术
|

80510次/秒,阿里云图计算引擎刷新全球纪录!

近日,LDBC公布最新SNB Interactive基准测试结果,阿里云开源的GraphScope Flex以超80,000 QPS打破历史纪录,性能较第二名提升1倍。作为首个开源的大规模图计算引擎,GraphScope在金融风控、网络安全等领域广泛应用。其通过全栈优化与自研GOpt框架,在声明式与命令式查询双场景全面领先,大幅提升了图查询性能,研究成果已被SIGMOD 2025收录。

286 12
|
11月前
|
传感器 人工智能 自然语言处理
|

火热邀测!DataWorks数据集成支持大模型AI处理

阿里云DataWorks数据集成新增大模型AI处理功能,支持在数据同步中无缝调用通义千问等AI模型,实现文本翻译、情感分析、摘要生成等功能。适用于电商客服、智能汽车、供应链、医疗、金融、法律及教育等多个场景,大幅提升数据处理效率与洞察深度。用户可通过自然语言配置,快速完成高级数据分析与处理,无需额外部署调试。立即申请测试资格,体验智能化数据处理!

1507 4
|
11月前
|
传感器 人工智能 搜索推荐
|

VR体育训练:从赛场到虚拟世界,运动训练的新纪元

VR体育训练:从赛场到虚拟世界,运动训练的新纪元

517 11
|
11月前
|
数据采集 存储 Web App开发
|

逆向音乐APP:Python爬虫获取音乐榜单

逆向音乐APP:Python爬虫获取音乐榜单

682 58
|
11月前
|
存储 安全 Android开发
|

HarmonyOS实战:一招搞定保存图片到相册

本文介绍了在鸿蒙系统中实现保存图片到相册的功能,包括申请权限和使用系统安全控件两种方式。文中详细讲解了如何通过网络请求下载图片并保存为本地文件,以及如何将指定布局生成图片并保存。鸿蒙系统对权限管理较为严格,推荐使用系统提供的安全控件(如 SaveButton)以保护用户隐私,避免手动申请权限。此外,文章还对比了鸿蒙与 Android/iOS 的实现差异,指出鸿蒙在功能实现上更简单,但需注意权限规范以确保项目顺利上线。

1257 0
|
11月前
|
存储 监控 安全
|

攻击者是如何利用安全支持提供程序(SSP)来转储凭据的

本文探讨了攻击者如何利用安全支持提供程序(SSP)动态链接库(DLL)窃取Windows系统中的登录凭据。通过修改注册表项或内存注入技术,攻击者可加载恶意SSP至本地安全机构(LSA)进程中,提取加密或明文密码。文章详细分析了两种方法:注册SSP DLL和内存中更新SSP,并展示了Mimikatz工具的应用。为防范此类攻击,建议使用监控解决方案检测域控制器上的异常修改,确保系统安全。

344 8
|
11月前
|
数据采集 运维 API
|

把Postman调试脚本秒变Python采集代码的三大技巧

本文介绍了如何借助 Postman 调试工具快速生成 Python 爬虫代码,并结合爬虫代理实现高效数据采集。文章通过“跨界混搭”结构,先讲解 Postman 的 API 调试功能,再映射到 Python 爬虫技术,重点分享三大技巧:利用 Postman 生成请求骨架、通过 Session 管理 Cookie 和 User-Agent,以及集成代理 IP 提升稳定性。以票务信息采集为例,展示完整实现流程,探讨其在抗封锁、团队协作等方面的价值,帮助开发者快速构建生产级爬虫代码。

380 1
|
11月前
|
机器学习/深度学习 供应链 大数据
|

数据驱动,供应链管理的终极优化神器

数据驱动,供应链管理的终极优化神器

294 20
|
11月前
|
XML 数据挖掘 API
|

小红书笔记详情API接口如何使用

小红书作为社交媒体平台,拥有海量优质笔记内容。为方便开发者获取笔记详情(如标题、正文、图片、点赞数等),可假设存在一个合规的 API 接口。该接口通过 note_id、timestamp 和 sign 等参数进行调用,采用 HTTP 请求方式,返回 JSON 或 XML 格式的响应数据。尽管小红书官方未正式开放 API,但此假设有助于理解其潜在应用场景,如内容分析与数据挖掘等。

846 4
|
11月前
|
SQL 数据采集 资源调度
|

【SQL 周周练】爬取短视频发现数据缺失,如何用 SQL 填充

爬虫爬取抖音和快手的短视频数据时,如果遇到数据缺失的情况,如何使用 SQL 语句完成数据的补全。

389 5
|
11月前
|
传感器 人工智能 边缘计算
|

“种田也能上5G?”——带你看懂5G+智慧农业的真相与技术细节

“种田也能上5G?”——带你看懂5G+智慧农业的真相与技术细节

411 19
|
12月前
|
人工智能 自然语言处理 DataWorks
|

Qwen3 X DataWorks :为数据开发与分析加满Buff !

阿里云DataWorks平台正式接入Qwen3模型,支持最大235B参数量。用户可通过DataWorks Copilot智能助手调用该模型,以自然语言交互实现代码生成、优化、解释及纠错等功能,大幅提升数据开发与分析效率。Qwen3作为最新一代大语言模型,具备混合专家(MoE)和稠密(Dense)架构,适应多种应用场景,并支持MCP协议优化复杂任务处理。目前,用户可通过DataWorks Data Studio新版本体验此功能。

888 27
|
12月前
|
存储 SQL 运维
|

中国联通网络资源湖仓一体应用实践

本文分享了中国联通技术专家李晓昱在Flink Forward Asia 2024上的演讲,介绍如何借助Flink+Paimon湖仓一体架构解决传统数仓处理百亿级数据的瓶颈。内容涵盖网络资源中心概况、现有挑战、新架构设计及实施效果。新方案实现了数据一致性100%,同步延迟从3小时降至3分钟,存储成本降低50%,为通信行业提供了高效的数据管理范例。未来将深化流式数仓与智能运维融合,推动数字化升级。

589 0
来自: 实时计算 Flink  版块
|
12月前
|
供应链 测试技术
|

产品工作流程 - AxureMost

本文介绍了产品工作流程中的IPD(集成产品开发)流程,强调产品经理对整个产品过程的管控。IPD流程包含六个主要阶段:概念、计划、开发、验证、发布和生命周期管理,每个阶段都有明确目标、活动及决策评审点(DRP),以确保项目按目标推进并适应市场变化,提升产品开发成功率与市场响应速度。

995 0
|
12月前
|
机器学习/深度学习 算法 数据挖掘
|

PyTabKit:比sklearn更强大的表格数据机器学习框架

PyTabKit是一个专为表格数据设计的新兴机器学习框架,集成了RealMLP等先进深度学习技术与优化的GBDT超参数配置。相比传统Scikit-Learn,PyTabKit通过元级调优的默认参数设置,在无需复杂超参调整的情况下,显著提升中大型数据集的性能表现。其简化API设计、高效训练速度和多模型集成能力,使其成为企业决策与竞赛建模的理想工具。

449 12
|
12月前
|
安全 JavaScript 前端开发
|

引流器即服务(Drainer-as-a-Service)的兴起 | 了解引流器即服务(DaaS)

近期,X(原推特)平台遭遇一波账号接管攻击,多个知名账户被入侵以传播窃取加密货币的恶意内容。这些攻击主要依赖“加密货币引流器”及“引流器即服务”(DaaS)平台实施。DaaS提供现成脚本、智能合约等工具,帮助攻击者从受害者钱包中转移资产。2021年起,此类威胁逐渐兴起,但未引起足够关注。文章深入分析了DaaS运作模式及其影响,并以CLINKSINK恶意软件为例剖析具体攻击手法。为防范此类威胁,建议启用多因素认证(MFA),警惕社会工程学手段,使用硬件钱包提升安全性。DaaS因低门槛、高回报特点,可能吸引更多恶意参与者,需持续关注其演变趋势。

215 0
|
12月前
|
数据采集 JSON 网络安全
|

移动端数据抓取:Android App的TLS流量解密方案

本文介绍了一种通过TLS流量解密技术抓取知乎App热榜数据的方法。利用Charles Proxy解密HTTPS流量,分析App与服务器通信内容;结合Python Requests库模拟请求,配置特定请求头以绕过反爬机制。同时使用代理IP隐藏真实IP地址,确保抓取稳定。最终成功提取热榜标题、内容简介、链接等信息,为分析热点话题和用户趋势提供数据支持。此方法也可应用于其他Android App的数据采集,但需注意选择可靠的代理服务。

482 11
|
12月前
|
数据采集 机器学习/深度学习 人工智能
|

数据驱动智能,智能优化数据——大数据与人工智能的双向赋能

数据驱动智能,智能优化数据——大数据与人工智能的双向赋能

718 4

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69327
内容
128
活动
439807
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务