|
4月前
|
人工智能 算法 云栖大会
|
置顶

开启云上 AIGC 动手实践,探索技术创意

面向 GenAI 时代,阿里云人工智能平台 PAI 平台自带海量开箱即用、实时更新的大模型最佳实践,提供高性能、高稳定的大模型工程化能力。本电子书精选 2024 云栖大会动手实践教程,覆盖大语言模型应用、多模态大模型微调训练、低代码 AIGC 创意设计等热门领域,为您带来 AIGC 开发全新体验。

469
来自: 人工智能平台PAI  版块
|
机器学习/深度学习 人工智能 自然语言处理
|

DataWorks X DeepSeek : 用AI实现数据开发治理!

阿里云大数据开发治理平台DataWorks接入DeepSeek系列模型: 以2025年春节杭州的旅游热点分析为例,通过DataWorks Copilot使用DeepSeek-R1满血版模型,进行SQL代码的自动生成、改写和测试操作,实现高效的数据开发流程。

0 0
|
1小时前
|
数据采集 存储 数据挖掘
|

深入剖析 Python 爬虫:淘宝商品详情数据抓取

深入剖析 Python 爬虫:淘宝商品详情数据抓取

9 1
|
1小时前
|
人工智能 运维 自然语言处理
|

Elasticsearch AI Assistant集成DeepSeek,1分钟搭建智能运维助手

Elasticsearch 新支持 DeepSeek 系列模型,使用 AI 助手,通过自然语言交互,为可观测性分析、安全运维管理及数据智能处理提供一站式解决方案。

33 1
|
1小时前
|
数据采集 监控 安全
|

动态HTTP代理IP的使用案例与成功经验分享有哪些?

在信息化时代,网络不可或缺。动态HTTP代理IP广泛应用于网络爬虫、信息安全保护、安全访问站点和市场调研等领域。通过选择合适的代理服务、合理配置请求频率、监控IP状态、使用代理池及结合其他技术,用户可提升工作效率和数据安全性。

4 1
来自: 大数据计算 MaxCompute  版块
|
3小时前
|
数据可视化 API 开发者
|

淘宝/天猫获得淘宝商品详情 API 返回值说明

开发者可高效接入淘宝商品数据。若需特定场景的代码示例

9 0
|
6小时前
|
数据采集 Web App开发 存储
|

打造高效的Web Scraper:Python与Selenium的完美结合

本文介绍如何使用Python结合Selenium,通过代理IP、设置Cookie和User-Agent抓取BOSS直聘的招聘信息,包括公司名称、岗位、要求和薪资。这些数据可用于行业趋势、人才需求、企业动态及区域经济分析,为求职者、企业和分析师提供宝贵信息。文中详细说明了环境准备、代理配置、登录操作及数据抓取步骤,并提醒注意反爬虫机制和验证码处理等问题。

11 1
|
6小时前
|
机器学习/深度学习 自然语言处理 数据可视化
|

MOIRAI-MOE: 基于混合专家系统的大规模时间序列预测模型

MOIRAI 是 Salesforce 开发的早期时间序列基础模型,凭借出色的基准测试性能和开源的大规模预训练数据集 LOTSA 获得广泛关注。最新升级版本 MOIRAI-MOE 引入混合专家模型(Mixture of Experts, MOE),在模型性能上实现显著提升。本文深入分析 MOIRAI-MOE 的技术架构与实现机制,对比其与原版 MOIRAI 的差异,探讨 MOE 在提升预测准确率和处理频率变化问题上的作用,并展示其在分布内和零样本预测中的优异表现。实验结果显示,MOIRAI-MOE 以更少的激活参数量实现了更高的性能提升,成为时间序列预测领域的重要里程碑。

24 12
|
7小时前
|
JSON API 数据格式
|

阿里巴巴商品详情接口(阿里巴巴 API 系列)

在电商开发中,获取阿里巴巴商品详情信息对数据分析、竞品研究等至关重要。通过调用其商品详情接口,开发者可获取标题、价格、图片、描述等数据,满足多种业务需求。接口采用HTTPS协议,支持GET/POST请求,返回JSON格式数据。示例代码展示了如何使用Python的requests库进行接口请求,需传递商品ID和访问令牌。实际应用时,请依据官方文档调整参数并确保安全性。

23 10
|
8小时前
|
安全 区块链 数据安全/隐私保护
|

区块链技术在跨境支付中的应用:打破传统,畅行全球支付新时代

区块链技术在跨境支付中的应用:打破传统,畅行全球支付新时代

21 12
|
8小时前
|
存储 分布式计算 大数据
|

大数据与云计算:无缝结合,开启数据新纪元

大数据与云计算:无缝结合,开启数据新纪元

22 11
|
18小时前
|
流计算 对象存储 存储
|

flink 读取oss-hdfs数据问题

9 1
来自:实时计算 Flink 版块
|
18小时前
|
分布式计算 大数据 数据处理
|

从Excel到大数据:别让工具限制你的思维!

从Excel到大数据:别让工具限制你的思维!

109 85
|
18小时前
|
存储 安全 区块链
|

去中心化存储:数据存储的新范式

去中心化存储:数据存储的新范式

116 91
|
18小时前
|
算法
|

基于小波变换和峰值搜索的光谱检测matlab仿真,带GUI界面

本程序基于小波变换和峰值搜索技术,实现光谱检测的MATLAB仿真,带有GUI界面。它能够对CO2、SO2、CO和CH4四种成分的比例进行分析和提取。程序在MATLAB 2022A版本下运行,通过小波分解、特征提取和峰值检测等步骤,有效识别光谱中的关键特征点。核心代码展示了光谱数据的处理流程,包括绘制原始光谱、导数光谱及标注峰值位置,并保存结果。该方法结合了小波变换的时频分析能力和峰值检测的敏锐性,适用于复杂信号的非平稳特性分析。

30 19
|
1天前
|
机器学习/深度学习 人工智能 JSON
|

知识蒸馏方法探究:Google Distilling Step-by-Step 论文深度分析

大型语言模型(LLM)的发展迅速,从简单对话系统进化到能执行复杂任务的先进模型。然而,这些模型的规模和计算需求呈指数级增长,给学术界和工业界带来了挑战。为解决这一问题,知识蒸馏技术应运而生,旨在将大型模型的知识转移给更小、更易管理的学生模型。Google Research 提出的“Distilling Step-by-Step”方法不仅减小了模型规模,还通过提取推理过程使学生模型在某些任务上超越教师模型。该方法通过多任务学习框架,训练学生模型同时预测标签和生成推理过程,从而实现更高效、更智能的小型化模型。这为资源有限的研究者和开发者提供了新的解决方案,推动了AI技术的普及与应用。

56 19
|
1天前
|
SQL 人工智能 数据可视化
|

数据团队必读:智能数据分析文档(DataV Note)五种高效工作模式

数据项目复杂,涉及代码、数据、运行环境等多部分。随着AI发展,数据科学团队面临挑战。协作式数据文档(如阿里云DataV Note)成为提升效率的关键工具。它支持跨角色协同、异构数据处理、多语言分析及高效沟通,帮助创建知识库,实现可重现的数据科学过程,并通过一键分享报告促进数据驱动决策。未来,大模型AI将进一步增强其功能,如智能绘图、总结探索、NLP2SQL/Python和AutoReport,为数据分析带来更多可能。

35 20
来自: 数据可视化DataV  版块
|
1天前
|
JSON API 开发者
|

ebay 商品列表数据接口(ebay API 系列)

eBay 商品列表数据接口为电商从业者、开发者和研究人员提供了宝贵的数据资源,助力市场分析与应用开发。通过注册 eBay 开发者平台并遵循 OAuth 2.0 认证流程获取访问令牌,用户可以使用 HTTP GET 请求调用 API,根据关键词、价格范围等参数筛选商品,并获取商品标题、价格、图片链接等信息。Python 示例代码展示了如何发送请求、处理响应并解析 JSON 数据,帮助用户快速上手。注意合法合规使用数据。

29 14
|
1天前
|
JSON API 数据格式
|

eBay商品详情接口(ebay API系列)

eBay 商品详情接口是电商从业者、开发者和数据分析师获取商品详细信息的重要工具,涵盖标题、价格、库存、卖家信息等。使用前需在 eBay 开发者平台注册并获取 API 凭证,通过 HTTP GET 请求调用接口,返回 JSON 格式数据。Python 示例代码展示了如何发送请求并解析响应,确保合法合规使用数据。

28 12
|
1天前
|
算法
|

基于SOA海鸥优化算法的三维曲面最高点搜索matlab仿真

本程序基于海鸥优化算法(SOA)进行三维曲面最高点搜索的MATLAB仿真,输出收敛曲线和搜索结果。使用MATLAB2022A版本运行,核心代码实现种群初始化、适应度计算、交叉变异等操作。SOA模拟海鸥觅食行为,通过搜索飞行、跟随飞行和掠食飞行三种策略高效探索解空间,找到全局最优解。

34 15
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
|

国产AI神器Deepseek,本地离线使用教程!

国产AI神器Deepseek,本地离线使用教程!

60 14
来自: 人工智能平台PAI  版块
|
1天前
|
存储 供应链 安全
|

区块链在物流管理中的应用:让货物管理变得更智能

区块链在物流管理中的应用:让货物管理变得更智能

38 14
|
1天前
|
存储 SQL 安全
|

大数据的隐私与安全:你的一举一动,都在“裸奔”?

大数据的隐私与安全:你的一举一动,都在“裸奔”?

37 15
|
2天前
|
安全 搜索推荐 数据安全/隐私保护
|

产品经理-需求层次理论 - AxureMost

需求层次理论由马斯洛提出,将人类需求分为五个层次:生理、安全、社交、尊重和自我实现。该理论在产品设计中广泛应用,指导设计师创造满足用户深层次需求的产品。通过确保基本功能、强化安全、促进社交、提供个性化选项及支持自我实现,产品不仅能提升功能性,还能增强用户的心理满足感和忠诚度。

43 18
|
2天前
|
UED
|

产品经理-用户体验五要素 - AxureMost

《用户体验五要素》介绍了构建成功用户体验设计的五个层面:战略层、范围层、结构层、框架层和表现层。战略层明确产品目标与用户需求;范围层定义功能和内容需求;结构层规划交互与信息架构;框架层设计界面、导航和信息布局;表现层则通过视觉设计创造感知体验。每一层都依赖于其下一层,形成自下而上的连锁效应,确保各要素相互作用,共同实现用户体验目标。

78 13
|
2天前
|
供应链 搜索推荐 数据挖掘
|

数据爬取对电商运营有何帮助?

数据爬取在电商运营中至关重要,助力商家了解市场动态、优化策略、提升用户体验。具体表现为:市场分析与竞争情报,如商品信息、促销活动、用户评价等;用户行为分析,构建用户画像,分析留存与流失;商品管理与优化,如定价策略、个性化推荐、库存管理;营销与推广,精准营销、社交媒体分析、广告优化;用户体验优化,如网站性能、客户服务;供应链管理,供应商评估、物流优化。通过数据爬取,商家能提高竞争力和盈利能力,实现商业目标。

35 13
|
2天前
|
数据采集 JSON Java
|

Java爬虫获取微店快递费用item_fee API接口数据实现

本文介绍如何使用Java开发爬虫程序,通过微店API接口获取商品快递费用(item_fee)数据。主要内容包括:微店API接口的使用方法、Java爬虫技术背景、需求分析和技术选型。具体实现步骤为:发送HTTP请求获取数据、解析JSON格式的响应并提取快递费用信息,最后将结果存储到本地文件中。文中还提供了完整的代码示例,并提醒开发者注意授权令牌、接口频率限制及数据合法性等问题。

28 14
|
2天前
|
数据采集 存储 Java
|

Java爬虫获取微店店铺所有商品API接口设计与实现

本文介绍如何使用Java设计并实现一个爬虫程序,以获取微店店铺的所有商品信息。通过HttpClient发送HTTP请求,Jsoup解析HTML页面,提取商品名称、价格、图片链接等数据,并将其存储到本地文件或数据库中。文中详细描述了爬虫的设计思路、代码实现及注意事项,包括反爬虫机制、数据合法性和性能优化。此方法可帮助商家了解竞争对手,为消费者提供更全面的商品比较。

28 12
|
2天前
|
存储 数据采集 自然语言处理
|

集运物流公司搭建反向海淘系统的完整方案,助传统物流企业快速切入反向海淘赛道

该方案针对集运物流公司搭建反向海淘系统,涵盖系统设计、资源整合、运营策略和成功要素。通过复用现有物流仓储资源,构建从商品聚合到支付结算、物流调度的完整闭环,提供免费合箱、敏感货专线等差异化功能。整合国内外资源,优化成本结构,实现低成本高可用的技术实现,并确保合规运营。冷启动策略包括精准获客和裂变模型,盈利模式涵盖代购服务费、物流差价及增值服务。成功案例显示,物流企业可通过此方案快速切入反向海淘赛道,提升客户生命周期价值。

34 12
|
2天前
|
人工智能 自然语言处理 监控
|

大语言模型的解码策略与关键优化总结

本文系统性地阐述了大型语言模型(LLMs)中的解码策略技术原理及其应用。通过深入分析贪婪解码、束搜索、采样技术等核心方法,以及温度参数、惩罚机制等优化手段,为研究者和工程师提供了全面的技术参考。文章详细探讨了不同解码算法的工作机制、性能特征和优化方法,强调了解码策略在生成高质量、连贯且多样化文本中的关键作用。实例展示了各类解码策略的应用效果,帮助读者理解其优缺点及适用场景。

55 20
|
2天前
|
算法
|

基于排队理论的客户结账等待时间MATLAB模拟仿真

本程序基于排队理论,使用MATLAB2022A模拟客户结账等待时间,分析平均队长、等待时长、不能结账概率、损失顾客数等关键指标。核心算法采用泊松分布和指数分布模型,研究顾客到达和服务过程对系统性能的影响,适用于银行、超市等多个领域。通过仿真,优化服务效率,减少顾客等待时间。

44 26
|
2天前
|
数据采集 自然语言处理 API
|

集运物流企业构建反向海淘系统的完整投入分析,涵盖技术、物流、合规、运营四大核心模块的详细成本与资源

集运物流企业构建反向海淘系统需投入技术、物流、合规、运营四大模块资源。技术方面涵盖用户端与商家端开发、API对接及智能清关系统,首年成本约150万至800万人民币。物流基建包括国内集运仓、国际运输和海外派送,涉及浮动成本。合规投入涉及跨境资质、国际认证及数据安全。运营阶段注重市场推广、客服体系及品牌建设。总初期启动成本150万至800万,持续运营年成本100万至500万。成功要素包括差异化服务、技术护城河和本地化运营。

38 17
|
3天前
|
人工智能 运维 Cloud Native
|

【技术产品】DS三剑客:DeepSeek、DataSophon、DolphineSchduler浅析

在大数据与云原生技术快速发展的时代,开源技术成为推动行业进步的重要力量。本文深入探讨了三个备受瞩目的开源产品组件:DeepSeek、DataSophon 和 DolphinScheduler。DeepSeek 是专注于自然语言处理的大语言模型,具备多模态交互和高效推理功能;DataSophon 是大数据云原生平台的智能管家,提供快速部署和智能化运维;DolphinScheduler 则是分布式任务调度系统,支持复杂工作流的编排与执行。三者分别在大语言模型、大数据管理和任务调度领域展现了强大的技术实力,并通过技术互补共同推动AI与大数据技术的深度融合。

48 2
|
3天前
|
安全
|

静态代理IP对网站性能的影响分析

在信息化时代,网络不可或缺。静态代理IP通过增强网络稳定性、确保连接可靠性和提高用户工作效率,显著提升网站访问速度和性能。91HTTP作为高质量代理IP服务商,提供更快的代理连接速度,助力用户高效获取信息。

24 3
来自: 大数据计算 MaxCompute  版块
|
3天前
|
存储 数据采集 数据库
|

Python爬虫实战:股票分时数据抓取与存储

Python爬虫实战:股票分时数据抓取与存储

54 5
|
3天前
|
人工智能 大数据
|

ai时代的到来……脚本也更容易翻到合适自己的……那究竟是照脚本好?还是?

随着DeepSeek的流行,个人和小团体在大数据面前显得脆弱。AI让工作简化,但也会导致失业风险。会使用新技术的人忙碌,其他人可能闲着或落后。未来充满不确定性,信息真假难辨,人们仿佛在演戏,真情实感被掩盖。在AI时代,如何保持真实与秩序成为重要问题。

21 6
|
3天前
|
SQL 存储 API
|

Flink Materialized Table:构建流批一体 ETL

本文整理自阿里云智能集团 Apache Flink Committer 刘大龙老师在2024FFA流批一体论坛的分享,涵盖三部分内容:数据工程师用户故事、Materialized Table 构建流批一体 ETL 及 Demo。文章通过案例分析传统 Lambda 架构的挑战,介绍了 Materialized Table 如何简化流批处理,提供统一 API 和声明式 ETL,实现高效的数据处理和维护。最后展示了基于 Flink 和 Paimon 的实际演示,帮助用户更好地理解和应用这一技术。

239 7
来自: 实时计算 Flink  版块
|
3天前
|
存储 人工智能 自然语言处理
|

云上玩转DeepSeek系列之二:PAI+DeepSeek,打造智能问答助手

本文将为您带来“PAI+DeepSeek,30分钟打造支持连网搜索+私有知识库的智能应用”最佳实践,大模型能力、联网能力再加持 RAG 方案,实现 DeepSeek 系列模型与现有业务的高效融合。

112 16
来自: 人工智能平台PAI  版块
|
3天前
|
机器学习/深度学习 算法 PyTorch
|

DeepSeek 背后的技术:GRPO,基于群组采样的高效大语言模型强化学习训练方法详解

强化学习(RL)是提升大型语言模型(LLM)推理能力的重要手段,尤其在复杂推理任务中表现突出。DeepSeek团队通过群组相对策略优化(GRPO)方法,在DeepSeek-Math和DeepSeek-R1模型中取得了突破性成果,显著增强了数学推理和问题解决能力。GRPO无需价值网络,采用群组采样和相对优势估计,有效解决了传统RL应用于语言模型时的挑战,提升了训练效率和稳定性。实际应用中,DeepSeek-Math和DeepSeek-R1分别在数学推理和复杂推理任务中展现了卓越性能。未来研究将聚焦于改进优势估计、自适应超参数调整及理论分析,进一步拓展语言模型的能力边界。

68 8
|
3天前
|
供应链 搜索推荐 API
|

亚马逊商品列表数据接口(亚马逊 API 系列)

亚马逊的商品列表数据接口为电商从业者、数据分析人员和开发者提供了宝贵的市场洞察。通过该接口,用户可以批量获取商品的关键信息,包括基本信息、价格、销售排名和库存状态等,助力市场分析、竞品研究和商品推荐。开发者需在亚马逊开发者中心注册并申请API权限,使用安全凭证进行认证,支持HTTP/HTTPS协议的GET和POST请求。Python示例展示了如何调用接口获取商品列表,并解析响应数据。应用场景涵盖市场趋势分析、竞品对比、个性化推荐及库存管理,帮助商家优化策略,提升竞争力。

38 13
|
3天前
|
监控 供应链 搜索推荐
|

亚马逊商品详情接口(亚马逊 API 系列)

亚马逊作为全球最大的电商平台之一,提供了丰富的商品资源。开发者和电商从业者可通过亚马逊商品详情接口获取商品的描述、价格、评论、排名等数据,对市场分析、竞品研究、价格监控及业务优化具有重要价值。接口基于MWS服务,支持HTTP/HTTPS协议,需注册并获得API权限。Python示例展示了如何使用mws库调用接口获取商品详情。应用场景包括价格监控、市场调研、智能选品、用户推荐和库存管理等,助力电商运营和决策。

46 23
|
3天前
|
数据采集 机器学习/深度学习 算法
|

探索数据科学家的日常:揭秘职业背后的故事

探索数据科学家的日常:揭秘职业背后的故事

30 10
|
3天前
|
存储 前端开发 区块链
|

基于区块链的慈善捐赠平台:透明与信任的未来

基于区块链的慈善捐赠平台:透明与信任的未来

50 24
|
3天前
|
传感器 算法 物联网
|

基于粒子群算法的网络最优节点部署优化matlab仿真

本项目基于粒子群优化(PSO)算法,实现WSN网络节点的最优部署,以最大化节点覆盖范围。使用MATLAB2022A进行开发与测试,展示了优化后的节点分布及其覆盖范围。核心代码通过定义目标函数和约束条件,利用PSO算法迭代搜索最佳节点位置,并绘制优化结果图。PSO算法灵感源于鸟群觅食行为,适用于连续和离散空间的优化问题,在通信网络、物联网等领域有广泛应用。该算法通过模拟粒子群体智慧,高效逼近最优解,提升网络性能。

34 9
|
3天前
|
数据挖掘 OLAP 云计算
|

[直播预约]StarRocks 2025 Roadmap 全面解读

2月19日19:00-20:30,StarRocks TSC Member赵恒、康凯森将解读2025 Roadmap,并邀请多位专家分享最新进展。欢迎参与交流!

36 6
|
3天前
|
分布式计算 Spark
|

【赵渝强老师】Spark的容错机制:检查点

Spark通过Checkpoint机制将RDD状态持久化到磁盘,以支持容错。当任务执行出错时,可以从检查点位置重新计算,减少开销。Checkpoint目录可设置为本地文件夹或HDFS。建议生产系统使用高可靠的文件系统保存检查点。文中详细介绍了在本地和HDFS上设置检查点目录的步骤,并附有代码示例和视频讲解。

29 7
来自: 大数据计算 MaxCompute  版块
|
4天前
|
数据采集 Web App开发 iOS开发
|

使用 User-Agent 模拟浏览器行为的技巧

使用 User-Agent 模拟浏览器行为的技巧

45 4