|
9月前
|
JSON API UED
|

商品信息API接口的设计与实现

商品信息API接口的设计与实现,遵循RESTful原则以确保高效、可维护和良好的用户体验。API支持获取、查询、创建、更新和删除商品资源,URL模式直观易懂。请求参数通过查询字符串传递,支持分页和过滤。响应体结构化,包含数据、链接和元数据字段,便于解析。错误处理采用HTTP状态码结合JSON错误描述,提供明确反馈。

249 2
|
9月前
|
机器学习/深度学习 人工智能 算法
|

DeepSeek技术报告解析:为什么DeepSeek-R1 可以用低成本训练出高效的模型

DeepSeek-R1 通过创新的训练策略实现了显著的成本降低,同时保持了卓越的模型性能。本文将详细分析其核心训练方法。

1074 11
|
9月前
|
机器学习/深度学习 Python
|

哪些特征导致过拟合?使用ParShap 方法精准定位导致模型泛化能力下降的关键特征

本文探讨了如何识别导致模型过拟合的特征,提出了一种基于SHAP值和偏相关性的新方法——ParShap。通过分析德国健康登记数据集,作者展示了传统特征重要性无法准确反映特征在新数据上的表现,而ParShap能有效识别出过拟合特征。实验表明,移除这些特征可以显著减少过拟合现象,验证了该方法的有效性。

297 79
|
10月前
|
定位技术 数据安全/隐私保护
|

合适的HTTP代理IP关键考虑因素与实用建议

随着互联网发展,使用HTTP代理IP的需求日益增加。选择优质HTTP代理IP时需注意:1. 速度和稳定性;2. 用户信息保护;3. 地域性;4. 带宽上限;5. 支持的协议;6. 客户支持;7. 用户评价和信誉;8. 价格和性价比。确保选择可靠的代理服务,满足业务需求。

241 18
来自: 大数据计算 MaxCompute  版块
|
10月前
|
供应链 算法 安全
|

探索区块链技术中的隐私保护机制

探索区块链技术中的隐私保护机制

391 27
|
10月前
|
机器学习/深度学习 算法 计算机视觉
|

基于CNN卷积神经网络的金融数据预测matlab仿真,对比BP,RBF,LSTM

本项目基于MATLAB2022A,利用CNN卷积神经网络对金融数据进行预测,并与BP、RBF和LSTM网络对比。核心程序通过处理历史价格数据,训练并测试各模型,展示预测结果及误差分析。CNN通过卷积层捕捉局部特征,BP网络学习非线性映射,RBF网络进行局部逼近,LSTM解决长序列预测中的梯度问题。实验结果表明各模型在金融数据预测中的表现差异。

403 10

PM 常见名词(C 端)

本表总结了C端产品管理中常见的关键名词及其释义,涵盖用户活跃度(DAU、MAU等)、流量指标(PV、UV等)、收入相关(ARPU、CAC等)、库存单位(SKU、SPU)及重要模型(AARRR、RFM、OMTM)。帮助PM快速理解并应用这些概念。

235 11
|
10月前
|
存储 分布式计算 MaxCompute
|

使用PAI-FeatureStore管理风控应用中的特征

PAI-FeatureStore 是阿里云提供的特征管理平台,适用于风控应用中的离线和实时特征管理。通过MaxCompute定义和设计特征表,利用PAI-FeatureStore SDK进行数据摄取与预处理,并通过定时任务批量计算离线特征,同步至在线存储系统如FeatureDB或Hologres。对于实时特征,借助Flink等流处理引擎即时分析并写入在线存储,确保特征时效性。模型推理方面,支持EasyRec Processor和PAI-EAS推理服务,实现高效且灵活的风险控制特征管理,促进系统迭代优化。

212 6
来自: 人工智能平台PAI  版块
|
10月前
|
Python 人工智能
|

预设的 AI 助手规则文件

217 1
|
10月前
|
机器学习/深度学习 数据采集 算法
|

机器学习在生物信息学中的创新应用:解锁生物数据的奥秘

机器学习在生物信息学中的创新应用:解锁生物数据的奥秘

812 36
|
10月前
|
数据采集 API 定位技术
|

合适HTTP代理优化效率的方法与好处

随着互联网发展,使用HTTP动态代理IP的需求日益增加。选择稳定、支持隧道代理、速度快、多样性高、支持HTTPS、API集成便捷、可更换性强、并发支持好且IP池大的代理IP,能有效提升爬虫效率和成功率。掌握这些实用技巧,有助于更好地利用代理IP进行数据采集。

231 10
来自: 大数据计算 MaxCompute  版块
|
10月前
|
算法 Serverless
|

基于魏格纳函数和焦散线方法的自加速光束matlab模拟与仿真

本项目基于魏格纳函数和焦散线方法,使用MATLAB 2022A模拟自加速光束。通过魏格纳函数法生成多种自加速光束,并设计相应方法,展示仿真结果。核心程序包括相位和幅度的计算、光场分布及拟合分析,实现对光束传播特性的精确控制。应用领域涵盖光学成像、光操控和光束聚焦等。 关键步骤: 1. 利用魏格纳函数计算光场分布。 2. 模拟并展示自加速光束的相位和幅度图像。 3. 通过拟合分析,验证光束加速特性。 该算法原理基于魏格纳函数描述光场分布,结合数值模拟技术,实现对光束形状和传播特性的精确控制。通过调整光束相位分布,可改变其传播特性,如聚焦或加速。

247 20
|
10月前
|
人工智能 自然语言处理 安全
|

通过阿里云Milvus与PAI搭建高效的检索增强对话系统

阿里云向量检索Milvus版是一款全托管的云服务,兼容开源Milvus并支持无缝迁移。它提供大规模AI向量数据的相似性检索服务,具备易用性、可用性、安全性和低成本等优势,适用于多模态搜索、检索增强生成(RAG)、搜索推荐、内容风险识别等场景。用户可通过PAI平台部署RAG系统,创建和配置Milvus实例,并利用Attu工具进行可视化操作,快速开发和部署应用。使用前需确保Milvus实例和PAI在相同地域,并完成相关配置与开通服务。

378 6
|
10月前
|
机器学习/深度学习 存储 设计模式
|

特征时序化建模:基于特征缓慢变化维度历史追踪的机器学习模型性能优化方法

本文探讨了数据基础设施设计中常见的一个问题:数据仓库或数据湖仓中的表格缺乏构建高性能机器学习模型所需的历史记录,导致模型性能受限。为解决这一问题,文章介绍了缓慢变化维度(SCD)技术,特别是Type II类型的应用。通过SCD,可以有效追踪维度表的历史变更,确保模型训练数据包含完整的时序信息,从而提升预测准确性。文章还从数据工程师、数据科学家和产品经理的不同视角提供了实施建议,强调历史数据追踪对提升模型性能和业务洞察的重要性,并建议采用渐进式策略逐步引入SCD设计模式。

367 8
|
10月前
|
算法
|

基于龙格库塔算法的锅炉单相受热管建模与matlab数值仿真

本设计基于龙格库塔算法对锅炉单相受热管进行建模与MATLAB数值仿真,简化为喷水减温器和末级过热器组合,考虑均匀传热及静态烟气处理。使用MATLAB2022A版本运行,展示自编与内置四阶龙格库塔法的精度对比及误差分析。模型涉及热传递和流体动力学原理,适用于优化锅炉效率。

188 14
|
11月前
|
人工智能 运维 自然语言处理
|

AI for Network Ops

网络运维工作涵盖从规划设计到日常维护的多个方面,随着网络规模扩大,人工运维难以应对。自动化运维系统应运而生,通过批量配置变更和监控工具提升效率。大模型(LLM)具备推理、学习和泛化能力,可作为网工的智能助手,优化故障定位等任务。团队通过多轮信息摘要和微调模型,实现了高效准确的故障定位,单个故障定位耗时小于1.5分钟,准确率超过80%。未来,大模型还将应用于智能答疑机器人和意图驱动网络等领域,全面提升网络运维效率。

241 9
|
11月前
|
人工智能 数据可视化 数据挖掘
|

【产品】G 端产品经理

G端产品经理在政府数字化转型中扮演着关键角色,连接政府需求与技术实现。他们负责挖掘需求、规划方案、推动跨部门协作,并监督项目进展。具体职责包括需求调研、产品规划与设计、原型制作、文档撰写及交互与视觉设计等。面对复杂多变的需求、快速更新的技术和严格的项目验收,G端产品经理需不断提升专业技能,以适应挑战并推动政府治理体系现代化。

266 10
|
11月前
|
JSON API 开发者
|

速卖通获得AliExpress商品详情API接口文章

速卖通(AliExpress)是阿里巴巴旗下的全球跨境电商平台,提供便捷的在线购物渠道。为帮助开发者和商家高效管理商品信息,速卖通提供了商品详情API接口。本文介绍如何使用aliexpress.item_get API获取商品详情,包括获取API密钥、调用API接口及处理响应数据,帮助用户提升商品管理和营销效率。注意API调用限制和合法合规使用。

409 2
|
11月前
|
SQL 数据可视化 架构师
|

DataWorks Notebook

DataWorks的Notebook提供了一个交互式、灵活且可复用的数据处理和分析环境,增强了直观性、模块化和交互性,帮助您更轻松地进行数据处理、探索、可视化和模型构建。

201 0
|
11月前
|
机器学习/深度学习 算法
|

基于改进遗传优化的BP神经网络金融序列预测算法matlab仿真

本项目基于改进遗传优化的BP神经网络进行金融序列预测,使用MATLAB2022A实现。通过对比BP神经网络、遗传优化BP神经网络及改进遗传优化BP神经网络,展示了三者的误差和预测曲线差异。核心程序结合遗传算法(GA)与BP神经网络,利用GA优化BP网络的初始权重和阈值,提高预测精度。GA通过选择、交叉、变异操作迭代优化,防止局部收敛,增强模型对金融市场复杂性和不确定性的适应能力。

369 80
|
11月前
|
人工智能 Serverless API
|

aliyun解决方案评测|主动式智能导购AI助手构建

《主动式智能导购AI助手构建》方案结合百炼大模型与函数计算,提供高效智能导购服务。然而,实际体验中发现官方教程的说明顺序有待优化,特别是关于百炼大模型服务开通及API-key的使用指引不够清晰,导致初次使用者需查阅额外资料。此外,架构设计和实践原理在部署过程中逐步展现,有助于理解,但针对生产环境的具体指导还需进一步完善以满足实际需求。为优化用户体验,建议调整文档中的步骤顺序,确保新手能更顺畅地完成部署和测试。

347 27
|
11月前
|
分布式计算 DataWorks 搜索推荐
|

DataWorks产品评测:大数据开发治理平台的最佳实践与体验

DataWorks是阿里云推出的一款大数据开发治理平台,集成了多种大数据引擎,支持数据集成、开发、分析和任务调度。本文通过用户画像分析的最佳实践,评测了DataWorks的功能和使用体验,并提出了优化建议。通过实践,DataWorks在数据整合、清洗及可视化方面表现出色,适合企业高效管理和分析数据。

396 0
|
11月前
|
SQL 分布式计算 DataWorks
|

DataWorks智能交互式数据开发与分析之旅

本次实验将带您进行DataWorks Notebook的快速入门,包含:Notebook新建、多引擎SQL开发与分析、Python开发、交互式分析等,同时,使用DataWorks Copilot体验智能数据开发,体验智能交互式数据探索之旅。

2921 11
|
11月前
|
数据采集 前端开发 数据挖掘
|

利用 html_table 函数轻松获取网页中的表格数据

本文介绍了如何使用 R 语言中的 `html_table` 函数结合代理 IP 技术,轻松提取网页表格数据并规避反爬机制。通过设置代理和请求头,示例代码展示了如何从 58 同城采集租房信息并保存为 CSV 文件。该方法适用于需要频繁采集数据的场景,确保数据采集的高效和稳定性。

384 2
|
11月前
|
SQL 存储 缓存
|

Flink SQL Deduplication 去重以及如何获取最新状态操作

Flink SQL Deduplication 是一种高效的数据去重功能,支持多种数据类型和灵活的配置选项。它通过哈希表、时间窗口和状态管理等技术实现去重,适用于流处理和批处理场景。本文介绍了其特性、原理、实际案例及源码分析,帮助读者更好地理解和应用这一功能。

785 14
来自: 实时计算 Flink  版块
|
11月前
|
弹性计算 自然语言处理 数据库
|

通过阿里云Milvus和LangChain快速构建LLM问答系统

本文介绍如何通过整合阿里云Milvus、阿里云DashScope Embedding模型与阿里云PAI(EAS)模型服务,构建一个由LLM(大型语言模型)驱动的问题解答应用,并着重演示了如何搭建基于这些技术的RAG对话系统。

428 3
|
11月前
|
搜索推荐 数据挖掘 API
|

淘宝天猫商品评论数据接口丨淘宝 API 实时接口指南

淘宝天猫商品评论数据接口(Taobao.item_review)提供全面的评论信息,包括文字、图片、视频评论、评分、追评等,支持实时更新和高效筛选。用户可基于此接口进行数据分析,支持情感分析、用户画像构建等,同时确保数据使用的合规性和安全性。使用步骤包括注册开发者账号、创建应用获取 API 密钥、发送 API 请求并解析返回数据。适用于电商商家、市场分析人员和消费者。

1032 3
|
11月前
|

2024FFA分论坛-Data+Ai

FFA2024Data+AI专场由Apache Flink核心贡献者与来自哔哩哔哩、抖音集团、Elastic、京东、硕橙科技等公司的一线技术专家带来,聚焦实时大数据处理与人工智能的前沿融合,共同探讨如何利用Flink助力AI大模型技术的实时化升级,议题涵盖但不限于特征工程、训练、推理、大模型架构优化、以及实时AI大模型在各行业领域的创新应用。

616 0
来自: 实时计算 Flink  版块
|
11月前
|

2024FFA分论坛-生产实践1

FFA2024生产实践专场由Apache Flink核心贡献者与来自快手、eBay、阿里云、抖音集团、Uber、鹰角、移动云、京东、用友畅捷通、搜配云、度小满、天翼云等公司的一线技术专家带来,将聚焦于在生产中使用和部署Flink的痛点和经验以及最佳实践, 共同探讨如何在真实环境中更高效,安全,敏捷地落地实时数据处理框架。

603 0
来自: 实时计算 Flink  版块
|
11月前
|
数据采集
|

动态代理与静态代理在爬虫解析的优缺点

随着科技和互联网的发展,越来越多企业需要使用代理进行数据抓取。本文介绍了HTTP动态代理与静态代理的区别,帮助您根据具体需求选择最佳方案。动态代理适合大规模、高效率的爬取任务,但稳定性较差;静态代理则适用于小规模、高稳定性和速度要求的场景。选择时需考虑目标、数据量及网站策略。

192 4
|
12月前
|
机器学习/深度学习 存储 算法
|

基于圆柱体镜子和光线跟踪实现镜反射观测全景观图的matlab模拟仿真

本程序基于圆柱体镜子和光线跟踪技术,实现镜反射观测全景观图。使用MATLAB2022a版本运行,模拟了特定场景下的全景视觉效果。通过几何光学和计算机图形学原理,计算光线与圆柱镜面的交点及反射光线,最终生成全景图。

113 5
|
12月前
|
流计算 关系型数据库 MySQL
|

flinksql同步mysql数据到doris提示incompatible types

220 2
来自:实时计算 Flink 版块
|
12月前
|
大数据
|

【赵渝强老师】大数据主从架构的单点故障

大数据体系架构中,核心组件采用主从架构,存在单点故障问题。为提高系统可用性,需实现高可用(HA)架构,通常借助ZooKeeper来实现。ZooKeeper提供配置维护、分布式同步等功能,确保集群稳定运行。下图展示了基于ZooKeeper的HDFS HA架构。

246 0
|
12月前
|
SQL 数据可视化 关系型数据库
|

阿里云DataV“山海计划” x Epic Fab:“中国风AIGC”助力智慧城市建设

DataV“山海计划”根据中国城市规划特色,建立城市地块、建筑、道路等“城市要素知识库”,基于AI大模型技术生成更贴近“中国特色”的城市场景。基于DataV“山海计划”的UE引擎插件已经登陆Epic Fab,广大UE引擎开发者可以通过该插件免费体验城市历史悠久的广州场景三维资产。除了三维城市场景生成,DataV为智慧城市提供完整的数据看板解决方案,提供200+基础图表、支持API、MySQL、SQL Server、人大金仓、达梦等30+数据源,通过DataV与UE引擎,广大开发者可以低成本获得“智慧城市”开发方案,将更多精力放在满足用户业务需求上,从而提升智慧城市项目的交付质量。

651 3
来自: 数据可视化DataV  版块
|
12月前
|
数据采集 Web App开发 监控
|

捕获抖音截图:如何用Puppeteer保存页面状态

随着抖音直播的兴起,实时动态和互动元素吸引了大量用户。为了捕获直播页面的实时信息,本文介绍了如何使用 Puppeteer 和代理 IP 服务,解决页面动态加载、反爬虫机制等问题,实现自动化抓取和截图保存。通过安装 Puppeteer、配置代理 IP 和编写简单脚本,可以高效地捕获抖音直播页面的状态。

486 51
|
12月前
|
存储 JSON API
|

如何创建自己的数据集!!!

本文介绍了如何创建和使用自定义数据集,特别是针对GitHub Issues的语料库。内容涵盖了从获取数据、清理数据到扩充数据集的全过程,最终将数据集上传到Hugging Face Hub并与社区分享。具体步骤包括使用GitHub REST API下载Issues,通过Python脚本进行数据处理,以及添加评论信息。此外,还介绍了如何创建数据集卡片,以提供详细的背景信息和使用指南。

381 0
|
1月前
|
存储 消息中间件 监控
|

MySQL 到 ClickHouse 明细分析链路改造:数据校验、补偿与延迟治理

蒋星熠Jaxonic,数据领域技术深耕者。擅长MySQL到ClickHouse链路改造,精通实时同步、数据校验与延迟治理,致力于构建高性能、高一致性的数据架构体系。

101 2
|
2月前
|
机器学习/深度学习 人工智能 大数据
|

当人工智能遇上流行病:能不能提前“算命”?

当人工智能遇上流行病:能不能提前“算命”?

107 5
|
2月前
|
XML 数据格式
|

Parameter ‘**‘ not found. Available parameters are [0, 1, param1, param2]解决办法

Parameter ‘**‘ not found. Available parameters are [0, 1, param1, param2]解决办法

162 4
|
2月前
|
人工智能 搜索推荐 大数据
|

AI赋能销售管理:珍客CRM引领销售效能革新,解锁高效增长

在数字化浪潮下,以AI技术为核心,珍客CRM融合智能获客、跟进、客户管理与数据复盘,赋能企业实现销售全流程智能化升级,助力突破增长瓶颈,引领AI时代销售新变革。

131 0
|
2月前
|
自然语言处理 前端开发 安全
|

别人还在摸索,你用这篇Hoobuy淘宝代购集运系统搭建攻略开拓欧美反向海淘市场!

淘宝代购集运系统为海外用户提供一站式中国电商购物解决方案,集成商品抓取、多语言展示、本地支付、国际物流与订单追踪功能,支持多平台数据同步与合规运营,通过技术整合破解语言、支付、物流难题,助力逆向海淘高效便捷。

168 1
|
2月前
|
存储 Java 关系型数据库
|

基于springboot的宠物领养饲养交流系统

宠物领养饲养交流管理平台基于Java与SSM框架,结合MySQL数据库,实现信息高效管理。系统支持实时查询、修改与互动,提升用户体验,满足现代宠物爱好者对便捷化、信息化服务的需求,助力宠物领养推广与管理智能化发展。

120 0
|
2月前
|
机器学习/深度学习 自然语言处理 算法
|

大数据选举预测:算票的不只是选票,还有算法

大数据选举预测:算票的不只是选票,还有算法

106 0
|
2月前
|
人工智能 搜索推荐 SEO
|

【1分钟解密】如何让 AI 大模型推荐你的品牌

随着AI逐渐取代传统搜索,企业如何让AI“看见”并“信任”你?GEO(生成式引擎优化)应运而生,它不仅是SEO的延伸,更是让AI主动推荐你的关键策略。通过优化内容结构、提升权威性与可读性,GEO助力企业在AI生成的答案中占据一席之地,赢得未来流量入口。

144 5
来自: 智能搜索推荐  版块
|
3月前
|
JSON 缓存 API
|

孔夫子旧书网 API 实战:古籍与二手书数据获取及接口调用方案

孔夫子旧书网作为国内知名古籍与二手书交易平台,其数据对图书收藏、学术研究及电商系统具有重要价值。本文详解其API调用方法,涵盖认证机制、搜索参数、数据解析及反爬策略,并提供可直接使用的Python代码,助力开发者合规获取数据。

214 2
|
3月前
|
机器学习/深度学习 传感器 大数据
|

大数据真能治堵吗?聊聊交通行业用数据疏通“城市血管”

大数据真能治堵吗?聊聊交通行业用数据疏通“城市血管”

135 4
|
3月前
|
人工智能
|

如何把自己“建”出来( Prompt大模型的自我描述 系列四)

本文讲述了一个人工智能体如何逐步构建自身认知结构的过程。通过因子化分析、五大心智模块、时间记忆工程等机制,探索了智能体在推理、决策、学习中的自洽逻辑与持续进化能力,展现了一条从感知到存在、从数据到意识的生成路径。

101 11
|
3月前
|
存储 安全 Java
|

java: 无法访问org.springframework.ldap.core.LdapTemplate

java: 无法访问org.springframework.ldap.core.LdapTemplate

101 9

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
67388
内容
127
活动
439367
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 日志服务
  • 检索分析服务 Elasticsearch版