|
3月前
|
存储 SQL 分布式计算
|

MaxCompute 聚簇优化推荐原理

基于历史查询智能推荐Clustered表,显著降低计算成本,提升数仓性能。

283 4
来自: 大数据计算 MaxCompute  版块
|
3月前
|
人工智能 运维 搜索推荐
|

元宇宙进课堂?聊聊它如何改造教育系统

元宇宙进课堂?聊聊它如何改造教育系统

154 9
|
3月前
|
SQL 缓存 分布式计算
|

【跨国数仓迁移最佳实践5】MaxCompute近线查询解决方案助力物流电商等实时场景实现高效查询

本系列文章将围绕东南亚头部科技集团的真实迁移历程展开,逐步拆解 BigQuery 迁移至 MaxCompute 过程中的关键挑战与技术创新。本篇为第5篇,解析跨国数仓迁移背后的性能优化技术。 注:客户背景为东南亚头部科技集团,文中用 GoTerra 表示。

202 8
来自: 大数据计算 MaxCompute  版块
|
3月前
|
人工智能 JSON 搜索推荐
|

当AI遇上VR:个性化内容创作的“新次元”革命

当AI遇上VR:个性化内容创作的“新次元”革命

203 0
|
3月前
|
JSON API 数据安全/隐私保护
|

天猫商品详情API 数据解析(附代码)

天猫商品详情API(tmall.item_get)通过商品ID获取标题、价格、库存、图片、SKU等信息,支持高并发,适用于电商数据分析与价格策略优化。接口采用HTTP请求与JSON返回,需AppKey+签名认证。附Python请求示例,含签名验证与异常处理。前往体验:c0b.cc/R4rbK2

153 1
|
4月前
|
传感器 人工智能 边缘计算
|

当无人机遇上5G:远程控制再也不卡了

当无人机遇上5G:远程控制再也不卡了

259 8
|
4月前
|
传感器 边缘计算 机器人
|

5G加持下的工厂:智能制造的“加速器”

5G加持下的工厂:智能制造的“加速器”

132 5
|
4月前
|
JSON 数据挖掘 API
|

小红书笔记评论API数据解析(附代码)

本资源介绍如何通过小红书官方API获取笔记评论数据,包含评论内容、用户信息、点赞数等关键字段。支持分页请求,适用于舆情分析、用户研究及市场调研。提供完整Python调用示例,涵盖请求签名、响应解析等核心流程,助力高效获取结构化评论数据。

311 0
|
4月前
|
运维 算法 5G
|

天上的“WiFi”:低轨卫星互联网正在改变全球通信格局

天上的“WiFi”:低轨卫星互联网正在改变全球通信格局

247 5
|
4月前
|
JSON API 数据格式
|

小红书商品列表API数据解析(附代码)

本内容介绍了小红书商品列表API的用途及调用方式,适用于电商分析与市场研究。接口支持HTTP GET请求,返回JSON格式商品信息,包含标题、价格、销量、商家名称等字段。文中提供了基于Python的完整请求示例,使用requests库实现,并包含请求头设置和参数传递方式,便于开发者快速集成与测试。

123 1
|
4月前
|
JSON 缓存 API
|

孔夫子旧书网 API 实战:古籍与二手书数据获取及接口调用方案

孔夫子旧书网作为国内知名古籍与二手书交易平台,其数据对图书收藏、学术研究及电商系统具有重要价值。本文详解其API调用方法,涵盖认证机制、搜索参数、数据解析及反爬策略,并提供可直接使用的Python代码,助力开发者合规获取数据。

297 2
|
4月前
|
传感器 人工智能 监控
|

戴手环太土了?皮肤植入式传感器才是健康监测的终极形态

戴手环太土了?皮肤植入式传感器才是健康监测的终极形态

218 12
|
4月前
|
前端开发 小程序 搜索推荐
|

什么类型的项目会优先选择Headless CMS

Headless CMS的核心价值在于内容与展示的解耦,当项目需要跨终端、高定制化前端、敏捷迭代或强扩展性时,它会成为更优选择;而在小规模、低预算、内容简单且稳定的场景中,传统CMS则更具实用性。

162 1
|
4月前
|
数据采集 存储 关系型数据库
|

全量抓取还是增量采集?二手房数据采集实战解析

本文以链家二手房数据采集为例,探讨全量抓取与增量采集的优劣与适用场景,并结合代理IP技术实现高效、稳定的爬虫方案。通过SQLite/PostgreSQL存储、内容哈希去重、定时任务调度等手段,构建可持续运行的数据更新与统计系统。适用于房产数据分析、市场监测等场景,兼顾资源效率与数据质量。

277 0
|
4月前
|
搜索推荐 数据挖掘 API
|

微店商品详情API开发指南

本文介绍了如何通过微店的micro.item_get接口获取商品详情,涵盖商品信息、描述、图片及销量等数据,并提供Python调用示例,适用于电商开发、数据分析与个性化推荐场景。

172 6
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
|

ReasonRank:从关键词匹配到逻辑推理,排序准确性大幅超越传统方法

ReasonRank是一种创新段落重排系统,采用自动化数据合成与两阶段训练(监督微调+强化学习),在BRIGHT等测试中超越更大模型,显著提升信息检索中的推理能力。

196 0
|
4月前
|
机器学习/深度学习 人工智能 运维
|

你的手表,不只是看时间的——可穿戴设备的早期疾病预警术

你的手表,不只是看时间的——可穿戴设备的早期疾病预警术

149 0
|
4月前
|
机器学习/深度学习 搜索推荐 数据可视化
|

Java 大视界 -- Java 大数据机器学习模型在电商用户流失预测与留存策略制定中的应用(217)

本文探讨 Java 大数据与机器学习在电商用户流失预测与留存策略中的应用。通过构建高精度预测模型与动态分层策略,助力企业提前识别流失用户、精准触达,实现用户留存率与商业价值双提升,为电商应对用户流失提供技术新思路。

243 0
|
4月前
|
算法 Java 大数据
|

Java 大视界 --Java 大数据在智能医疗远程手术机器人控制与数据传输中的技术支持(215)

本文深入探讨 Java 大数据在智能医疗远程手术机器人控制与数据传输中的关键技术应用,涵盖数据采集、分布式计算、延迟补偿算法、数据压缩与加密传输等内容,并结合多个跨国手术案例,展示 Java 大数据如何赋能远程医疗,实现高精度、低延迟、安全可靠的手术支持,为医疗行业的数字化转型提供坚实技术支撑。

147 0
|
4月前
|
机器学习/深度学习 大数据 黑灰产治理
|

刷单?洗钱?别想跑!——用大数据揪出金融世界里的‘老狐狸’

刷单?洗钱?别想跑!——用大数据揪出金融世界里的‘老狐狸’

135 0
|
4月前
|
Web App开发 存储 缓存
|

markdown编辑器

本Markdown编辑器基于StackEdit改进,新增界面设计、代码高亮、图片拖拽、KaTeX公式、甘特图、多屏编辑、写作模式切换、检查列表等功能,提升写作体验,支持离线使用与多种格式导出。

279 0
|
4月前
|
算法 数据可视化 数据挖掘
|

基于AOA算术优化的KNN数据聚类算法matlab仿真

本程序基于AOA算术优化算法优化KNN聚类,使用Matlab 2022A编写。通过AOA搜索最优特征子集,提升KNN聚类精度,并对比不同特征数量下的聚类效果。包含完整仿真流程与可视化结果展示。

140 0
|
4月前
|
人工智能 自然语言处理 前端开发
|

《10分钟开发电商页!CodeBuddy自然语言转代码实测:程序员效率革命》

CodeBuddy AI编程助手,实现自然语言到代码全流程生成,支持React开发、Figma转代码,提升效率,限时抽奖送体验码!

257 0
来自: 大数据计算 MaxCompute  版块
|
4月前
|
JSON 监控 API
|

京东商品列表API秘籍!轻松获取商品列表数据

京东商品列表API是京东开放平台的核心接口,支持通过编程获取商品数据,适用于电商分析、价格监控等场景。提供关键词搜索、分类筛选、价格区间、排序及分页功能,采用HTTPS请求,返回JSON数据,具备高并发稳定性。附Python请求示例,便于快速集成调用。

167 0
|
4月前
|
人工智能 量子技术 调度
|

别只盯着ChatGPT了,量子计算才是下一个能源“爆点”!

别只盯着ChatGPT了,量子计算才是下一个能源“爆点”!

202 17
|
4月前
|
机器学习/深度学习 运维 Java
|

Java 大视界 -- 基于 Java 的大数据实时流处理在能源行业设备状态监测与故障预测中的应用(210)

本篇文章探讨了基于 Java 的大数据实时流处理技术在能源行业设备状态监测与故障预测中的应用。文章分析了传统能源设备运维的局限性,如人工巡检效率低、数据处理滞后等问题,并引入 Java 大数据技术作为解决方案。通过实时流处理引擎如 Apache Flink,实现多源异构数据的采集、清洗与异常检测,提升了设备监测的实时性与准确性。同时,文章还介绍了数字孪生、边缘计算等前沿技术的融合应用,并结合国家电网和海上风电场的实际案例,展示了 Java 大数据技术在提升运维效率、降低故障风险和节约成本方面的显著效果。

208 0
|
4月前
|
机器学习/深度学习 人工智能 搜索推荐
|

文生图关键问题探索

文生图(Text-to-Image Generation)是AIGC的重要方向,近年来模型效果显著提升,受到投资界与研究界高度关注。本文从评测体系、可控生成、个性化模型及高质量数据集四个角度探讨该领域面临的关键问题与研究进展。尽管生成模型如Diffusion Model和Stable Diffusion在效果与效率上突破显著,但在文本理解、生成控制、模型定制及数据质量等方面仍存在挑战。如何建立统一的评价标准、提升生成与文本的一致性、实现个性化定制及构建高质量多语言数据集,是未来研究与应用的关键方向。文生图的发展有望推动人机交互方式变革,成为人工智能迈向“人性化”的重要一步。

262 0
|
4月前
|
人工智能 自然语言处理 运维
|

【新模型速递】PAI-Model Gallery云上一键部署Kimi K2模型

月之暗面发布开源模型Kimi K2,采用MoE架构,参数达1T,激活参数32B,具备强代码能力及Agent任务处理优势。在编程、工具调用、数学推理测试中表现优异。阿里云PAI-Model Gallery已支持云端部署,提供企业级方案。

332 0
来自: 人工智能平台PAI  版块
|
5月前
|
JSON 搜索推荐 API
|

小红书笔记详情API响应数据解析

小红书开放平台提供笔记详情API,支持获取笔记内容、互动数据及用户信息,适用于品牌营销与市场分析。接口支持HTTP GET/POST请求,返回JSON格式数据。需申请权限并替换参数如note_id与access_token。附Python请求示例,建议添加异常处理。

233 0
|
5月前
|
存储 分布式计算 大数据
|

【赵渝强老师】阿里云大数据存储计算服务:MaxCompute

阿里云MaxCompute是快速、全托管的TB/PB级数据仓库解决方案,提供海量数据存储与计算服务。支持多种计算模型,适用于大规模离线数据分析,具备高安全性、低成本、易用性强等特点,助力企业高效处理大数据。

283 0
来自: 大数据计算 MaxCompute  版块
|
5月前
|
Java 程序员 项目管理
|

Java 程序员不容错过的 Git Flow 全套学习资料及应用方法详解 Git Flow

本文详细介绍了Git Flow技术方案及其在Java项目中的应用实例,涵盖分支管理、版本发布与紧急修复流程,帮助开发者掌握高效的代码管理方法,提升团队协作效率。附示例操作及代码下载链接。

184 0
|
5月前
|
SQL 人工智能 自然语言处理
|

数据 + 模型 驱动 AI Native 应用发展

随着人工智能技术的飞速发展,从生成式人工智能(GenAI)到自主代理人工智能(Agentic AI)的演进,企业面临着构建 AI Native 应用的机遇与挑战。本文将深入探讨 AI 开发模式的转变、企业应用的挑战以及技术架构和开发工具的应用,旨在为读者提供一个全面的视角,以理解如何利用数据和模型驱动 AI Native 应用的发展。

245 0
|
5月前
|
自然语言处理 数据挖掘 数据处理
|

告别低效代码:用对这10个Pandas方法让数据分析效率翻倍

本文将介绍 10 个在数据处理中至关重要的 Pandas 技术模式。这些模式能够显著减少调试时间,提升代码的可维护性,并构建更加清晰的数据处理流水线。

208 3
|
5月前
|
分布式计算 Java 大数据
|

springboot项目集成dolphinscheduler调度器 可拖拽spark任务管理

springboot项目集成dolphinscheduler调度器 可拖拽spark任务管理

336 2
|
5月前
|
机器学习/深度学习 存储 编解码
|

ViTAR:模糊位置编码让视觉Transformer适配任意分辨率图像

ViTAR代表了视觉Transformer技术的重要进步,特别是在处理多样化和高分辨率图像数据的应用场景中表现出显著优势。

174 0
|
5月前
|
SQL 分布式计算 大数据
|

别再迷信“上大数据就能飞”了!大数据项目成败的5个真相

别再迷信“上大数据就能飞”了!大数据项目成败的5个真相

146 6
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
|

原来AI也能“读心术”?——聊聊AI在心理学研究中的那些突破

原来AI也能“读心术”?——聊聊AI在心理学研究中的那些突破

225 1
|
5月前
|
数据安全/隐私保护
|

项目介绍:基于ChartScanAI的crypto currency决策系统

ChartScanAI 是一个基于 GitHub 的增强型加密货币交易策略工具,结合 RSI、EMA、ADX 和 OBV 等技术指标,通过动态权重分配与蜡烛图模式识别,实现多周期(1h、4h、1d、1w)交易信号生成。策略内置市场状态判断、信号加权评分、风险管理(ATR 止损止盈)及仓位控制逻辑,旨在提升交易适应性与收益风险比。

172 1
|
5月前
|
SQL
|

使用sql转换身份证15位-18位

使用sql转换身份证15位-18位

257 1
|
6月前
|
数据可视化 大数据 BI
|

把表格“整活儿”了!用Tableau搞定数据可视化,一眼就能看出门道

把表格“整活儿”了!用Tableau搞定数据可视化,一眼就能看出门道

171 0
|
6月前
|
机器学习/深度学习 监控 安全
|

从实验室到生产线:机器学习模型部署的七大陷阱及PyTorch Serving避坑指南

本文深入探讨了机器学习模型从实验室到生产环境部署过程中常见的七大陷阱,并提供基于PyTorch Serving的解决方案。内容涵盖环境依赖、模型序列化、资源管理、输入处理、监控缺失、安全防护及模型更新等关键环节。通过真实案例分析与代码示例,帮助读者理解部署失败的原因并掌握避坑技巧。同时,文章介绍了高级部署架构、性能优化策略及未来趋势,如Serverless服务和边缘-云协同部署,助力构建稳健高效的模型部署体系。

274 4
|
6月前
|
机器学习/深度学习 运维 监控
|

医疗诊断中的异常检测实战——基于AutoEncoder与One-Class SVM的少样本学习

本文系统性阐述了医疗异常检测的技术革新与工程实现,涵盖从数据处理到模型部署的全流程。针对传统方法标注依赖强、维度灾难及类别不平衡等问题,提出双阶段架构:无监督特征学习结合单分类决策,显著提升早期肺癌检出率37%。文中详细解析了3D Residual AutoEncoder设计、损失函数优化及核函数选择等关键技术,并通过脑卒中检测案例验证性能优势。最终探讨生产环境下的高性能推理与持续学习机制,为多模态融合和可解释性增强提供前沿展望。该方案在少样本场景下表现出色,AUC提升12.5%,假阳性率降低38%,端到端推理速度达800ms/例以下。

151 4
|
6月前
|
数据采集 人工智能 算法
|

数据没洗干净,分析全白干:聊聊大数据里的“洗澡水”工程

数据没洗干净,分析全白干:聊聊大数据里的“洗澡水”工程

238 1
|
6月前
|
存储 JSON 数据安全/隐私保护
|

移动端跨域防护解析与信息获取对策

本文介绍了移动端数据访问限制机制及突破方法,以BOSS直聘为例,详细解析了其数据结构与接口特性。通过比喻“档案馆安保”生动阐述跨域访问限制原理,如身份验证、客户端识别和IP控制等。提供了基于Python的职位信息自动化获取代码示例,使用`requests`库结合代理服务完成数据提取与存储。同时建议学习移动端通信协议、接口分析工具(如mitmproxy)等内容,强调合规访问的重要性。

128 11
|
6月前
|
存储 自然语言处理 算法
|

Adaptive-k 检索:RAG 系统中自适应上下文长度选择的新方法

本文介绍 Adaptive-k 检索技术,这是一种通过相似性分布分析动态确定最优上下文规模的即插即用方法,该技术在显著降低 token 消耗的同时实现了检索增强生成系统的性能提升。

128 1

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
67713
内容
128
活动
439500
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务