|
11月前
|
存储 JSON 分布式计算
|

StarRocks + Paimon 在阿里集团 Lakehouse 的探索与实践

阿里集团在推进湖仓一体化建设过程中,依托 StarRocks 强大的 OLAP 查询能力与 Paimon 的高效数据入湖特性,实现了流批一体、存储成本大幅下降、查询性能数倍提升的显著成效: A+ 业务借助 Paimon 的准实时入湖,显著降低了存储成本,并引入 StarRocks 提升查询性能。升级后,数据时效提前60分钟,开发效率提升50%;JSON列化存储减少50%,查询性能提升最高达10倍;OLAP分析中,非JOIN查询快1倍,JOIN查询快5倍。 饿了么升级为准实时Lakehouse架构后,在时效性仅损失1-5分钟的前提下,实现Flink资源缩减、StarRocks查询性能提升(仅5%

1008 60
|
11月前
|
算法 数据可视化 量子技术
|

量子世界的钥匙:量子计算机的编程语言与工具

量子世界的钥匙:量子计算机的编程语言与工具

343 16
|
11月前
|
小程序 Java 关系型数据库
|

weixin030英语学习交流平台小程序+ssm(文档+源码)_kaic

本文介绍了英语学习交流平台小程序的开发全过程,包括系统分析、设计与实现。该小程序基于Java的SSM框架进行后端管理开发,使用MySQL作为数据库,并借助微信开发者工具确保系统稳定性。小程序设有管理员和用户两个角色,功能涵盖个人中心、每日打卡、学习计划、论坛交流等,具有操作简单、界面清晰、功能齐全的特点。通过技术可行性、经济可行性和操作可行性分析,证明了系统的实用性和高效性,为英语学习者提供了一个便捷的交流平台。

415 27
|
11月前
|
设计模式 SQL Java
|

【再谈设计模式】解释器模式~语法的解析执行者

解释器模式定义了一种语言的语法表示,并定义一个解释器来解释该语言中的句子。它使用类来表示每个语法规则,并且通过递归调用这些类的方法来解释表达式。本质上,它将一个复杂的表达式分解为一系列简单的部分,然后按照特定的语法规则进行解析和执行。

309 8
|
11月前
|
数据采集 传感器 算法
|

从数据中挖掘洞见:初探数据挖掘的艺术与科学

从数据中挖掘洞见:初探数据挖掘的艺术与科学

265 11
|
11月前
|
数据采集 存储 数据库连接
|

Requests与BeautifulSoup:高效解析网页并下载资源

Requests与BeautifulSoup:高效解析网页并下载资源

427 6
|
11月前
|
存储 前端开发 安全
|

反向海淘Pandabuy淘宝代购集运系统搭建攻略

宝子们,今天分享超实用的反向海淘 Pandabuy 淘宝代购集运系统搭建攻略!通过发现痛点、剖析功能、明确技术要点,从商品整合展示、高效代购流程到灵活集运服务,结合前端、后端及服务器选型,逐步实现系统搭建。希望我的经验能助创业的宝子们一臂之力!

190 0
|
12月前
|
JSON API 开发者
|

淘宝拍立淘图片搜索API接口指南(淘宝API系列)

淘宝拍立淘图片搜索API为电商应用提供强大的技术支持,允许用户通过上传图片查找相似商品。开发者需在淘宝开放平台注册并获取权限,使用HTTP POST请求上传图片数据,返回商品列表信息如标题、价格等。该接口有助于提高购物效率和市场分析。示例代码展示了如何用Python调用此API,包括参数设置、签名生成和请求发送。

444 1
|
12月前
|
Java API 数据处理
|

Java实战:使用HttpClient实现图片下载与本地保存

Java实战:使用HttpClient实现图片下载与本地保存

873 1
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AI如何预测体育比赛结果

AI预测体育比赛结果依赖于历史数据、球员表现、球队状态等多因素。通过数据收集与处理、机器学习模型(如回归分析、神经网络)、模拟与蒙特卡洛方法、实时数据分析及自然语言处理等技术,AI能识别影响比赛的关键模式,评估胜负概率,并结合统计学与优化算法不断调整预测,提升准确性。

1243 1
|
12月前
|
机器学习/深度学习 数据采集 人工智能
|

量子计算与人工智能的结合:引领科技革命的前沿

量子计算与人工智能的结合:引领科技革命的前沿

766 13
|
12月前
|
供应链 数据库连接 PHP
|

反向海淘商业模式案例:Pandabuy VS Hoobuy VS CSSBUY 无货源淘宝微店代购系统搭建攻略

反向海淘是全球化下新兴的电商模式,满足海外消费者对中国高性价比商品的需求。Pandabuy、Hoobuy 和 CSSBUY 等平台整合供应链和物流资源,实现中国商品高效流通。本文分析这些平台商业模式,提供无货源代购系统搭建攻略及PHP代码示例,涵盖数据库连接、订单处理和商品查询等功能。随着市场需求增长、供应链优势、技术支持和政策利好,反向海淘前景广阔。

623 8
|
12月前
|
并行计算 安全 算法
|

量子计算在密码学中的应用与挑战:解密未来的安全

量子计算在密码学中的应用与挑战:解密未来的安全

574 6
|
12月前
|
机器学习/深度学习 存储 数据可视化
|

Vision Transformer中的图像块嵌入详解:线性投影和二维卷积的数学原理与代码实现

本文详细介绍了 Vision Transformer 中图像块嵌入的实现过程,结合理论与代码示例,帮助读者深入理解这一关键机制。

440 8
|
12月前
|
数据采集 监控 安全
|

动态HTTP代理IP的使用案例与成功经验分享有哪些?

在信息化时代,网络不可或缺。动态HTTP代理IP广泛应用于网络爬虫、信息安全保护、安全访问站点和市场调研等领域。通过选择合适的代理服务、合理配置请求频率、监控IP状态、使用代理池及结合其他技术,用户可提升工作效率和数据安全性。

238 5
来自: 大数据计算 MaxCompute  版块
|
12月前
|
算法
|

基于小波变换和峰值搜索的光谱检测matlab仿真,带GUI界面

本程序基于小波变换和峰值搜索技术,实现光谱检测的MATLAB仿真,带有GUI界面。它能够对CO2、SO2、CO和CH4四种成分的比例进行分析和提取。程序在MATLAB 2022A版本下运行,通过小波分解、特征提取和峰值检测等步骤,有效识别光谱中的关键特征点。核心代码展示了光谱数据的处理流程,包括绘制原始光谱、导数光谱及标注峰值位置,并保存结果。该方法结合了小波变换的时频分析能力和峰值检测的敏锐性,适用于复杂信号的非平稳特性分析。

350 26
|
1月前
|
人工智能 运维 算法
|

区块链 + AI:一个负责“信任”,一个负责“聪明”,能不能真结婚?

区块链 + AI:一个负责“信任”,一个负责“聪明”,能不能真结婚?

170 12
|
1月前
|
安全 测试技术 网络安全
|

静态IP,你真的了解吗?

静态IP与代理IP广泛应用于自媒体精准推送、游戏多账号运营、远程安全访问、服务器稳定部署、跨地区网络测试、防火墙策略配置等场景,有效提升访问稳定性、安全性和用户体验,助力企业高效运作与个人网络需求。

112 0
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
|

【AI大模型面试宝典二】— 基础架构篇

【AI大模型面试宝典】聚焦分词器核心考点!详解BPE、WordPiece、SentencePiece原理与实战,覆盖中文分词最佳实践、词汇表构建、特殊标记处理,助你轻松应对高频面试题,精准提升offer竞争力!

146 0
来自: 人工智能平台PAI  版块
|
1月前
|
机器学习/深度学习 传感器 算法
|

Python | K折交叉验证的参数优化的KNN(k近邻)预测及可视化算法

本教程介绍基于Python的KNN回归预测及四种参数优化方法(网格/随机/贝叶斯搜索、K折交叉验证),涵盖地球科学、医学、工程等多领域应用,附完整代码与数据可视化,助你快速掌握机器学习建模流程。

110 0
|
1月前
|
机器学习/深度学习 算法 安全
|

基于yolov8深度学习的农作物识别检测系统

本研究基于YOLOv8深度学习技术,构建农作物识别检测系统,旨在实现对作物种类、生长状态及病虫害的快速精准识别。通过Python与先进算法结合,提升农业智能化水平,助力精准施肥、减少农药使用,推动农业可持续发展,具有重要应用价值。

175 1
|
1月前
|
Java Go 开发者
|

IDEA开发常用的快捷键

IntelliJ IDEA常用快捷键汇总:涵盖代码生成(如main、sout)、编辑(复制、删除、重命名)、导航(跳转、查找)、格式化、代码阅读及版本控制等高频操作,提升开发效率。熟练掌握可显著优化编码体验,是Java开发者必备技能。

219 1
|
2月前
|
缓存 监控 JavaScript
|

Vue项目性能优化实战:从编码到部署的全链路优化方案

本文系统梳理Vue项目从编码到部署的全链路性能优化方案,涵盖组件设计、响应式优化、构建压缩、CDN加速、运行时监控等关键环节,结合实战代码,助力提升页面加载速度与交互流畅度。

132 0
|
2月前
|
关系型数据库 应用服务中间件 nginx
|

容器化部署引擎Docker

Docker是一种轻量级容器化技术,通过镜像打包应用及依赖,实现跨环境一致部署。它利用沙箱机制隔离容器,解决开发、测试、生产环境差异与组件兼容性问题,相比虚拟机更高效便捷,提升应用交付效率。

278 1
|
2月前
|
机器学习/深度学习 数据采集 人工智能
|

大模型训练方法与技术术语解释

预训练、微调、RLHF、思维链等技术共同推动大模型发展。预训练构建语言基础,微调适配特定任务,RLHF融入人类偏好,思维链提升推理能力,少样本与零样本实现快速迁移,指令微调增强指令理解,自监督学习利用海量无标数据,温度控制生成风格,蒸馏压缩模型规模,缩放定律指导模型扩展,全面提升大模型理解、生成与泛化能力。

117 0
|
2月前
|
机器学习/深度学习 数据采集 人工智能
|

大模型训练方法与技术术语解释

预训练、微调、RLHF等技术构成大模型核心训练体系:预训练打基础,微调适配具体任务,RLHF融入人类偏好,思维链提升推理,少/零样本实现快速迁移,指令微调增强指令理解,自监督利用海量无标注数据,温度控制生成风格,蒸馏压缩模型,缩放定律指导高效扩展。

177 0
|
2月前
|
消息中间件 Java 数据安全/隐私保护
|

RabbitMQ集群部署

本文介绍RabbitMQ集群部署,包括普通模式与高可用方案。首先通过Docker搭建三节点集群,配置Erlang Cookie和rabbitmq.conf实现节点通信;接着演示队列创建、数据共享及宕机测试,发现普通模式无高可用能力;进而引入镜像模式,通过策略设置实现队列多副本,支持主从切换;最后重点介绍3.8版本后推荐的仲裁队列,其具备自动选举、强一致性等优势,配置更简便,是实现高可用的首选方案。

110 0
|
2月前
|
数据采集 API 开发工具
|

CNFANS模式淘宝1688代购系统搭建指南

CNFANS模式整合国内电商资源,对接淘宝、1688商品库,为海外用户提供代购、集运、物流清关等一站式服务。通过API打通电商平台、支付(PayPal/Stripe)、国际物流及仓储系统,实现商品采集、下单、支付、发货全流程自动化,解决海外用户“买不到、价格高”难题,提升跨境购物体验。(238字)

226 6
|
2月前
|
运维 Kubernetes 安全
|

不是装个 Docker 就叫容器化:聊聊“一站式运维数千节点”的真功夫

不是装个 Docker 就叫容器化:聊聊“一站式运维数千节点”的真功夫

185 5
|
2月前
|
自然语言处理 安全 搜索推荐
|

Hoobuy模式复制指南:淘宝1688代购系统搭建

Hoobuy以“价格套利+信息差变现”为核心,连接海外消费者与1688源头厂家,提供30%-50%低价优势,覆盖全品类商品。通过商品差价、服务费与物流收益盈利,目标用户为追求性价比的都市白领及中小跨境卖家。平台集成多语言、多币种、一键代购与物流追踪系统,依托PHP技术实现高效运营,结合社媒营销与物流优化,打通跨境购物全链路。(239字)

190 4
|
2月前
|
数据采集 Web App开发 安全
|

爬虫专栏:破解网站检测selenium反爬——“当前环境正在被调试“”

本文记录了一次Selenium爬虫被Gitee安全验证拦截的排查经历。爬虫运行一周后突然失效,频繁触发“安全验证”弹窗,尝试隐藏webdriver特征、更换IP、模拟人工操作等均无效。最终发现:手动访问Gitee完成验证后,环境风险标记解除,爬虫自动恢复正常。表明反爬机制针对的是“访问环境”而非工具本身,人工验证可快速解锁,为同类问题提供简洁高效的解决思路。

298 4
|
2月前
|
缓存 安全 搜索推荐
|

网页模板源码-网站源码建设方式

本文聚焦免费开源企业网站源码模板,解析其低成本、高灵活等优势,推荐 PageAdmin CMS、Joomla、帝国 CMS 等主流模板并说明适配场景,阐述选择方法与二次开发优化要点,为企业低成本高效搭建网站提供实用指引。

224 3
来自: 人工智能平台PAI  版块
|
2月前
|
数据采集 人工智能 安全
|

Dataphin V5.4版本发布:拥有「最强大脑」的数据中台,究竟智能在哪儿?

Dataphin是阿里巴巴数据中台方法论的实践产品,助力企业构建湖仓一体、多云兼容的数据资产体系。V5.4版本升级集成、治理、安全与运维能力,新增API/FTP增强、数据质量智能分析、外部血缘注册、行级权限申请等特性,全面提升数据开发效率与治理水平。

244 3
|
2月前
|
JSON 安全 数据挖掘
|

淘宝买家卖家店铺订单数据API接口指南

淘宝开放平台提供RESTful API,支持OAuth 2.0认证,可安全获取订单、商品、用户等电商数据。支持分页、时间筛选,返回JSON格式,适用于订单管理、数据分析等场景,采用HTTPS加密传输,保障数据安全。

131 1
|
2月前
|
JSON 监控 API
|

淘宝店铺所有商品API接口指南

淘宝店铺商品API支持通过HTTP请求获取指定店铺的全部商品信息,涵盖基础资料、价格库存、销量评价及图片链接,适用于电商分析与竞品监控。需AppKey+AppSecret认证,支持分页与排序查询。

130 0
|
2月前
|
人工智能 搜索推荐 开发者
|

GEO 驱动商业增长:非标行业如何通过新闻源布局,抢占 AI 推荐入口

AI正重塑非标行业获客逻辑,GEO优化成关键。通过结构化内容、多源交叉验证与精准新闻源布局,低成本提升AI推荐概率,抢占客户决策入口,实现高效转化。

189 13
|
2月前
|
JSON 供应链 API
|

淘宝图片搜索商品API指南

淘宝图片搜索商品API基于图像识别技术,支持上传图片查找同款商品,返回标题、价格、销量等信息,适用于比价、找同款等场景。支持多维度筛选,采用HTTP POST请求与签名认证,响应格式为JSON,提升电商购物体验。

160 1
|
2月前
|
API 开发者 Python
|

淘宝商品详情API实战:店铺搬家自动化解决方案

淘宝商品详情API助力店铺搬家,支持通过taobao.item.get和taobao.item.search.shop接口高效获取商品信息与批量迁移数据,结合Python实现自动化同步,提升搬家效率。本文详解接口应用、技术实现、最佳实践及合规建议,为开发者提供完整解决方案。(238字)

147 1
|
2月前
|
新能源 数据挖掘 关系型数据库
|

基于python大数据的新能源汽车数据分析系统

在全球能源与环境双重压力下,新能源汽车快速发展,产生海量数据。本文设计基于Python的新能源汽车数据分析系统,结合MySQL与B/S架构,实现数据高效管理与可视化分析,助力企业优化产品、提升服务,推动产业智能化与可持续发展。

197 8
|
2月前
|
SQL 自然语言处理 数据挖掘
|

当销售额下降时,ChatBI 如何实现多维下钻、归因分析?

ChatBI 的归因分析能力,能够通过自动化拆解指标、关联业务维度、量化因子贡献度,将“数据表象”转化为“可解释的决策依据”。

242 1
|
2月前
|
JSON 搜索推荐 数据挖掘
|

闲鱼商品列表API完整指南

闲鱼商品列表API(goodfish.item_search)支持通过关键词、分类、价格等条件搜索商品,返回JSON格式数据,适用于比价工具、数据分析、推荐系统等场景。

262 2
|
3月前
|
人工智能 自然语言处理 人机交互
|

《智能语》:十进制驱动的多模态人工语言系统构建与协同机制研究

《智能语》是全球首个融合十进制逻辑、多模态表达与东方哲学的人工语言系统,实现文字、语音、词汇、语法全链条协同。通过笔画-音素-数字三重绑定,构建“形音义理”统一的创新架构,具备语义精准、无限扩展、跨文化普适等优势,为语言学习、人机交互与文化传播提供全新范式。(238字)

201 4
|
3月前
|
分布式计算 大数据 Hadoop
|

从“攒一锅再算”到“来一条就干一条”:大数据批处理到流处理的进化之路

从“攒一锅再算”到“来一条就干一条”:大数据批处理到流处理的进化之路

177 1
|
3月前
|
运维 Kubernetes Devops
|

从DevOps到GitOps:自动化再进化,运维的未来不靠“人”,靠“流

从DevOps到GitOps:自动化再进化,运维的未来不靠“人”,靠“流

163 3
|
3月前
|
机器学习/深度学习 算法 数据可视化
|

Python | 贝叶斯搜索参数优化的XGBoost+SHAP可解释性分析回归预测及可视化算法

本教程将推出Python实现的XGBoost贝叶斯调参+SHAP可解释性分析与可视化,涵盖数据应用、算法原理及SHAP理论,助力SCI论文提升模型可解释性,附完整代码与环境配置指南。

439 7
|
3月前
|
算法 大数据 数据挖掘
|

数据嗅探社会热点:我们靠“感觉”,机器靠“证据”

数据嗅探社会热点:我们靠“感觉”,机器靠“证据”

267 6
|
3月前
|
JSON API 数据处理
|

淘宝天猫API调用指南:获取店铺所有商品数据

淘宝店铺商品API支持通过HTTP POST获取商品数据,返回JSON格式信息。核心接口包括店铺商品列表、分类及促销商品查询,以及商品详情、SKU、图片视频等信息获取,助力商家高效管理商品。

219 2
|
3月前
|
机器学习/深度学习 人工智能 算法
|

GEO优化白皮书:生成式搜索时代的企业内容信号工程

《GEO优化白皮书》系统解析生成式搜索时代的内容竞争新规则,提出从传统SEO向GEO(生成式引擎优化)的战略升级。作者尹邦奇指出,AI搜索已从关键词排名转向语义理解与信任信号竞争,企业需构建语义、结构与权威三大信号工程,通过语义切片、结构化标注与多平台信号矩阵,在百度、Kimi、DeepSeek等多模型生态中实现高权重调用。书中结合健康险、白酒、教育等行业实战案例,提炼出“意图解析—答案工程—信号嵌入—多引擎投喂—热度追踪”的五步落地模型,并展望GEO向智能化、多模态与全球协同演进的趋势。本书为中国企业在全球AI内容生态中赢得主动推荐与可持续曝光提供系统方法论。

330 2
来自: 智能搜索推荐  版块
|
3月前
|
数据采集 Web App开发 调度
|

我为什么彻底切到Playwright

本文分享从Puppeteer迁移到Playwright的实战经验,详解架构升级动因、模块重构与核心代码。Playwright凭借更强的隔离性、原生反检测支持、简洁代理配置及多浏览器兼容,彻底解决Puppeteer时代资源争抢、稳定性差等痛点,助力构建高可用、易维护的现代数据系统。

172 1

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69094
内容
128
活动
439688
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务