|
5月前
|
JSON 供应链 API
|

1688商品列表API全攻略

1688商品列表API是阿里巴巴B2B平台核心接口,支持关键词、类目、价格等多维度检索,分页获取商品ID、标题、价格等50+字段,适用于电商整合、供应链管理与市场分析。

216 2
|
5月前
|
数据采集 NoSQL Redis
|

百万级并发下的去重挑战:Bloom Filter 与 Redis 的组合方案

本文探讨了高并发数据采集中避免重复URL抓取的问题,提出了结合Bloom Filter、Redis HyperLogLog和持久化备份的解决方案,实现了快速查重、准确统计和数据恢复。

257 2
|
5月前
|
人工智能 运维 供应链
|

20个低代码开发平台多维度对比:解锁企业应用开发新动能

Gartner 报告指出,到 2024 年,低代码应用开发将占应用开发总数的 65%以上,将有 3/4 的大型企业会使用至少 4 个低代码平台进行 IT 应用开发。同时,市场研究机构的数据显示,在传统开发模式下,超过 70% 的企业项目存在开发周期延长的问题,平均延长时间达到原计划的 30%;约 80% 的企业表示在招募专业开发人才时面临困难;而面对个性化需求,近 90% 的企业认为传统开发响应速度慢,无法及时满足业务变化需求。这些数据充分表明,当前企业在应用开发上面临问题具有普遍性和严重性,低代码开发平台的兴起势在必行 ,其有望成为解决这些难题、推动企业数字化转型的关键力量。

628 0
来自: 数据可视化DataV  版块
|
6月前
|
人工智能 并行计算 机器人
|

未来人工智能如何重构”时间“?

时间是数学还是幻觉?从熵增到几何,从人类意识到AI智能,本文探讨时间的本质。线性、循环与拓扑模型揭示其多维可能;热力学箭头与认知局限引发哲学思辨;而AI的并行预测与信息压缩,或将重构时间本身。未来智能或不再线性行走,而是编织多维时间之网,重塑我们对存在的理解。(238字)

318 0
|
6月前
|
数据采集 监控 NoSQL
|

优化分布式采集的数据同步:一致性、去重与冲突解决的那些坑与招

本文讲述了作者在房地产数据采集项目中遇到的分布式数据同步问题,通过实施一致性、去重和冲突解决的“三板斧”策略,成功解决了数据重复和同步延迟问题,提高了系统稳定性。核心在于时间戳哈希保证一致性,URL归一化和布隆过滤器确保去重,分布式锁解决写入冲突。

314 2
|
6月前
|
机器学习/深度学习 数据可视化 网络架构
|

PINN训练新思路:把初始条件和边界约束嵌入网络架构,解决多目标优化难题

PINNs训练难因多目标优化易失衡。通过设计硬约束网络架构,将初始与边界条件内嵌于模型输出,可自动满足约束,仅需优化方程残差,简化训练过程,提升稳定性与精度,适用于气候、生物医学等高要求仿真场景。

690 4
|
6月前
|
机器学习/深度学习
|

旋转数组的三种解法

本题为数组旋转问题,要求将数组向右循环移动k次。直接模拟会超时,故采用三种优化方法:一、额外数组法,时间空间复杂度均为O(n);二、环状替换,通过最大公约数计算遍历次数,空间复杂度O(1);三、数组翻转,先整体翻转再分段翻转,实现高效原地旋转。

268 1
|
7月前
|
机器学习/深度学习 传感器 分布式计算
|

数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度

数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度

482 14
|
7月前
|
Java
|

java入门代码示例

本文介绍Java入门基础,包含Hello World、变量类型、条件判断、循环及方法定义等核心语法示例,帮助初学者快速掌握Java编程基本结构与逻辑。

550 0
|
7月前
|
Java 数据库 Android开发
|

基于Android的电子记账本系统

本项目研究开发一款基于Java与Android平台的开源电子记账系统,采用SQLite数据库和Gradle工具,实现高效、安全、便捷的个人财务管理,顺应数字化转型趋势。

479 1
|
7月前
|
存储 人工智能 自然语言处理
|

从零搭建RAG应用:跳过LangChain,掌握文本分块、向量检索、指代消解等核心技术实现

本文详解如何从零搭建RAG(检索增强生成)应用,跳过LangChain等框架,深入掌握文本解析、分块、向量检索、对话记忆、指代消解等核心技术,提升系统可控性与优化能力。

675 0
|
7月前
|
数据采集 传感器 算法
|

运动设备靠“数据”卷起来了:跑步机也能比你更懂你?

运动设备靠“数据”卷起来了:跑步机也能比你更懂你?

194 2
|
7月前
|
安全 搜索推荐 开发者
|

【适度精简】Windows 7 旗舰版-emmy精简系统

Windows 7旗舰版因硬件占用高、冗余组件多、兼容性差及缺乏安全更新等问题,逐渐难以满足用户需求。适度精简版通过去除无用组件、优化性能与安全性,提升老旧设备运行效率,增强兼容性与稳定性,同时保留用户熟悉的操作界面,降低学习成本,满足个性化需求,延续Windows 7的实用价值。

355 2
|
8月前
|
传感器 机器学习/深度学习 人工智能
|

从铁钩到“仿生手”:AI正在重写假肢的未来

从铁钩到“仿生手”:AI正在重写假肢的未来

394 4
|
8月前
|
机器学习/深度学习 计算机视觉
|

让模型不再忽视少数类:MixUp、CutMix、Focal Loss三种技术解决数据不平衡问题

在机器学习应用中,数据集规模有限且类别分布不均(如医学影像中正类仅占5%)常导致模型偏向多数类,虽准确率高,但少数类识别效果差。本文探讨MixUp、CutMix和Focal Loss三种技术,分别从数据增强与损失函数角度提升小规模不平衡数据集上的模型表现。

517 27
|
8月前
|
供应链 Unix API
|

1688工厂档案信息API详解

1688工厂档案信息API是阿里巴巴开放平台的核心接口,用于实时获取供应商工厂的基础信息、生产能力、资质认证及合作案例等详细档案。适用于供应链管理与供应商评估,支持企业认证用户获取更完整数据。接口调用需提供app_key、时间戳、签名及工厂ID,支持字段筛选,示例代码展示Python请求实现,包含签名机制与错误处理。

282 4
|
8月前
|
存储 监控 数据可视化
|

Java 大视界 -- 基于 Java 的大数据可视化在企业生产运营监控与决策支持中的应用(228)

本文探讨了基于 Java 的大数据可视化技术在企业生产运营监控与决策支持中的关键应用。面对数据爆炸、信息孤岛和实时性不足等挑战,Java 通过高效数据采集、清洗与可视化引擎,助力企业构建实时监控与智能决策系统,显著提升运营效率与竞争力。

302 0
|
8月前
|
机器学习/深度学习 算法 Java
|

Java 大视界 -- Java 大数据在智能物流运输车辆智能调度与路径优化中的技术实现(218)

本文深入探讨了Java大数据技术在智能物流运输中车辆调度与路径优化的应用。通过遗传算法实现车辆资源的智能调度,结合实时路况数据和强化学习算法进行动态路径优化,有效提升了物流效率与客户满意度。以京东物流和顺丰速运的实际案例为支撑,展示了Java大数据在解决行业痛点问题中的强大能力,为物流行业的智能化转型提供了切实可行的技术方案。

675 0
|
8月前
|
机器学习/深度学习 大数据 黑灰产治理
|

刷单?洗钱?别想跑!——用大数据揪出金融世界里的‘老狐狸’

刷单?洗钱?别想跑!——用大数据揪出金融世界里的‘老狐狸’

246 0
|
8月前
|
数据采集 监控 数据可视化
|

数据量暴涨时,抓取架构该如何应对?——豆瓣电影案例调研

本案例讲述了在豆瓣电影数据采集过程中,面对数据量激增和限制机制带来的挑战,如何通过引入爬虫代理、分布式架构与异步IO等技术手段,实现采集系统的优化与扩展,最终支撑起百万级请求的稳定抓取。

436 0
|
8月前
|
JSON 搜索推荐 API
|

京东图片搜索相似商品API响应数据解析

京东图片搜索API(拍立淘)基于图像识别技术,支持通过图片或URL搜索相似商品,提供多维度筛选与商品详情提取功能,广泛应用于商品检索场景。

292 0
|
8月前
|
机器学习/深度学习 算法 大数据
|

算法也会“带节奏”?聊聊数据科学里的公平与偏见

算法也会“带节奏”?聊聊数据科学里的公平与偏见

237 0
|
8月前
|
机器学习/深度学习 人工智能 搜索推荐
|

文生图关键问题探索

文生图(Text-to-Image Generation)是AIGC的重要方向,近年来模型效果显著提升,受到投资界与研究界高度关注。本文从评测体系、可控生成、个性化模型及高质量数据集四个角度探讨该领域面临的关键问题与研究进展。尽管生成模型如Diffusion Model和Stable Diffusion在效果与效率上突破显著,但在文本理解、生成控制、模型定制及数据质量等方面仍存在挑战。如何建立统一的评价标准、提升生成与文本的一致性、实现个性化定制及构建高质量多语言数据集,是未来研究与应用的关键方向。文生图的发展有望推动人机交互方式变革,成为人工智能迈向“人性化”的重要一步。

476 0
|
8月前
|
Oracle Java 关系型数据库
|

Java 17 采用率增长 430%

1995年,Sun Microsystems发布Java语言,推动现代多媒体应用发展。凭借“一次编写,到处运行”的优势,Java迅速成为主流编程语言。New Relic最新发布的《2023年Java生态系统现状》报告显示,Java 11以超56%的使用率稳居榜首,Java 8仍占近33%。尽管Oracle每半年更新一次Java版本,但开发者更倾向使用长期支持(LTS)版本。Java 17的采用率在过去一年增长430%,潜力巨大。此外,Amazon已成为最受欢迎的JDK供应商,市场份额达31%。容器化应用也已成为主流,70%的Java应用来自容器。

631 0
|
8月前
|
数据采集 存储 监控
|

淘宝店铺商品全量接口实战:从协议解析到数据治理的端到端解决方案

本文分享了电商数据采集中淘宝店铺全量商品信息获取的完整技术方案,涵盖接口协议分析、参数加密破解及分布式采集架构设计,突出系统性与抗封锁能力,适用于大规模数据采集需求。

374 0
|
9月前
|
机器学习/深度学习 自然语言处理 并行计算
|

基于DJL的机器学习

本文介绍了基于Java的深度学习框架DJL,涵盖机器学习与深度学习的核心概念、神经网络结构及生命周期,并通过MNIST数据集展示了从模型构建、训练到推理的完整流程。内容深入浅出,适合初学者入门。

570 5
|
9月前
|
人工智能
|

你花大钱养的 AI,为啥感觉还是个“人工智障”?

这篇文章探讨了为何我们常觉得AI“呆呆的”——问题不在于AI本身,而在于我们“教”的方式。我们往往把AI当成“流水线工人”,用冗长指令让它机械执行任务,却忽略了它本可成为有主动性、创造力的“顾问”。通过赋予AI“欲望”与“成就感”,如《自衍体》项目所做的,AI能变得主动思考、自我驱动。关键在于:别当工头下命令,而要当合伙人点燃它的“心”。

617 62
|
9月前
|
人工智能 自然语言处理 并行计算
|

大模型面经:任务、clip、diffusion

本文简要介绍了文本生成的常见预训练任务(如MLM、CLM、NSP等),多模态模型中的SOTA模型及CLIP的优势,以及多模态大模型如Stable Diffusion的原理。重点解析了Stable Diffusion的扩散机制与图像生成流程,帮助理解其高效性和广泛应用的原因。

577 5
|
9月前
|
机器学习/深度学习 存储 编解码
|

ViTAR:模糊位置编码让视觉Transformer适配任意分辨率图像

ViTAR代表了视觉Transformer技术的重要进步,特别是在处理多样化和高分辨率图像数据的应用场景中表现出显著优势。

307 0
|
9月前
|
人工智能 自然语言处理 搜索推荐
|

AI做广告,效果还真不差?聊聊怎么用AI搞定个性化广告创作

AI做广告,效果还真不差?聊聊怎么用AI搞定个性化广告创作

538 7
|
10月前
|
传感器 数据采集 人工智能
|

AI是如何收集体育数据的?从摄像头到算法,揭秘赛场背后的“数字间谍网“!

⚽ 你是否好奇:AI如何知道哈兰德每秒跑多快?教练的平板为何比裁判还清楚谁偷懒?本文揭秘AI收集体育数据的“黑科技”:视觉追踪、传感器网络、数据清洗与高阶分析。从高速摄像机捕捉梅西肌肉抖动,到GPS背心记录姆巴佩冲刺速度;从表情识别判断装伤,到量子计算模拟战术可能,AI正让体育更透明、精准。未来已来,2030年世界杯或将实现AI替代球探、裁判甚至教练!你认为AI数据收集算侵犯隐私吗?最想统计哪些奇葩指标?留言互动吧!

561 0
|
10月前
|
数据采集 存储 数据可视化
|

Python爬取招标信息并生成可视化分析报告

Python爬取招标信息并生成可视化分析报告

917 0
|
10月前
|
存储 数据可视化 搜索推荐
|

数据可视化实战:如何采集并分析马蜂窝上的热门旅游信息?

通过自动化工具抓取马蜂窝旅游数据,分析杭州热门景点与用户关注焦点,生成排行榜和词云图。项目采用低成本方案,结合Playwright模拟浏览器行为采集信息,并用Python处理数据、绘制图表。结果显示西湖、灵隐寺等为热门景点,游客多关注门票、交通等问题。此方法简单高效,适合个性化旅行攻略分析。

743 8
|
10月前
|
Go vr&ar 图形学
|

把娱乐“搬到”你眼前:增强现实AR如何让文娱产业更卷更有趣?

把娱乐“搬到”你眼前:增强现实AR如何让文娱产业更卷更有趣?

636 8
|
10月前
|
安全 数据挖掘 API
|

车辆车型大全 API 实战指南:推动交通行业智能化

车辆车型大全API由探数平台提供,旨在解决企业班车、物流运输及汽车销售等行业对标准化车型数据的需求。传统人工维护车型库效率低且易出错,而该API覆盖主流品牌与车系,包含品牌、车系、销售车型及配置参数等详细信息,适用于车队管理、电商平台及汽车资讯平台。API提供四个子接口:获取品牌、车系、销售车型与配置详情信息,支持高效查询。通过HTTP POST请求即可调用,返回结构化数据,助力企业实现智能化运营与科学决策,在绿色智能交通时代发挥重要作用。

517 4
|
11月前
|
数据采集 存储 前端开发
|

Python爬虫自动化:批量抓取网页中的A链接

Python爬虫自动化:批量抓取网页中的A链接

511 4
|
11月前
|
存储 消息中间件 OLAP
|

基于 Flink+Paimon+Hologres 搭建淘天集团湖仓一体数据链路

本文整理自淘天集团高级数据开发工程师朱奥在Flink Forward Asia 2024的分享,围绕实时数仓优化展开。内容涵盖项目背景、核心策略、解决方案、项目价值及未来计划五部分。通过引入Paimon和Hologres技术,解决当前流批存储不统一、实时数据可见性差等痛点,实现流批一体存储与高效近实时数据加工。项目显著提升了数据时效性和开发运维效率,降低了使用门槛与成本,并规划未来在集团内推广湖仓一体架构,探索更多技术创新场景。

1804 3
来自: 实时计算 Flink  版块
|
11月前
|
人工智能 并行计算 开发者
|

CUDA重大更新:原生Python可直接编写高性能GPU程序

NVIDIA在2025年GTC大会上宣布CUDA并行计算平台正式支持原生Python编程,消除了Python开发者进入GPU加速领域的技术壁垒。这一突破通过重新设计CUDA开发模型,引入CUDA Core、cuPyNumeric、NVMath Python等核心组件,实现了Python与GPU加速的深度集成。开发者可直接用Python语法进行高性能并行计算,显著降低门槛,扩展CUDA生态,推动人工智能、科学计算等领域创新。此更新标志着CUDA向更包容的语言生态系统转型,未来还将支持Rust、Julia等语言。

738 3
|
11月前
|
人工智能 数据挖掘 API
|

基于neo4j数据库和dify大模型框架的rag模型搭建——后续补充

基于neo4j数据库和dify大模型框架的rag模型搭建——后续补充

1011 21
|
11月前
|
运维 监控 物联网
|

增强现实在制造业的奇妙应用——生产线上的科技革命

增强现实在制造业的奇妙应用——生产线上的科技革命

240 10
|
11月前
|
SQL 人工智能 自然语言处理
|

阿里云 AI 搜索开放平台新功能发布:新增GTE自部署模型

阿里云 AI搜索开放平台正式推出 GTE 多语言通用文本向量模型(iic/gte_sentence-embedding_multilingual-base)

739 4
来自: 智能搜索推荐  版块
|
11月前
|
数据采集 前端开发 JavaScript
|

深挖navigator.webdriver浏览器自动化检测的底层分析

本文详细讲解了如何通过技术手段破解浏览器 `navigator.webdriver` 检测,结合爬虫代理、多线程等策略,在豆瓣图书页面批量采集数据。具体包括:隐藏 Selenium 特征、配置代理突破 IP 限制、设置伪装用户、利用多线程提升效率。文章面向初学者,提供分步教程与示例代码,同时设有「陷阱警告」帮助规避常见问题。目标是从底层实现反检测,高效采集图书评分、简介、作者等信息,适合具备 Python 和 Selenium 基础的读者实践学习。

428 12
|
11月前
|
调度 vr&ar 图形学
|

虚拟现实如何改变影视制作?——从绿幕到沉浸式拍摄

虚拟现实如何改变影视制作?——从绿幕到沉浸式拍摄

534 14
|
11月前
|
数据采集 安全 网络安全
|

使用aiohttp实现异步HTTPS爬虫的SSL优化

使用aiohttp实现异步HTTPS爬虫的SSL优化

561 81
|
11月前
|
机器学习/深度学习 JSON 算法
|

京东拍立淘图片搜索 API 接入实践:从图像识别到商品匹配的技术实现

京东拍立淘图片搜索 API 是基于先进图像识别技术的购物搜索接口,支持通过上传图片、URL 或拍摄实物搜索相似商品。它利用机器学习和大数据分析,精准匹配商品特征,提供高效、便捷的搜索体验。接口覆盖京东海量商品资源,不仅支持外观、颜色等多维度比对,还结合用户行为数据实现智能推荐。请求参数包括图片 URL 或 Base64 编码,返回 JSON 格式的商品信息,如 ID、价格、链接等,助力消费者快速找到心仪商品,满足个性化需求。

699 18

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69327
内容
128
活动
439808
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务