|
10月前
|
人工智能 自然语言处理 网络安全
|

云上玩转Qwen3系列之四:构建AI Search RAG全栈应用

本文介绍如何利用人工智能平台 PAI-LangStudio、Qwen3 大模型与 AI 搜索开放平台结合 Elasticsearch,构建高效、精准的 AI Search RAG 智能检索应用。通过混合检索技术及 Agentic Workflow 编排,实现自然语言驱动的精准查询,并支持灵活扩展与二次开发,满足多样化场景需求。

438 0
|
10月前
|
机器学习/深度学习 人工智能 算法
|

Wi-Fi老是卡?不如试试让“深度学习”来当网络管家!

Wi-Fi老是卡?不如试试让“深度学习”来当网络管家!

430 68
|
10月前
|
JSON 数据可视化 计算机视觉
|

大语言模型也可以进行图像分割:使用Gemini实现工业异物检测完整代码示例

本文将通过一个实际应用场景——工业传送带异物检测,详细介绍如何利用Gemini的图像分割能力构建完整的解决方案。

406 2
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
|

当AI学会“做实验”:自动化科研的下一个奇点?

当AI学会“做实验”:自动化科研的下一个奇点?

248 0
|
11月前
|
SQL JSON 安全
|

Java 8 + 中 Lambda 表达式与 Stream API 的应用解析

摘要:本文介绍了Java 8+核心新特性,包括Lambda表达式与Stream API的集合操作(如过滤统计)、函数式接口的自定义实现、Optional类的空值安全处理、接口默认方法与静态方法的扩展能力,以及Java 9模块化系统的组件管理。每个特性均配有典型应用场景和代码示例,如使用Stream统计字符串长度、Optional处理Map取值、模块化项目的依赖声明等,帮助开发者掌握现代Java的高效编程范式。(150字)

239 1
|
11月前
|
机器学习/深度学习 并行计算 测试技术
|

5倍加速!PAI-EAS在线服务优化:ResNet50模型推理性能调优指南

本文系统分析ResNet50推理性能瓶颈,结合TensorRT加速、模型剪枝、批量推理及CUDA多流并行等技术,实现吞吐量提升56.7倍、延迟降低至22ms,同时优化GPU利用率与服务稳定性,提供完整的生产部署验证方案。

586 13
|
11月前
|
存储 人工智能 运维
|

企业级MLOps落地:基于PAI-Studio构建自动化模型迭代流水线

本文深入解析MLOps落地的核心挑战与解决方案,涵盖技术断层分析、PAI-Studio平台选型、自动化流水线设计及实战构建,全面提升模型迭代效率与稳定性。

520 6
|
11月前
|
人工智能 自然语言处理 前端开发
|

AI + 低代码,程序员的副驾还是替代者?

AI + 低代码,程序员的副驾还是替代者?

433 0
|
11月前
|
传感器 数据采集 人工智能
|

AI是如何收集体育数据的?从摄像头到算法,揭秘赛场背后的“数字间谍网“!

⚽ 你是否好奇:AI如何知道哈兰德每秒跑多快?教练的平板为何比裁判还清楚谁偷懒?本文揭秘AI收集体育数据的“黑科技”:视觉追踪、传感器网络、数据清洗与高阶分析。从高速摄像机捕捉梅西肌肉抖动,到GPS背心记录姆巴佩冲刺速度;从表情识别判断装伤,到量子计算模拟战术可能,AI正让体育更透明、精准。未来已来,2030年世界杯或将实现AI替代球探、裁判甚至教练!你认为AI数据收集算侵犯隐私吗?最想统计哪些奇葩指标?留言互动吧!

640 0
|
11月前
|
机器学习/深度学习 算法
|

基于遗传优化ELM网络的时间序列预测算法matlab仿真

本项目实现了一种基于遗传算法优化的极限学习机(GA-ELM)网络时间序列预测方法。通过对比传统ELM与GA-ELM,验证了参数优化对非线性时间序列预测精度的提升效果。核心程序利用MATLAB 2022A完成,采用遗传算法全局搜索最优权重与偏置,结合ELM快速训练特性,显著提高模型稳定性与准确性。实验结果展示了GA-ELM在复杂数据中的优越表现,误差明显降低。此方法适用于金融、气象等领域的时间序列预测任务。

239 3
|
11月前
|
数据采集 人工智能 算法
|

数据没洗干净,分析全白干:聊聊大数据里的“洗澡水”工程

数据没洗干净,分析全白干:聊聊大数据里的“洗澡水”工程

358 1
|
11月前
|
移动开发 搜索推荐 数据挖掘
|

这个全功能体育直播平台我愿称为观赛神器

熊猫比分是一款专为体育迷打造的全能观赛平台,支持多端同步和高清直播,提供赛事直播、即时比分、新闻资讯等功能。其1080P画质、多路信号源切换及弹幕互动让球迷仿佛身临其境;秒级更新的实时数据覆盖20+赛事类型,自定义关注球队功能确保用户不错过任何关键瞬间。此外,平台采用分布式架构与CDN加速技术,保证高并发下流畅体验,且隐私保护完善。无论是普通球迷还是体育从业者,都能在熊猫比分找到理想中的观赛生态。

268 5
|
11月前
|
API 开发者
|

深入研究:淘宝店铺所有商品API接口详解

淘宝店铺商品API接口(item_search_shop)用于获取指定店铺内所有商品信息,包括商品ID、名称、价格、库存、描述、图片URL等。开发者可通过必填参数shop_id及可选参数(如page、sort、category_id等)实现分页查询、排序和分类筛选功能。响应数据包含状态码、消息、商品总数及详细列表,适用于电商平台与第三方应用展示店铺商品场景。

303 3
|
11月前
|
人工智能 vr&ar 开发工具
|

“别只拿VR打游戏”:虚拟现实的市场前景,远比你想象得大

“别只拿VR打游戏”:虚拟现实的市场前景,远比你想象得大

196 4
|
11月前
|
数据采集 消息中间件 人工智能
|

赛事比分怎么实现实时更新?从采集到推送的“毫秒级“科技揭秘!

实时比分更新背后的技术奥秘,远比你想象的复杂!从数据采集、传输、处理到用户推送,每个环节都充满挑战。情报来源包括官方接口、AI视觉识别和人工录入;传输方式从HTTP轮询到WebSocket,追求毫秒级延迟;数据清洗确保准确性,用户推送注重适配与优先级。开发者还需规避常见坑点,如消息队列、时区转换等。未来,AI预测、边缘计算甚至量子通信将让零延迟成为可能。想了解如何打造像顶级中场般精准、快速且可靠的比分系统吗?本文为你深度拆解!

353 0
|
11月前
|
算法 数据安全/隐私保护
|

基于混沌序列和小波变换层次化编码的遥感图像加密算法matlab仿真

本项目实现了一种基于小波变换层次化编码的遥感图像加密算法,并通过MATLAB2022A进行仿真测试。算法对遥感图像进行小波变换后,利用Logistic混沌映射分别对LL、LH、HL和HH子带加密,完成图像的置乱与扩散处理。核心程序展示了图像灰度化、加密及直方图分析过程,最终验证加密图像的相关性、熵和解密后图像质量等性能指标。通过实验结果(附图展示),证明了该算法在图像安全性与可恢复性方面的有效性。

216 4
|
11月前
|
并行计算 PyTorch 算法框架/工具
|

OpenFold2.0 基于NPU的推理适配与测试

本教程详细介绍了 OpenFold 的环境搭建、代码部署、依赖安装、数据集准备及推理测试全流程。首先通过 Anaconda 创建 Python3.9 环境并配置相关库,接着克隆 OpenFold 代码仓库并安装必要依赖(如 PyTorch、dllogger、hhsuite 等)。随后准备 PDB 数据集与模型参数,调整脚本路径以适配运行环境。最后执行推理脚本完成测试,并针对常见报错提供了解决方案,例如更新 NumPy、SciPy 或调整 GPU 配置等,确保流程顺利运行。

691 8
|
11月前
|
Go vr&ar 图形学
|

把娱乐“搬到”你眼前:增强现实AR如何让文娱产业更卷更有趣?

把娱乐“搬到”你眼前:增强现实AR如何让文娱产业更卷更有趣?

699 8
|
11月前
|
安全 Java 开发者
|

华为仓颉语言初识:并发编程之同步机制(上)

本文介绍了华为仓颉语言中的三种常见线程同步机制:原子操作、互斥锁和条件变量。原子操作(如AtomicInt64)确保多线程下的数据访问安全;可重入互斥锁(ReentrantMutex)通过lock()、unlock()和tryLock()方法解决线程竞争问题;Monitor作为内置锁,扩展了wait()、notify()和notifyAll()功能,用于线程间通信。文章通过代码示例详细解析了每种机制的使用场景与注意事项,帮助开发者快速掌握仓颉语言的同步机制,保障多线程程序的安全性。

229 11
|
11月前
|
数据采集 缓存 自然语言处理
|

NLP驱动网页数据分类与抽取实战

本文探讨了使用NLP技术进行网页商品数据抽取时遇到的三大瓶颈:请求延迟高、结构解析慢和分类精度低,并以目标站点goofish.com为例,展示了传统方法在采集商品信息时的性能问题。通过引入爬虫代理降低封禁概率、模拟真实用户行为优化请求,以及利用关键词提取提升分类准确性,实现了请求成功率从65%提升至98%,平均请求耗时减少72.7%,NLP分类错误率下降73.6%的显著优化效果。最终,代码实现快速抓取并解析商品数据,支持价格统计与关键词分析,为构建智能推荐模型奠定了基础。

275 0
|
11月前
|
Java 数据库连接 API
|

互联网大厂校招 JAVA 工程师笔试题解析及常见考点分析

本文深入解析互联网大厂校招Java工程师笔试题,涵盖基础知识(数据类型、流程控制)、面向对象编程(类与对象、继承与多态)、数据结构与算法(数组、链表、排序算法)、异常处理、集合框架、Java 8+新特性(Lambda表达式、Stream API)、多线程与并发、IO与NIO、数据库操作(JDBC、ORM框架MyBatis)及Spring框架基础(IoC、DI、AOP)。通过技术方案讲解与实例演示,助你掌握核心考点,提升解题能力。

463 2
|
12月前
|
搜索推荐 API UED
|

淘宝/天猫获得淘宝app商品详情原数据 API 返回值的应用

该API专注于商品信息整合与展示,提供基础信息抓取、多媒体内容整合等功能,助力实时同步商品数据,构建丰富的详情页。同时支持数据分析与市场洞察,包括销售趋势分析和竞品对比,优化库存与定价策略。此外,动态促销管理和个性化推荐系统可提升营销效果,而实时库存预警和评价数据可视化则显著增强用户体验,为用户决策提供透明依据,全面提升平台竞争力与用户满意度。

286 3
来自: 大数据计算 MaxCompute  版块
|
12月前
|
机器学习/深度学习 人工智能 大数据
|

特征越多模型越好?这个AI领域的常识可能是错的

特征选择是机器学习中的"减肥秘方",它能帮助模型去除冗余特征,提高性能并降低计算成本。本文深入浅出地介绍特征选择的概念、方法与实践技巧,带你掌握这门让AI模型更高效的"瘦身术"。

393 1
|
12月前
|
传感器 机器学习/深度学习 人工智能
|

VR硬件进化史:从“晕3D”到沉浸式未来

VR硬件进化史:从“晕3D”到沉浸式未来

589 4
|
1月前
|
API 开发工具 C++
|

TorchEasyRec为什么推荐用 OdpsDataset 而不是 OdpsDatasetV1来读数据?

OdpsDataset(默认)是阿里TorchEasyRec推荐的数据集实现,相比旧版OdpsDatasetV1,其性能更优(批量Arrow读取+LZ4压缩)、支持断点续训、分布式协调精准分片、兼容30+复杂类型;V1仅作旧PAI环境兼容保留。

135 6
来自: 人工智能平台PAI  版块
|
1月前
|
数据采集 消息中间件 监控
|

AIGC数据引擎的基石:图库抓取架构从单机到云原生的演进与实战

AIGC领域优化数据采集策略,提升大模型竞争力。初期使用Python脚本搭建单机爬虫,后转向分布式设计,引入代理技术。云原生部署实现弹性伸缩,全链路监控。构建高可用数据采集引擎是关键。

167 4
|
2月前
|
自然语言处理
|

为什么你的 NLP 模型一换语言就“智商归零”?多语言 NLP 的坑,比你想的深得多

为什么你的 NLP 模型一换语言就“智商归零”?多语言 NLP 的坑,比你想的深得多

198 6
|
2月前
|
分布式计算 大数据 流计算
|

你还在手动发包?容器镜像一上,大数据部署直接“起飞”!

你还在手动发包?容器镜像一上,大数据部署直接“起飞”!

168 4
|
2月前
|
SQL 存储 人工智能
|

选型必算 ROI:Aloudata CAN 指标平台如何量化降本增效与统一口径价值

通过统一语义层、声明式定义与智能物化技术,实现可量化的降本增效与 100% 口径一致。

194 5
|
2月前
|
SQL Cloud Native 大数据
|

别再只做“数据仓库苦力”了:聊聊如何用云原生把数据真正做成产品

别再只做“数据仓库苦力”了:聊聊如何用云原生把数据真正做成产品

194 3
|
2月前
|
Web App开发 数据采集 数据可视化
|

我TM真服了!折腾一上午Python自动化,结果被一个缩进搞崩了,差点把电脑砸了

程序员用Python+Selenium+1949自动化工具,打造每日数据采集脚本:自动登录内网、抓取报表、合并Excel、邮件汇报。虽代码粗糙、缩进翻车、稳定性仅80%,却省下每天20分钟手动操作——是摸鱼利器,更是打工人自救实录。(239字)

193 6
|
2月前
|
数据可视化 安全 搜索推荐
|

自动化工具泛滥的当下,我为什么坚持用1949自动化做个人工作流?

本文反思自动化工具泛滥带来的新负担,主张回归“轻量、本地、无感”的自动化理念:拒绝复杂配置与云端依赖,选择事件驱动、隐私安全、可视化编排的桌面工具,让自动化真正服务于人——不是取代思考,而是释放创造力。

130 2
|
2月前
|
数据采集 传感器 数据可视化
|

从一次桌面整理说起,聊聊协同自动化工具1949里的那些看不见的代码逻辑

这是一篇关于轻量级协同自动化实践的随笔:作者用零代码拖拽搭建发票归档流程,遇瓶颈时通过内置Python节点灵活扩展逻辑,实现文件名智能重命名;再逐步串联浏览器、桌面与邮件操作,形成低资源、高适应的多应用自动化链。工具既省去重复劳动,又保留代码自定义空间——像一把“称手的刀”,静默高效,亦可刻下个性印记。(239字)

165 14
|
2月前
|
分布式计算 Kubernetes 数据安全/隐私保护
|

别再裸奔了:Kubernetes + 数据平台访问控制的“防猥琐指南”

别再裸奔了:Kubernetes + 数据平台访问控制的“防猥琐指南”

160 3
|
2月前
|
JSON 缓存 API
|

微店商品详情API概述

本文整理商品详情获取核心接口,涵盖权限申请、调用流程、参数说明及常见问题。支持反向海淘、ERP对接等场景,返回商品基础信息、价格、库存、素材、物流及销售数据,并提供标准签名调用与缓存建议。(239字)

184 1
|
2月前
|
机器学习/深度学习 人工智能 分布式计算
|

AI 会写稿了,人还要不要写?——聊聊生成式 AI 在数据增强与自动写稿里的伦理和质量问题

AI 会写稿了,人还要不要写?——聊聊生成式 AI 在数据增强与自动写稿里的伦理和质量问题

292 1
|
2月前
|
Java
|

java工具:Long转String(时间毫秒数转日期格式字符串)

java工具:Long转String(时间毫秒数转日期格式字符串)

277 2
|
2月前
|
Java
|

java工具:《Java Stream 实现 List 交集过滤:根据 ID 数组筛选对象集合》

java工具:《Java Stream 实现 List 交集过滤:根据 ID 数组筛选对象集合》

211 5
|
3月前
|
数据采集 人工智能 自然语言处理
|

场景判断:什么情况下值得做微调?三个维度帮你做决策

本文提出微调选型三维度决策框架:任务复杂度(知识查询/格式遵从/能力涌现)、风格要求(可选→固定→品牌级)、数据可得性(量、质、多样性),并对比提示词工程、RAG等轻量替代方案,助技术决策者科学评估微调必要性,避免资源浪费。

203 4
|
3月前
|
C++
|

评估不是算分数,是在问:我们扛不扛得住

本文揭示评估会议的本质:它并非单纯检验模型性能,而是暴露团队对不确定性的应对能力。指标选择、bad case争论、流程复杂化,实则是组织风险认知、责任归属与心理成熟的映射。评估的终点,不是模型“完美”,而是团队达成对不完美的共识与担当。

134 1
|
3月前
|
监控 安全 数据可视化
|

为什么 PPO 项目,越调越不敢上线

PPO项目越调越不敢上线?这不是犹豫,而是工程成熟的信号:模型行为渐失直觉、reward语义模糊、风险隐形迁移、测试覆盖失效……根本原因在于你已意识到——PPO是概率工具,而上线需确定性责任。

151 4
|
3月前
|
安全 UED
|

一个客服系统从 0 到稳定运行,真正经历了什么

本文揭示客服系统演进的七阶段规律:从初期“能答即兴奋”,到经历事故、过度调模的困境,最终转向策略驱动——通过风险分类、强制转人工、拒答机制等构建安全边界。稳定不靠模型不犯错,而靠系统可控、责任分明。

151 1

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

1
今日
69521
内容
128
活动
439953
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务