|
9月前
|
Linux
|

linux命令详细说明以及案例

本文介绍了常用的 Linux 命令及其详细说明和示例,包括:`ls`(列出目录内容)、`cd`(更改目录)、`rm` 和 `mv`(删除与移动文件)、`grep`(搜索文本)、`cat`(显示文件内容)以及 `chmod`(更改文件权限)。每个命令均配有功能描述、选项说明及实际案例,帮助用户更好地掌握 Linux 命令的使用方法。

599 157
来自: 数据可视化DataV  版块
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
|

多模态AI核心技术:CLIP与SigLIP技术原理与应用进展

近年来,多模态表示学习在人工智能领域取得显著进展,CLIP和SigLIP成为里程碑式模型。CLIP由OpenAI提出,通过对比学习对齐图像与文本嵌入空间,具备强大零样本学习能力;SigLIP由Google开发,采用sigmoid损失函数优化训练效率与可扩展性。两者推动了多模态大型语言模型(MLLMs)的发展,如LLaVA、BLIP-2和Flamingo等,实现了视觉问答、图像描述生成等复杂任务。这些模型不仅拓展了理论边界,还为医疗、教育等领域释放技术潜力,标志着多模态智能系统的重要进步。

1570 13
|
9月前
|
机器学习/深度学习 算法 调度
|

【强化学习】基于深度强化学习的微能源网能量管理与优化策略研究【Python】

本项目基于深度Q网络(DQN)算法,通过学习预测负荷、可再生能源输出及分时电价等信息,实现微能源网的能量管理与优化。程序以能量总线模型为基础,结合强化学习理论,采用Python编写,注释清晰,复现效果佳。内容涵盖微能源网系统组成、Q学习算法原理及其实现,并提供训练奖励曲线、发电单元功率、电网交互功率和蓄电池调度等运行结果图表,便于对照文献学习与应用。

335 6
|
9月前
|
SQL 数据可视化 大数据
|

QuickBI产品和服务的双重绝杀

作为一名大数据开发工程师,我从2020年开始接触阿里云服务,最初简单尝试了QuickBI的可视化功能。2022年,因公司需求深入使用QuickBI进行数据可视化,对比多款工具后选定QuickBI,因其模板丰富、生态完善和技术售后出色。使用过程中,QuickBI的技术支持帮助我解决了诸多难题,如图表配置、复杂需求调试和SQL问题排查。其API接口功能给我留下深刻印象,能有效解决用户权限控制问题。如今再次选择QuickBI用于实时数仓的数据可视化建设,希望它能继续保持优质服务,助力更多开发者成为数据报表大师。

277 9
|
9月前
|
JSON 自然语言处理 API
|

合合信息TextIn大模型加速器2.0发布:智能图表解析测评

随着人工智能技术的飞速发展,大规模语言模型(LLM)在自然语言处理、图像识别、语音合成等领域的应用日益广泛。然而,大模型的计算复杂度和资源消耗问题也日益凸显。为了解决这一问题,合合信息TextIn推出了大模型加速器2.0,旨在提升大模型的训练和推理效率,降低计算成本,完成智能问答与对话式交互,深度概括与定位等。本文将对合合信息TextIn大模型加速器2.0进行详细测评,重点关注其在智能图表解析任务中的表现。

570 0
|
9月前
|
存储 人工智能 索引
|

Python数据结构:列表、元组、字典、集合

Python 中的列表、元组、字典和集合是常用数据结构。列表(List)是有序可变集合,支持增删改查操作;元组(Tuple)与列表类似但不可变,适合存储固定数据;字典(Dictionary)以键值对形式存储,无序可变,便于快速查找和修改;集合(Set)为无序不重复集合,支持高效集合运算如并集、交集等。根据需求选择合适的数据结构,可提升代码效率与可读性。

757 1
|
9月前
|
存储 人工智能 自然语言处理
|

方案介绍|基于百炼生成向量数据并使用阿里云Milvus存储和检索

阿⾥云Milvus是⼀款云上全托管服务,提供⼤规模向量数据的相似性检索服务。100%兼容开源Milvus,在开源版本的基础上增强了可扩展性,具备易⽤性、可⽤性、安全性、低成本与⽣态优势。阿⾥云Milvus可以⽀持⼏乎所有涉及到向量搜索的场景。例如检索增强⽣成RAG,以及经典的搜索推荐、多模态检索等。阿里云Milvus可存储百炼产生的向量数据,并进行大规模向量数据的检索。本文将重点介绍这一过程的方案。

710 2
|
9月前
|
人工智能 自然语言处理 Cloud Native
|

快速使用Milvus MCP Server,0代码搭建智能搜索Agent

阿里云向量检索服务Milvus版是一款云原生向量检索引擎。目前Milvus提供了milvus-mcp-server来对接各种AI Agent,支持包括:更新向量数据、创建索引、混合检索(向量+全文)、多向量列检索等多种能力。本文介绍了如何使用Milvus-mcp-server来搭建智能搜索Agent,并分别使用Cline和Cursor进行部署展示。

1147 6
|
9月前
|
人工智能 运维 安全
|

AI大模型运维开发探索第四篇:智能体分阶段演进路线

本文探讨了智能体工程的演进历程,从最初的思维链(智能体1.0)到实例化智能体(智能体2.0),再到结构化智能体(智能体3.0),最终展望了自演进智能体(智能体4.0)。文章详细分析了各阶段遇到的问题及解决策略,如工具调用可靠性、推理能力提升等,并引入了大模型中间件的概念以优化业务平台与工具间的协调。此外,文中还提到了RunnableHub开源项目,为读者提供了实际落地的参考方案。通过不断迭代,智能体逐渐具备更强的适应性和解决问题的能力,展现了未来AI发展的潜力。

1049 3
来自: 大数据运维SREWorks  版块
|
9月前
|
机器学习/深度学习 人工智能 算法
|

SWEET-RL:基于训练时信息的多轮LLM代理强化学习框架

SWEET-RL是一种基于训练时信息的逐步评估算法,显著提升了多轮大型语言模型(LLM)代理在强化学习中的成功率。相比现有方法,SWEET-RL将成功率提高6%,使小型开源模型如Llama-3.1-8B达到甚至超越GPT-4O等大型专有模型性能。通过非对称Actor-Critic结构、创新优势函数参数化及两阶段训练流程,SWEET-RL优化了信用分配机制与泛化能力,降低了计算成本。ColBench基准测试显示,SWEET-RL在后端编程和前端设计任务中表现卓越,为AI代理训练技术带来突破性进展。

353 2
|
9月前
|
传感器 运维 监控
|

智慧看护:可穿戴设备在老年护理中的技术探索

智慧看护:可穿戴设备在老年护理中的技术探索

541 13
|
9月前
|
数据采集 供应链 搜索推荐
|

大数据点燃智能电商:从“数据厨房”烹出智慧购物新体验

大数据点燃智能电商:从“数据厨房”烹出智慧购物新体验

124 9
|
9月前
|
供应链 监控 搜索推荐
|

反向海淘代购独立站:功能解析与搭建指南

“反向海淘”指海外消费者购买中国商品的现象,体现了中国制造的创新与强大。国产商品凭借高性价比和丰富功能,在全球市场备受欢迎。跨境电商平台的兴起为“反向海淘”提供了桥梁,而独立站因其自主权和品牌溢价能力逐渐成为趋势。一个成功的反向海淘代购独立站需具备多语言支持、多币种支付、物流跟踪、商品展示、购物车管理等功能,并通过SEO优化、社交媒体营销等手段提升运营效果。这不仅助力中国企业开拓海外市场,还推动了品牌全球化进程。

286 19
|
9月前
|
人工智能 自然语言处理 运维
|

【新模型速递】PAI一键云上零门槛部署DeepSeek-V3-0324、Qwen2.5-VL-32B

PAI-Model Gallery 集成国内外 AI 开源社区中优质的预训练模型,涵盖了 LLM、AIGC、CV、NLP 等各个领域,用户可以通过 PAI 以零代码方式实现从训练到部署再到推理的全过程,获得更快、更高效、更便捷的 AI 开发和应用体验。 现阿里云PAI-Model Gallery已同步接入DeepSeek-V3-0324、Qwen2.5-VL-32B-Instruct两大新模型,提供企业级部署方案。

581 16
来自: 人工智能平台PAI  版块
|
9月前
|
存储 缓存 数据挖掘
|

Flink + Doris 实时湖仓解决方案

本文整理自SelectDB技术副总裁陈明雨在Flink Forward Asia 2024的分享,聚焦Apache Doris与湖仓一体解决方案。内容涵盖三部分:一是介绍Apache Doris,一款高性能实时分析数据库,支持多场景应用;二是基于Doris、Flink和Paimon的湖仓解决方案,解决批流融合与数据一致性挑战;三是Doris社区生态及云原生发展,包括存算分离架构与600多位贡献者的活跃社区。文章深入探讨了Doris在性能、易用性及场景支持上的优势,并展示了其在多维分析、日志分析和湖仓分析中的实际应用案例。

753 17
来自: 实时计算 Flink  版块
|
9月前
|
人工智能 搜索推荐 算法
|

谁是AI搜索先锋? Elastic先锋者招募令正式启动!

阿里云 x Elastic 携手推出“Elastic Pioneer”先锋者计划,开发者们可以通过贡献内容获取积分,赢取月度和年度奖励,包括 ElasticON 新加坡站门票及与技术大咖交流机会。

489 2
|
9月前
|
监控 数据挖掘 开发工具
|

淘宝天猫商品详情数据接口采集攻略

本文详细介绍如何通过淘宝天猫商品详情数据接口采集商品信息。首先概述了常用接口(如taobao.item.get、tmall.item.get)的功能,可获取商品基础信息、描述及评价等。接着说明接入准备,包括注册认证、创建应用与申请权限,以及开发环境配置。最后提供采集流程指引,如通过商品链接或搜索接口获取ID,并以Python示例展示接口调用方法,助力开发者高效挖掘电商数据价值。

859 1
|
9月前
|
人工智能 自然语言处理 前端开发
|

【AI落地应用实战】大模型加速器2.0:基于 ChatDoc + TextIn ParseX+ACGE的RAG知识库问答系统

本文探讨了私有知识库问答系统的难点及解决方案,重点分析了企业知识管理中的痛点,如信息孤岛、知识传承依赖个人经验等问题。同时,介绍了IntFinQ这款知识管理工具的核心特点和实践体验,包括智能问答、深度概括与多维数据分析等功能。文章还详细描述了IntFinQ的本地化部署过程,展示了其从文档解析到知识应用的完整技术闭环,特别是自研TextIn ParseX引擎和ACGE模型的优势。最后总结了该工具对企业和开发者的价值,强调其在提升知识管理效率方面的潜力。

304 11
|
9月前
|
运维 监控 算法
|

时间序列异常检测:MSET-SPRT组合方法的原理和Python代码实现

MSET-SPRT是一种结合多元状态估计技术(MSET)与序贯概率比检验(SPRT)的混合框架,专为高维度、强关联数据流的异常检测设计。MSET通过历史数据建模估计系统预期状态,SPRT基于统计推断判定偏差显著性,二者协同实现精准高效的异常识别。本文以Python为例,展示其在模拟数据中的应用,证明其在工业监控、设备健康管理及网络安全等领域的可靠性与有效性。

1043 13
|
9月前
|
存储 算法 数据挖掘
|

数据无罪,使用有度:从技术人角度谈数据伦理

数据无罪,使用有度:从技术人角度谈数据伦理

436 9
|
9月前
|
存储 定位技术 数据处理
|

隐私失窃背后的设备“告密者”:可穿戴设备的隐私保护之道

隐私失窃背后的设备“告密者”:可穿戴设备的隐私保护之道

329 11
|
9月前
|
人工智能 Python
|

2025自学编程实操指南第一课面向AI编程

2025自学编程实操指南第一课面向AI编程,第一个实践案例:贪吃蛇游戏

386 78
|
9月前
|
Web App开发 数据采集 前端开发
|

Python + Chrome 爬虫:如何抓取 AJAX 动态加载数据?

Python + Chrome 爬虫:如何抓取 AJAX 动态加载数据?

390 2
|
9月前
|
数据采集 Web App开发 调度
|

Headless Chrome 优化:减少内存占用与提速技巧

在数据驱动的时代,爬虫技术至关重要。本文聚焦 Headless Chrome 优化方案,解决传统爬虫内存占用高、效率低等问题。通过无界面模式、代理 IP等配置,显著降低资源消耗并提升速度。实际案例中,该方案用于采集汽车点评数据,性能提升明显:内存占用降低 30%-50%,页面加载提速 40%-60%。结合技术架构图与演化树,全面解析爬虫技术演进,助力高效数据采集。

545 0
|
9月前
|
数据采集 数据挖掘 API
|

深挖京东商品详情 API:一键获取全维度商品数据

京东商品详情API是京东开放平台为开发者提供的关键接口,支持通过编程方式获取商品详细信息,包括基本信息、描述、规格和用户评价等。该API数据全面、实时性强、稳定性高且灵活可定制,满足多场景需求。示例代码展示了如何用Python调用此API,帮助开发者快速集成京东商品数据到自身系统中,实现高效的商品数据分析与应用开发。体验链接:c0b.cc/R4rbK2 。

293 0
|
9月前
|
存储 人工智能 自然语言处理
|

RAL-Writer Agent:基于检索与复述机制,让长文创作不再丢失关键信息

RAL-Writer Agent是一种专业的人工智能写作辅助技术,旨在解决生成高质量、内容丰富的长篇文章时所面临的技术挑战,确保全文保持连贯性和相关性。本研究将系统分析RAL-Writer的核心技术架构、功能特点及其在内容创作、学术研究和专业交流领域的应用前景。

173 4
|
9月前
|
安全 API 数据库
|

借助淘宝拍立淘API,打造超便捷商品识别引擎

淘宝拍立淘API是基于图像识别技术的强大工具,允许开发者通过上传商品图片,在淘宝海量数据库中精准查找相关商品。它支持高精度识别、快速响应、丰富结果展示,并易于集成到各类应用中。用户只需上传图片,即可获取商品基本信息及链接,大幅提升搜索效率。该API采用严格安全机制保障数据隐私,同时提供Python等多语言支持,方便开发者调用。体验链接:c0b.cc/R4rbK2。

356 1
|
9月前
|
人工智能 监控 大数据
|

大数据未来五大趋势,这些变化你真的准备好了吗?

大数据未来五大趋势,这些变化你真的准备好了吗?

666 90
|
9月前
|
传感器 数据采集 物联网
|

智能互联,未来在手:解读可穿戴设备与物联网的深度融合

智能互联,未来在手:解读可穿戴设备与物联网的深度融合

833 85
|
9月前
|
供应链 搜索推荐 API
|

一文读懂:京东、淘宝、拼多多 API 接口,功能大不同,场景各有招

本文深入解析京东、淘宝、拼多多三大电商巨头的API接口特点与差异。京东API以商品管理、订单处理和物流跟踪见长,适合电商平台及零售商;淘宝API功能丰富,涵盖商品查询、订单管理与用户认证,适用多场景电商业务;拼多多API聚焦社交电商,提供拼团、砍价等特色玩法,助力商家提升曝光与销量。开发者和商家需根据自身需求选择合适的API接口,并关注其安全性与稳定性。随着技术进步,这些API将持续优化,推动电商行业蓬勃发展。

1018 4
|
9月前
|
SQL 数据采集 分布式计算
|

深度探索 Dataphin 数据中台的功能与表现

深度探索 Dataphin 数据中台的功能与表现

279 7
|
9月前
|
数据采集 监控 Python
|

Python爬虫异常处理:自动跳过无效URL

Python爬虫异常处理:自动跳过无效URL

359 1
|
9月前
|
数据采集 缓存 JavaScript
|

数据抓取的缓存策略:减少重复请求与资源消耗

本教程聚焦于提升爬虫效率与稳定性,通过结合缓存策略、代理IP技术(如爬虫代理)、Cookie和User-Agent设置,优化数据采集流程。以知乎为例,详细讲解如何抓取指定关键词的文章标题和内容。内容涵盖环境准备、代码实现、常见问题及解决方案,并提供延伸练习,帮助读者掌握高效爬虫技巧。适合具备Python基础的初学者,助你规避网站机制,顺利获取目标数据。

264 2
|
9月前
|
人工智能 算法 搜索推荐
|

人工智能技术对未来就业的影响

人工智能大模型技术正在重塑全球就业市场,但其核心是"增强"而非"取代"人类工作。虽然AI在数据处理、模式识别等标准化任务上表现出色,但在创造力、情感交互和复杂决策等人类专属领域仍存在明显局限。各行业呈现差异化转型:IT领域人机协同编程成为常态,金融业基础分析岗位减少但复合型人才需求激增,医疗行业AI辅助诊断普及但治疗决策仍依赖医生,制造业工人转向技术管理,创意产业中人类聚焦高端设计。未来就业市场将形成人机协作新生态,要求个人培养创造力、情商等AI难以替代的核心能力,企业重构工作流程。AI时代将推动人类向更高价值的认知活动跃升,实现人机优势互补的协同发展。

1092 2
|
9月前
|
SQL 存储 人工智能
|

Apache Flink 2.0.0: 实时数据处理的新纪元

Apache Flink 2.0.0 正式发布!这是自 Flink 1.0 发布九年以来的首次重大更新,凝聚了社区两年的努力。此版本引入分离式状态管理、物化表、流批统一等创新功能,优化云原生环境下的资源利用与性能表现,并强化了对人工智能工作流的支持。同时,Flink 2.0 对 API 和配置进行了全面清理,移除了过时组件,为未来的发展奠定了坚实基础。感谢 165 位贡献者的辛勤付出,共同推动实时计算进入新纪元!

1091 1
来自: 实时计算 Flink  版块
|
9月前
|
机器学习/深度学习 人工智能 算法
|

分位数回归+共形预测:Conformalized Quantile Regression实现更可靠的预测区间

预测不确定性量化在数据驱动决策中至关重要,分位数回归(QR)虽能生成自适应预测区间,但缺乏严格覆盖保证;共形预测(CP)则提供覆盖保证但缺乏强自适应性。Conformalized Quantile Regression (CQR)融合两者优势,通过校准分位数回归模型,生成既适应数据特性又具备统计保证的预测区间。本文深入探讨CQR理论、实现与应用,展示其在医疗、金融等领域提升预测可靠性的潜力,为高风险决策提供更精确和可信的支持。

316 0
|
9月前
|
传感器 人工智能 物联网
|

穿戴科技新风尚:智能服装设计与技术全解析

穿戴科技新风尚:智能服装设计与技术全解析

745 85
|
9月前
|
机器学习/深度学习 搜索推荐 大数据
|

数据驱动的教育革命:让学习更智能、更个性化

数据驱动的教育革命:让学习更智能、更个性化

316 76
|
9月前
|
缓存 JSON JavaScript
|

体育应用怎么通过API接口接入数据源与直播源

本文介绍了体育类应用接入数据源与直播源的API接口方案。主要包括:1) 数据源API接入,涉及选择提供商、接入流程及常见数据类型;2) 直播源接入,涵盖直播源类型、提供商和技术方案;3) 技术实现要点,如数据缓存、实时更新机制和安全性考虑;4) 成本优化建议。附有HLS播放示例及Node.js完整集成代码,帮助开发者高效实现体育应用功能。

725 21
|
9月前
|
数据采集 JavaScript Python
|

如何根据目标网站调整Python爬虫的延迟时间?

如何根据目标网站调整Python爬虫的延迟时间?

201 3
|
9月前
|
数据可视化 数据挖掘 BI
|

Quick BI评测报告:从IT开发视角评测“全场景数据消费式BI平台”

Quick BI评测报告:从IT开发视角评测“全场景数据消费式BI平台”

330 0
|
9月前
|
数据采集 存储 数据可视化
|

分布式爬虫框架Scrapy-Redis实战指南

本文介绍如何使用Scrapy-Redis构建分布式爬虫系统,采集携程平台上热门城市的酒店价格与评价信息。通过代理IP、Cookie和User-Agent设置规避反爬策略,实现高效数据抓取。结合价格动态趋势分析,助力酒店业优化市场策略、提升服务质量。技术架构涵盖Scrapy-Redis核心调度、代理中间件及数据解析存储,提供完整的技术路线图与代码示例。

955 0
|
9月前
|
SQL 分布式计算 监控
|

Dataphin 评测报告

作为一名数据开发工程师,我有幸体验了阿里云的Dataphin工具。它提供一站式数据生命周期管理,涵盖采集、建模、治理到使用全流程,显著提升效率。开通试用简单友好,离线管道任务开发通过可视化拖拽组件降低门槛,SQL计算任务实用但调度依赖配置稍复杂。补数据功能出色,即席分析准确,数据分析可视化直观。优点包括全流程覆盖、易用性强、灵活性高;改进建议涉及文档优化、模板丰富度和性能监控增强。总之,Dataphin是构建企业级数据中台的理想选择,值得尝试!

258 3
|
9月前
|
数据采集 安全 数据挖掘
|

淘宝天猫宝贝详情页面商品评论采集接口全解析

淘宝天猫商品评论采集接口为电商数据挖掘提供了重要工具。通过分析海量评论,消费者可获取购买决策参考,商家能优化产品与服务,市场研究者则能洞察行业趋势与竞品表现。该接口支持Python请求,助力开发者构建智能分析应用,推动电商生态中各方价值提升。使用时需遵守平台规则,确保数据安全与合法利用。

293 15
|
9月前
|
机器学习/深度学习 编解码 人工智能
|

SANA-Sprint:基于连续时间一致性蒸馏的单步扩散模型,0.1秒即可生成图像

Nvidia 提出的 SANA-Sprint 是一种混合蒸馏框架,结合连续时间一致性模型(sCM)与潜在对抗扩散蒸馏(LADD),实现快速高质量文本到图像生成。它支持 1-4 步推理,单步生成 FID 7.59、GenEval 0.74,H100 GPU 上 0.1 秒生成 1024×1024 图像,比 FLUX-Schnell 快 10 倍。通过无训练一致性变换和稳定训练技术,SANA-Sprint 克服传统方法局限,推动实时生成应用。

252 4
|
9月前
|
传感器 人工智能 算法
|

智能眼镜,从科技幻想到现实生活的触手可及

智能眼镜,从科技幻想到现实生活的触手可及

376 22
|
9月前
|
SQL 数据可视化 大数据
|

从0到1,用Tableau讲好数据故事

从0到1,用Tableau讲好数据故事

291 79

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

21
今日
67707
内容
128
活动
439498
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务