|
2月前
|
C++
|

报错解决:Selenium报错“Message: session not created: probably user data directory is already in use” 等

本文详解Selenium操作Edge浏览器时常见的“版本不匹配”和“进程冲突”问题,分析报错根源,并提供手动替换驱动与webdriver-manager自动管理两种解决方案,助你高效稳定实现浏览器自动化。

350 6
|
3月前
|
存储 搜索推荐 安全
|

电脑必备软件:PortableApps便携式软件管理工具安装使用教程:U盘装软件随身带

PortableApps是一款免费开源的便携式软件管理平台,支持将软件安装至U盘,即插即用,拔出不留痕迹。内置近500款实用软件,无需安装,跨平台使用便捷,支持个性化主题设置,让软件随身携带,工作学习更高效。

672 1
|
10月前
|
存储 人工智能 自然语言处理
|

LangChain RAG入门教程:构建基于私有文档的智能问答助手

本文介绍如何利用检索增强生成(RAG)技术与LangChain框架构建基于特定文档集合的AI问答系统。通过结合检索系统和生成机制,RAG能有效降低传统语言模型的知识局限与幻觉问题,提升回答准确性。文章详细展示了从环境配置、知识库构建到系统集成的全流程,并提供优化策略以改进检索与响应质量。此技术适用于专业领域信息检索与生成,为定制化AI应用奠定了基础。

3371 5
|
11月前
|
机器学习/深度学习 人工智能 数据可视化
|

生成AI的两大范式:扩散模型与Flow Matching的理论基础与技术比较

本文系统对比了扩散模型与Flow Matching两种生成模型技术。扩散模型通过逐步添加噪声再逆转过程生成数据,类比为沙堡的侵蚀与重建;Flow Matching构建分布间连续路径的速度场,如同矢量导航系统。两者在数学原理、训练动态及应用上各有优劣:扩散模型适合复杂数据,Flow Matching采样效率更高。文章结合实例解析两者的差异与联系,并探讨其在图像、音频等领域的实际应用,为生成建模提供了全面视角。

2229 1
|
1月前
|
人工智能 自然语言处理 算法
|

最近比较火的GEO适合哪些行业的推广?

GEO(生成式引擎优化)正重塑营销格局,通过优化内容结构与语义逻辑,抢占AI问答场景的引用权。据IDC与中国信通院数据,2025年全球市场规模超120亿美元,中国占55.4%。其在本地生活、跨境电商、文旅、房地产、教育、B2B制造及金融医疗等行业广泛应用,助力企业实现精准获客、提升转化率并构建长期数字资产,成为AI时代营销新基建。

374 3
|
4月前
|
Cloud Native 算法 API
|

Python API接口实战指南:从入门到精通

🌟蒋星熠Jaxonic,技术宇宙的星际旅人。深耕API开发,以Python为舟,探索RESTful、GraphQL等接口奥秘。擅长requests、aiohttp实战,专注性能优化与架构设计,用代码连接万物,谱写极客诗篇。

723 1
|
10月前
|
人工智能 自然语言处理 运维
|

让搜索引擎“更懂你”:AI × Elasticsearch MCP Server 开源实战

本文介绍基于Model Context Protocol (MCP)标准的Elasticsearch MCP Server,它为AI助手(如Claude、Cursor等)提供与Elasticsearch数据源交互的能力。文章涵盖MCP概念、Elasticsearch MCP Server的功能特性及实际应用场景,例如数据探索、开发辅助。通过自然语言处理,用户无需掌握复杂查询语法即可操作Elasticsearch,显著降低使用门槛并提升效率。项目开源地址:<https://github.com/awesimon/elasticsearch-mcp>,欢迎体验与反馈。

2642 1
来自: 智能搜索推荐  版块
|
12月前
|
存储 供应链 安全
|

区块链在物流管理中的应用:让货物管理变得更智能

区块链在物流管理中的应用:让货物管理变得更智能

1424 15
|
27天前
|
人工智能
|

大模型产生幻觉的原因,如何解决?

大模型“幻觉”指AI生成看似合理但错误或虚构的信息,源于其概率预测机制、训练数据缺陷及缺乏事实核查能力。可通过RAG、微调、联网检索、自我核查等方法降低幻觉风险,提升输出准确性与可靠性。(238字)

329 3
|
5月前
|

一键解决 Office 卸载难题!微软官方卸载工具,点击下载开启轻松卸载之旅

微软官方Office卸载工具可彻底清除Office 2007至2021及365版本残留,解决重装报错问题。支持深度扫描与一键卸载,操作简单,卸载后需重启生效。

1703 18
|
8月前
|
搜索推荐 安全 API
|

聚合电商API:一键连接多平台数据

聚合电商API接口平台整合淘宝、天猫、京东等多平台API,提供一站式数据服务。核心功能包括数据整合、多平台搜索、详细解析与定制化服务,助力商家高效管理订单、优化商品推荐及支持数据驱动决策。平台注重智能化、个性化与全渠道发展,保障数据安全,推动业务增长。

853 2
|
16天前
|
算法 搜索推荐 Serverless
|

为什么 ES 的搜索结果只到 10,000?强制“数清楚”的代价有多大

Elasticsearch 7.x后默认返回10,000总数,实为Block-Max WAND算法的性能优化——跳过低分文档块以提升查询速度。强行开启`track_total_hits:true`将禁用该优化,导致CPU飙升、延迟激增。本文深入Lucene底层,解析其原理、陷阱与治理方案。

274 1
|
2月前
|
SQL 人工智能 分布式计算
|

【MaxCompute SQL AI 实操教程】0元体验使用大模型提效数据分析

【MaxCompute SQL AI 实操教程】0元体验使用大模型提效数据分析

523 3
|
2月前
|
人工智能 运维 自然语言处理
|

3 个真实 GEO 成功案例 + 3 步关键词排名秘籍!开发者 / 企业快速落地 GEO,流量 & 转化双提升

本文聚焦 GEO 真实获客案例与实操技巧,通过教培机构、工业设备商、小众茶叶品牌三个实测案例,展现 GEO 落地成效:教培机构靠升学数据咨询量暴增 210%,工业设备商盯准技术痛点让单笔订单翻 5 倍,茶叶品牌借产地溯源实现客单价从 200 元飙至 500 元。核心分享三步零门槛关键词法:列客户痛点、加场景限定、数据筛词,还拆解了不同平台关键词偏好。提醒效果需 1-3 个月积累,内容需真实且持续优化。新手可直接对照案例思路,结合自身行业调整,快速抢占搜索流量,精准获客。

1097 1
|
6月前
|
存储 缓存 Apache
|

StarRocks+Paimon 落地阿里日志采集:万亿级实时数据秒级查询

A+流量分析平台是阿里集团统一的全域流量数据分析平台,致力于通过埋点、采集、计算构建流量数据闭环,助力业务提升流量转化。面对万亿级日志数据带来的写入与查询挑战,平台采用Flink+Paimon+StarRocks技术方案,实现高吞吐写入与秒级查询,优化存储成本与扩展性,提升日志分析效率。

844 1
|
2月前
|
API 开发者
|

美股(纳斯达克/纽交所)数据 API 对接实战(含实时行情与 IPO 功能)

本文介绍如何通过StockTV API快速对接美股数据,支持纳斯达克、纽交所实时行情、IPO日历、K线图及公司基本面信息。仅需配置`countryId=5`,即可高效集成专业级金融数据,适用于量化交易与行情应用开发。

479 2
|
8月前
|
SQL 数据建模 关系型数据库
|

别光知道存数据库了,数据建模才是王道!(入门指南+实战代码)

别光知道存数据库了,数据建模才是王道!(入门指南+实战代码)

1605 4
|
10月前
|
数据采集 SQL 人工智能
|

长文详解|DataWorks Data+AI一体化开发实战图谱

DataWorks是一站式智能大数据开发治理平台,内置阿里巴巴15年大数据建设方法论,深度适配阿里云MaxCompute、EMR、Hologres、Flink、PAI 等数十种大数据和AI计算服务,为数仓、数据湖、OpenLake湖仓一体数据架构提供智能化ETL开发、数据分析与主动式数据资产治理服务,助力“Data+AI”全生命周期的数据管理。

1606 5
|
11月前
|
人工智能 网络安全 开发工具
|

vscode代码推送到github库菜鸡专用教程

vscode代码推送到github库菜鸡专用教程

2390 3
|
12月前
|
机器学习/深度学习 人工智能 PyTorch
|

从零开始:如何训练自己的AI模型

### 从零开始:如何训练自己的AI模型 训练AI模型如同培养新生儿,需耐心与技巧。首先明确目标(如图像识别、自然语言处理),选择框架(TensorFlow、PyTorch)。接着收集并预处理数据,确保多样性和准确性。然后设计模型结构,如卷积神经网络(CNN),并通过代码实现训练。训练后评估模型性能,调优以避免过拟合。最后部署模型至实际应用。通过猫狗分类器案例,掌握关键步骤和常见问题。训练AI模型是不断迭代优化的过程,实践才能真正掌握精髓。

5475 1
|
12月前
|
JSON 搜索推荐 数据挖掘
|

Temu商品列表数据接口(Temu API系列)

Temu作为新兴跨境电商平台,为全球卖家和消费者搭建便捷交易桥梁。通过商品列表数据接口,开发者、分析师可获取商品名称、价格、销量等信息,助力市场调研、商品管理和数据分析。接口支持HTTP GET请求,参数包括品类、价格区间、排序方式等,响应格式为JSON。Python示例代码展示了如何调用API获取数据,应用场景涵盖竞争对手分析、选品参考、销售预测及个性化推荐系统开发等。

3368 24
|
9天前
|
数据可视化 数据挖掘 API
|

Matplotlib 入门指南:让数据"开口说话"的魔法库

本教程系统讲解Matplotlib数据可视化:从环境搭建、核心概念(Figure/Axes/Artist)到实战分析电影评分趋势;涵盖中文字体配置、常见陷阱规避及最佳实践,并指引Seaborn、Plotly等进阶方向,助你高效掌握Python可视化核心技能。(239字)

107 9
|
13天前
|
存储 机器学习/深度学习 人工智能
|

文档切分实战:5种方法详解,打造高效RAG系统的第一步

本文深入解析RAG中至关重要的文档切分技术,系统介绍5种主流策略(句子、定长、重叠、递归、语义切分),结合代码示例与实战调优技巧,涵盖PDF/Markdown/代码等多格式处理,并提供质量评估与避坑指南,助你打造高精度、高效率的私有知识库。

149 7
|
17天前
|
机器学习/深度学习 移动开发 人工智能
|

大模型应用:庖丁解牛:QKV机制详解,大模型的注意力之眼.4

QKV机制是Transformer注意力的核心:Query(提问)、Key(标识)、Value(信息)三者通过点积计算相似度,Softmax归一化后加权融合Value,实现动态上下文感知。它能捕捉长程依赖,解决代词消解、一词多义等问题,支撑大模型强大语言理解能力。

235 7
|
3月前
|
Linux Android开发 iOS开发
|

Escrcpy手机投屏工具!Scrcpy最全安装指南教程!

Escrcpy是一款开源免费的安卓投屏工具,支持Windows、macOS、Linux,无需Root,无广告。可实现低延迟(35-70ms)、高帧率(120fps)投屏,支持键鼠控制、文件互传、录屏截图,适用于办公、游戏、开发等场景。

1142 1
|
4月前
|
缓存 运维 监控
|

vLLM推理加速指南:7个技巧让QPS提升30-60%

GPU资源有限,提升推理效率需多管齐下。本文分享vLLM实战调优七招:请求塑形、KV缓存复用、推测解码、量化、并行策略、准入控制与预热监控。结合代码与数据,助你最大化吞吐、降低延迟,实现高QPS稳定服务。

1328 7
|
25天前
|
数据采集 人工智能 物联网
|

什么是微调?大模型定制化的核心技术与实操指南

微调让大模型从“通用助手”变为“专属专家”。通过少量数据训练,LoRA等轻量化方法可在单卡上实现高效优化,广泛应用于医疗、金融、电商等领域。数据驱动、成本低廉、效果显著,微调正推动AI定制化落地,人人皆可拥有专属AI。

268 3
|
6月前
|
JSON 算法 API
|

小红书商品详情签名算法Python

本文分享了作者在对接小红书商品详情API过程中的实战经验,涵盖权限申请、签名算法、限流控制、数据解析及Webhook接入等关键技术环节,并附有实用Python代码示例。

442 0
|
12天前
|
SQL 人工智能 自然语言处理
|

数据工程视角:为什么公司会有几百个含义模糊的“DAU”指标?

除了提升开发效率、降低资源成本,更能保障决策一致性、赋能业务敏捷分析,并构成未来 AI 应用不可或缺的 AI-Ready 数据底座

114 1
|
3月前
|
人工智能 Cloud Native IDE
|

超详细!JetBrains Rider 2025.1 安装到能用,激活 + 安装步骤—附安装包

JetBrains Rider 2025.1 是全能型跨平台全栈 IDE,深度集成 AI 编码助手,支持 .NET 9、Unity 2025、Blazor 等最新技术,覆盖 C#、Python、Go 等 20+ 语言,赋能游戏、云原生与微服务开发,实现 AI 辅助生成、调试、测试与文档一体化。

846 2
|
5月前
|
人工智能 Ubuntu 前端开发
|

Dify部署全栈指南:AI从Ubuntu配置到HTTPS自动化的10倍秘籍

本文档介绍如何部署Dify后端服务及前端界面,涵盖系统环境要求、依赖安装、代码拉取、环境变量配置、服务启动、数据库管理及常见问题解决方案,适用于开发与生产环境部署。

1198 1
|
6月前
|
数据处理 开发工具 开发者
|

requirement.txt 管理python包依赖

在 Python 项目中,`requirements.txt` 用于记录依赖库及其版本,便于环境复现。本文介绍了多种生成该文件的方法:基础方法使用 `pip freeze`,进阶方法使用 `pipreqs`,专业方法使用 `poetry` 或 `pipenv`,以及手动维护方式。每种方法适用不同场景,涵盖从简单导出到复杂依赖管理,并提供常见问题的解决方案,帮助开发者高效生成精准的依赖列表,确保项目环境一致性。

1965 4
来自: 人工智能平台PAI  版块
|
6月前
|
人工智能 自然语言处理 JavaScript
|

17种RAG实现方法大揭秘

RAG(检索增强生成)通过结合外部知识库与LLM生成能力,有效解决大模型知识滞后与幻觉问题。本文详解三类策略、17种实现方案,涵盖文档分块、检索排序与反馈机制,并提供工程选型指南,助力构建高效智能系统。

1531 0
|
8月前
|
自然语言处理 算法 API
|

阿里云增值税发票识别NET Rest API调用示例

本文介绍了使用NET代码调用阿里云增值税发票识别API的实现方式。通过示例代码,详细展示了如何构造请求、设置签名以及发送HTTP请求的具体步骤。代码中涵盖了请求参数的处理、签名生成逻辑(如HMAC-SHA256算法)以及调用API后的结果处理。此外,还提供了运行结果的截图和参考文档链接,帮助开发者更好地理解和应用该接口。

790 4
|
10月前
|
机器学习/深度学习 数据采集 API
|

Python自动化解决滑块验证码的最佳实践

Python自动化解决滑块验证码的最佳实践

1834 2
|
10月前
|
JSON 搜索推荐 API
|

深入研究:京东商品视频 API 详解

京东商品视频API简介:该API可基于京东商品ID获取商品视频信息,包括标题、描述、播放地址、缩略图及视频时长等,助力开发者和商家实现个性化展示与智能推荐。接口采用HTTP GET方式请求,返回JSON格式数据。示例代码展示了通过Python的requests库调用API并生成签名的过程,确保请求安全可靠。此API有助于提升电商应用的用户体验与竞争力。

469 5
|
2月前
|
数据采集 API 开发工具
|

CNFANS模式淘宝1688代购系统搭建指南

CNFANS模式整合国内电商资源,对接淘宝、1688商品库,为海外用户提供代购、集运、物流清关等一站式服务。通过API打通电商平台、支付(PayPal/Stripe)、国际物流及仓储系统,实现商品采集、下单、支付、发货全流程自动化,解决海外用户“买不到、价格高”难题,提升跨境购物体验。(238字)

221 6
|
3月前
|
存储 NoSQL Go
|

英伟达谷歌都在用的(开源特征存储平台Feast)-架构学习指南

欢迎来到Feast的世界!这是一个开源的生产级机器学习特征存储系统,专为解决特征数据高效管理与服务而设计。本指南将带你从零掌握其架构、核心概念与实战技巧,助你像架构师一样思考,像工匠一样编码,轻松应对训练与推理的一致性挑战。

571 2
|
5月前
|
人工智能 数据可视化 数据处理
|

AI智能体框架怎么选?7个主流工具详细对比解析

大语言模型需借助AI智能体实现“理解”到“行动”的跨越。本文解析主流智能体框架,从RelevanceAI、smolagents到LangGraph,涵盖技术门槛、任务复杂度、社区生态等选型关键因素,助你根据项目需求选择最合适的开发工具,构建高效、可扩展的智能系统。

1407 3
|
5月前
|
SQL Oracle 关系型数据库
|

19c多租户架构下的UNDO管理- Local Undo

Oracle 12c引入多租户架构,PDB共享CDB的UNDO表空间。19c新增Local Undo特性,支持各PDB独立管理UNDO,提升性能、隔离性与可管理性,且为热克隆、PDB迁移等高级功能的前提。建议19c环境启用Local Undo。

665 10
|
7月前
|
XML JSON API
|

淘宝API系列:淘宝店铺所有商品API接口详解

本攻略详解淘宝店铺商品API接口,涵盖接口概述、核心分类与功能、调用准备、请求示例及应用场景,助开发者高效获取商品信息,适用于电商开发与数据管理。

508 0
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
|

阿里云人工智能平台 PAI 开源 EasyDistill 框架助力大语言模型轻松瘦身

本文介绍了阿里云人工智能平台 PAI 推出的开源工具包 EasyDistill。随着大语言模型的复杂性和规模增长,它们面临计算需求和训练成本的障碍。知识蒸馏旨在不显著降低性能的前提下,将大模型转化为更小、更高效的版本以降低训练和推理成本。EasyDistill 框架简化了知识蒸馏过程,其具备多种功能模块,包括数据合成、基础和进阶蒸馏训练。通过数据合成,丰富训练集的多样性;基础和进阶蒸馏训练则涵盖黑盒和白盒知识转移策略、强化学习及偏好优化,从而提升小模型的性能。

1738 7
来自: 人工智能平台PAI  版块
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
|

多模态AI核心技术:CLIP与SigLIP技术原理与应用进展

近年来,多模态表示学习在人工智能领域取得显著进展,CLIP和SigLIP成为里程碑式模型。CLIP由OpenAI提出,通过对比学习对齐图像与文本嵌入空间,具备强大零样本学习能力;SigLIP由Google开发,采用sigmoid损失函数优化训练效率与可扩展性。两者推动了多模态大型语言模型(MLLMs)的发展,如LLaVA、BLIP-2和Flamingo等,实现了视觉问答、图像描述生成等复杂任务。这些模型不仅拓展了理论边界,还为医疗、教育等领域释放技术潜力,标志着多模态智能系统的重要进步。

1961 13
|
15天前
|
存储 机器学习/深度学习 人工智能
|

别让大模型“失忆”:手把手教你用向量数据库打造它的专属知识库

本文深入浅出地讲解向量数据库原理与实践:用“语义身份证”比喻Embedding,以图书管理员类比关键词与语义搜索差异;手把手用Python+Faiss+BGE搭建中文语义检索系统,并详解RAG流程、效果评估与调优要点,助你为大模型装配真正懂业务的“外挂大脑”。

144 4
|
22天前
|
存储 人工智能 运维
|

向量数据库实战指南:从部署到RAG落地

本文以轻量开源向量数据库Chroma为例,手把手带你完成环境部署、数据导入、相似性检索到RAG集成的全流程实战,避开新手常见坑,适配码农与大数据爱好者快速落地AI应用,助力掌握向量数据库核心技能。

204 1
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
|

大模型专业名词解释手册

本手册由油炸小波设计提示词、Manus创作,系统梳理大语言模型核心概念,涵盖基础原理、训练技术、优化压缩、推理应用、评估调试及伦理安全六大模块,深入浅出解析LLM关键技术术语。

284 0
|
7天前
|
人工智能 安全 C++
|

一个项目能长期活下去,靠的从来不是模型

AI项目成败关键不在模型强弱,而在于系统性生存能力:厘清责任边界、接纳不确定性、严控复杂度、建立止损机制、允许模型“不万能”、并在模型成功时保持克制。真正活久的项目,清醒、务实、敬畏现实。

147 12
|
12天前
|
Web App开发
|

代理ip在浏览器的配置指南

本文分三步详解代理IP配置:①打开浏览器对应设置(Chrome设为“设置”,Firefox为“选项”,Edge为“Internet选项”);②在“局域网设置”中填写代理IP与端口并保存;③百度搜“IP”验证是否生效。附注意事项及稳定IP推荐,操作清晰易上手。

125 3
|
3月前
|
人工智能 Cloud Native 数据可视化
|

PyCharm 2025.1 完整教程:下载安装 + 中文设置 + 激活,一步到位,附安装包

PyCharm 2025.1 发布,重磅升级AI代码补全、类型推断与ruff集成,提升开发效率。支持渐进式补全、智能提交信息生成、冲突可视化解决,优化启动速度与内存占用,全面增强云原生及现代Python开发体验。

1138 5

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

3
今日
69051
内容
128
活动
439685
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务