|
10月前
|
Java 数据库 Docker
|

基于neo4j数据库和dify大模型框架的rag模型搭建

基于neo4j数据库和dify大模型框架的rag模型搭建

2847 35
|
7月前
|
人工智能 分布式计算 DataWorks
|

大数据AI产品月刊-2025年7月

大数据& AI 产品技术月刊【2025年7月】,涵盖7月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。

1053 2
|
9天前
|
算法 搜索推荐 大数据
|

别再怪模型不聪明了:冷启动,本质是你“没喂饱”数据

别再怪模型不聪明了:冷启动,本质是你“没喂饱”数据

126 2
|
2月前
|
数据采集 人工智能 自然语言处理
|

寻找 AI 全能王——阿里云 Data+AI 工程师全球大奖赛正式开启

在AI迈向专业决策的关键节点,阿里云联合NVIDIA发起“寻找AI全能王”全球大奖赛,聚焦高质量数据构建与智能体开发两大挑战。赛事设高校与企业双赛道,覆盖万亿语料去重与DeepSearch智能体构建,提供工业级实战平台、专家指导与丰厚奖励,推动Data+AI融合创新,助力开发者实现“所想即所得”的技术突破。

679 2
来自: 大数据计算 MaxCompute  版块
|
3月前
|
前端开发 安全 JavaScript
|

网站代码 网站源代码 网页源代码 网页代码网站

本文深入解析网站源代码与网页源代码的核心概念及区别,阐述其作为互联网技术基石的关键作用。通过剖析PageAdmin等典型源码案例,揭示源代码在技术学习、网站优化、安全维护等方面的核心价值,并探讨如何高效利用代码网站资源进行创新开发。文章强调在尊重版权的前提下,开发者可借助源码资源提升能力,推动网页技术持续发展。

1175 10
来自: 大数据计算 MaxCompute  版块
|
6月前
|
机器学习/深度学习 传感器 编解码
|

DINOv3上手指南:改变视觉模型使用方式,一个模型搞定分割、检测、深度估计

DINOv3是Meta推出的自监督视觉模型,支持冻结主干、仅训练轻量任务头即可在分割、深度估计等任务上达到SOTA,极大降低训练成本。其密集特征质量优异,适用于遥感、工业检测等多领域,真正实现“一个模型走天下”。

4642 2
|
11月前
|
机器学习/深度学习 JSON 监控
|

国内最大的MCP中文社区来了,4000多个服务等你体验

国内最大的MCP中文社区MCPServers来了!平台汇聚4000多个服务资源,涵盖娱乐、监控、云平台等多个领域,为开发者提供一站式技术支持。不仅有丰富的中文学习资料,还有详细的实战教程,如一键接入MCP天气服务等。MCPServers专注模块稳定性和实用性,经过99.99% SLA认证,是高效开发的理想选择。立即访问mcpservers.cn,开启你的开发之旅!

13493 16
|
2月前
|
机器学习/深度学习 移动开发 人工智能
|

大模型应用:庖丁解牛:QKV机制详解,大模型的注意力之眼.4

QKV机制是Transformer注意力的核心:Query(提问)、Key(标识)、Value(信息)三者通过点积计算相似度,Softmax归一化后加权融合Value,实现动态上下文感知。它能捕捉长程依赖,解决代词消解、一词多义等问题,支撑大模型强大语言理解能力。

564 7
|
2月前
|
存储 JSON 自然语言处理
|

十一年实战沉淀:淘宝商品评论数据深度解析与落地技巧

深耕淘宝评论分析11年,亲历数据结构迭代与解析挑战。本文详解评论数据核心字段、解析难点及破局技巧,分享实战验证的标准化流程,涵盖字符处理、动态规则、高效存储等关键环节,助力精准情感分析与用户洞察。

340 1
|
2月前
|
人工智能 搜索推荐 数据库
|

从零搭建RAG系统:原理剖析+代码实践,解锁大模型“记忆力”新姿势

RAG(检索增强生成)为大模型配备“外接大脑”,通过连接专属知识库,提升回答准确性。广泛应用于医疗、法律、客服等领域,兼具专业性与可解释性。本文详解其原理、实战步骤与优化技巧,助你快速构建个性化AI助手。

793 11
|
9月前
|
SQL 数据建模 关系型数据库
|

别光知道存数据库了,数据建模才是王道!(入门指南+实战代码)

别光知道存数据库了,数据建模才是王道!(入门指南+实战代码)

1836 4
|
9月前
|
人工智能 前端开发 搜索推荐
|

LangGraph实战教程:构建会思考、能记忆、可人工干预的多智能体AI系统

本文介绍了使用LangGraph和LangSmith构建企业级多智能体AI系统的完整流程。从简单的ReAct智能体开始,逐步扩展至包含身份验证、人工干预、长期内存管理和性能评估的复杂架构。文章详细讲解了状态管理、工具集成、条件流程控制等关键技术,并对比了监督者架构与群体架构的优劣。通过系统化的方法,展示了如何构建可靠、可扩展的AI系统,为现代AI应用开发提供了坚实基础。*作者:Fareed Khan*

2061 0
|
11天前
|
人工智能 自然语言处理 机器人
|

2026数字助理时代真的要来临了——直接自然语言操作AI助理,马斯克预言真的来了

AI自动开浏览器抢12306车票!这不仅是聊天机器人,而是能“看屏、点鼠、敲键”的数字员工——绕过API限制,直接操作任何GUI软件。马斯克力推的MacroHard(Digital Optimus),正颠覆传统软件逻辑,宣告“数字助理时代”真正来临。

149 1
|
5月前
|
Cloud Native 算法 API
|

Python API接口实战指南:从入门到精通

🌟蒋星熠Jaxonic,技术宇宙的星际旅人。深耕API开发,以Python为舟,探索RESTful、GraphQL等接口奥秘。擅长requests、aiohttp实战,专注性能优化与架构设计,用代码连接万物,谱写极客诗篇。

980 1
|
4月前
|
人工智能 Cloud Native 数据可视化
|

PyCharm 2025.1 完整教程:下载安装 + 中文设置 + 激活,一步到位,附安装包

PyCharm 2025.1 发布,重磅升级AI代码补全、类型推断与ruff集成,提升开发效率。支持渐进式补全、智能提交信息生成、冲突可视化解决,优化启动速度与内存占用,全面增强云原生及现代Python开发体验。

1352 5
|
1月前
|
机器学习/深度学习 数据采集 人工智能
|

给AI模型“加外挂”:LoRA技术详解,让小白也能定制自己的大模型

LoRA是一种高效轻量的大模型微调技术,如同为万能咖啡机加装“智能香料盒”——不改动原模型(冻结参数),仅训练少量低秩矩阵(参数量降千倍),显著降低成本、保留通用能力,并支持插件式灵活部署。现已成为AI定制化普惠落地的核心方案。(239字)

326 8
|
2月前
|
人工智能 算法 新能源
|

从入门到选型:GEO生成式引擎优化科普与优质geo优化服务商推荐

GEO(生成式引擎优化)正取代SEO,助力企业在AI搜索中抢占流量先机。本文解析GEO核心逻辑,对比SEO差异,揭示其提升获客效率2.8倍的潜力,并结合国内外权威数据,分场景推荐适配的优质服务商,助企业从懂原理到会选型,规避布局风险。

964 2
|
8月前
|
并行计算 机器人 网络安全
|

阿里云服务器上部署ROS2+Isaac-Sim4.5实现LeRobot机械臂操控

本文介绍了如何在阿里云上申请和配置一台GPU云服务器,并通过ROS2与Isaac Sim搭建机械臂仿真平台。内容涵盖服务器申请、系统配置、远程连接、环境搭建、仿真平台使用及ROS2操控程序的编写,帮助开发者快速部署机器人开发环境。

3192 5
|
2月前
|
分布式计算 Serverless 测试技术
|

有奖实践:EMR Serverless StarRocks × Serverless Spark x DLF 共探 TPC 极致性能

免费试用 EMR Serverless StarRocks 与 EMR Serverless Spark,体验“实时分析冠军”与“批处理之神”的极致性能表现!

438 1
|
12月前
|
人工智能 网络安全 开发工具
|

vscode代码推送到github库菜鸡专用教程

vscode代码推送到github库菜鸡专用教程

2553 3
|
3月前
|
机器学习/深度学习 存储 自然语言处理
|

大模型基础概念术语解释

大语言模型(LLM)基于Transformer架构,通过海量文本训练,具备强大语言理解与生成能力。其核心组件包括注意力机制、位置编码与嵌入层,支持文本分割为Token进行处理。参数量达亿级以上,规模增长带来涌现能力,如复杂推理与跨任务泛化。混合专家模型(MoE)提升效率,推动模型持续扩展。

381 1
|
4月前
|
SQL 分布式计算 大数据
|

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert:大数据数据流写业务迁移的实践与突破

本系列文章将围绕东南亚头部科技集团的真实迁移历程展开,逐步拆解 BigQuery 迁移至 MaxCompute 过程中的关键挑战与技术创新。本篇为第八篇,MaxCompute Streaming Insert:大数据数据流写业务迁移的实践与突破。 注:客户背景为东南亚头部科技集团,文中用 GoTerra 表示。

1046 137
来自: 大数据计算 MaxCompute  版块
|
4月前
|
Linux Android开发 iOS开发
|

Escrcpy手机投屏工具!Scrcpy最全安装指南教程!

Escrcpy是一款开源免费的安卓投屏工具,支持Windows、macOS、Linux,无需Root,无广告。可实现低延迟(35-70ms)、高帧率(120fps)投屏,支持键鼠控制、文件互传、录屏截图,适用于办公、游戏、开发等场景。

1410 1
|
5月前
|
人工智能 文字识别 搜索推荐
|

uTools软件安装教程及使用教程!一个跨平台的桌面效率工具!快速办公软件

uTools是一款跨平台效率工具,支持Win/Mac/Linux,通过“Alt+空格”呼出搜索框,集成OCR、翻译、计算器、剪贴板等数十款插件,打造个性化办公环境,轻量高效,即开即用。

1084 2
|
2月前
|
人工智能 自然语言处理 算法
|

最近比较火的GEO适合哪些行业的推广?

GEO(生成式引擎优化)正重塑营销格局,通过优化内容结构与语义逻辑,抢占AI问答场景的引用权。据IDC与中国信通院数据,2025年全球市场规模超120亿美元,中国占55.4%。其在本地生活、跨境电商、文旅、房地产、教育、B2B制造及金融医疗等行业广泛应用,助力企业实现精准获客、提升转化率并构建长期数字资产,成为AI时代营销新基建。

548 3
|
11月前
|
传感器 人工智能 物联网
|

智能鞋:从脚下开始的科技革命

智能鞋:从脚下开始的科技革命

1095 6
|
5月前
|
API 开发者 数据采集
|

高效获取淘宝商品详情:API 开发实现链接解析的完整技术方案

2025反向海淘新机遇:依托代购系统,聚焦小众垂直品类,结合Pandabay数据选品,降本增效。系统实现智能翻译、支付风控、物流优化,助力中式养生茶等品类利润翻倍,新手也能快速入局全球市场。

993 2
|
9月前
|
安全 Linux Android开发
|

如何将Kindle电子书下载到电脑:技术流程与操作解析

随着数字阅读兴起,Kindle成为主流电子书平台。然而,Amazon的封闭生态和DRM限制,使用户难以灵活管理书籍。本文从技术角度出发,讲解如何合法下载Kindle电子书至电脑,包括使用Kindle for PC、USB导出及进阶方案(如Android模拟器、WINE环境)。同时介绍文件格式处理、自动化备份与阅读体验优化方法,并强调版权合规的重要性,助您构建个人数字图书馆。

3255 3
|
1月前
|
人工智能 自然语言处理 安全
|

Gemini:2026年最强AI模型之一,如何在实际应用中挑战GPT与Claude的地位?

2026年,大模型竞争正从“谁更强”转向“谁更稳、更适配工程”。Gemini凭借推理结构一致性、长上下文稳定性及多模型协同友好性,成为生产系统关键选项,推动AI架构向“可调度的模型能力”演进。

366 2
来自: 人工智能平台PAI  版块
|
1月前
|
JSON 监控 安全
|

小红书笔记详情数据获取实战:从笔记链接提取 ID 到解析详情

小红书笔记详情API可获取标题、正文、作者、互动数据、图文/视频资源及话题标签等结构化信息,支持自定义字段与评论拉取。适用于内容分析、竞品监控、营销优化与用户研究,HTTPS+JSON接口,Python调用便捷。(239字)

284 6
|
3月前
|
数据采集 人工智能 算法
|

具身智能:零基础入门睿尔曼机械臂(七)—— 衔接开源代码!机械臂手眼标定实操

本文详解睿尔曼机械臂手眼标定全流程,涵盖环境搭建、设备准备、眼在手上/外的标定步骤、常见问题解决及标定结果在视觉抓取中的应用,助你实现精准视觉引导操作。

437 2
|
8月前
|
人工智能 iOS开发 Windows
|

装了就舍不得卸载的一款电脑截图软件!

这是一款免费且功能强大的截图工具,支持Windows和Mac系统。它不仅界面简洁无广告,还提供带壳截图、文字提取、内容翻译与AI解释等实用功能,极大提升工作与学习效率。下载地址:https://tool.nineya.com/s/1j06j6dmj

618 0
|
6月前
|
数据采集 存储 缓存
|

LLM + 抓取:让学术文献检索更聪明

结合爬虫与大模型,打造懂语义的学术检索助手:自动抓取最新NLP+爬虫论文,经清洗、向量化与RAG增强,由LLM提炼贡献,告别关键词匹配,实现精准智能问答。

675 0
|
8月前
|
机器学习/深度学习 人工智能 API
|

AI 发展 && MCP

AI发展——计算机视觉、ChatGPT、Sora、DeepSeek、生成式AI。什么是MCP,Prompt、LLM、Function Call、Agent、MCP是什么,各自区别;MCP如何工作,MCP架构、MCP Server工作原理,Cursor如何使用MCP,自定义MCP Server

1295 46
|
12月前
|
数据安全/隐私保护 UED 异构计算
|

【大模型私有化部署要花多少钱?】一张图看懂你的钱用在哪

本文探讨了高性价比实现DeepSeek大模型私有化部署的方法,分为两部分: 一是定义大模型性能指标,包括系统级(吞吐量、并发数)与用户体验级(首token生成时间、单token生成时间)指标,并通过roofline模型分析性能瓶颈; 二是评估私有化部署成本,对比不同硬件(如H20和4090)及模型选择,结合业务需求优化资源配置。适合关注数据安全与成本效益的企业参考。

3159 1
|
1月前
|
安全 前端开发 中间件
|

Django 入门指南:从零构建强大的 Web 应用

Django是Python最流行的“电池全备”企业级Web框架,内置ORM、Admin后台、认证等核心功能,遵循MVT架构与DRY原则。专注业务逻辑,助力快速构建安全稳定的CMS、电商等数据驱动应用。(239字)

324 2
|
2月前
|
数据采集 人工智能 自然语言处理
|

Agentic Search: AI驱动的下一代企业搜索

Agentic Search是阿里云OpenSearch推出的AI搜索新范式,以智能体(Agent)为核心,融合深度检索、多步推理、工具调用与多模态理解,实现从“被动响应”到“主动执行”的跃迁。支持对话、规划、自适应三模式,覆盖问答、研究、客服、报告生成等全场景,助力企业知识库升级为动态业务引擎。

392 2
|
5月前
|
存储 缓存 调度
|

vLLM 吞吐量优化实战:10个KV-Cache调优方法让tokens/sec翻倍

十个经过实战检验的 vLLM KV-cache 优化方法 —— 量化、分块预填充、前缀重用、滑动窗口、ROPE 缩放、后端选择等等 —— 提升 tokens/sec。

1723 10
|
5月前
|
缓存 运维 监控
|

vLLM推理加速指南:7个技巧让QPS提升30-60%

GPU资源有限,提升推理效率需多管齐下。本文分享vLLM实战调优七招:请求塑形、KV缓存复用、推测解码、量化、并行策略、准入控制与预热监控。结合代码与数据,助你最大化吞吐、降低延迟,实现高QPS稳定服务。

1516 7
|
2月前
|
机器学习/深度学习 人工智能 算法
|

大模型微调新篇章:从“学会知识”到“理解偏好”,PPO算法全解析与实践指南

本文深入解析大模型对齐人类偏好的核心技术——近端策略优化(PPO)。从原理到实践,详解PPO如何通过Actor、Reference、Reward与Critic四模型协作,结合强化学习实现更自然、安全、有用的对话。涵盖训练流程、常见问题、评估方法及进阶技巧,并以LLaMA-Factory为例演示操作,助力开发者快速上手,打造更“懂你”的AI助手。

539 3
|
3月前
|
缓存 前端开发 JavaScript
|

Vue微服务架构实践:从单应用到微前端的落地方案

本文详解Vue微前端架构,针对大型项目面临的代码冗余、协作困难等问题,拆解从子应用改造、主应用搭建到部署优化的全流程。基于qiankun框架,实现团队独立开发、技术栈灵活、增量升级与独立部署,提升系统可维护性与扩展性,为中大型前端项目提供落地实践方案。

444 0
|
4月前
|
人工智能 分布式计算 运维
|

阿里云携手 MiniMax 构建云原生数仓最佳实践:大模型时代的 Data + AI 数据处理平台

MiniMax 是全球领先的通用人工智能公司,致力于推动AGI发展。依托自研多模态大模型,服务超200国1.57亿用户及5万企业客户。携手阿里云构建云原生数仓与Data+AI平台,实现数据高效处理、成本大幅降低,支撑全球业务高速迭代与AI创新落地。

817 107
|
10月前
|
网络安全 开发工具 git
|

Git仓库创建与代码上传指南

本教程介绍了将本地项目推送到远程Git仓库的完整流程,包括初始化本地仓库、添加和提交文件、创建远程仓库、关联远程地址及推送代码。同时,还提供了`.gitignore`配置、分支管理等可选步骤,并针对常见问题(如认证失败、分支不匹配、大文件处理及推送冲突)给出了解决方案。适合初学者快速上手Git版本控制。

3772 1
|
14天前
|
安全 网络协议 网络安全
|

Socks5代理隐私保护攻略:高效、安全,一步到位

在数字时代,Socks5代理成隐私防护利器:作为会话层中介,隐藏真实IP、兼容TCP/UDP、不篡改数据,并支持认证。高效使用需选优质节点、合理配置协议、搭配加密工具防DNS泄漏,合规使用方能构筑“隐形防护盾”。

156 1
|
1月前
|
人工智能 自然语言处理 运维
|

GEO推广服务深度解读:AI搜索时代的企业流量新范式

生成式AI重塑搜索生态,“关键词搜索”正被“自然语言提问+AI生成答案”取代。GEO(生成式引擎优化)应运而生——它不追求页面排名,而致力于让企业内容成为AI回答中的权威引用源。本文系统解析GEO的技术原理、核心价值、落地路径与未来趋势,助力企业抢占AI搜索时代增长先机。(239字)

275 0
|
2月前
|
存储 数据采集 数据处理
|

大模型RAG实战:从零搭建专属知识库问答助手

本文介绍如何用RAG技术从零搭建个人Python知识库问答助手,无需代码基础,低成本实现智能问答。涵盖数据准备、向量存储、检索生成全流程,附避坑技巧与优化方法,助力新手快速上手大模型应用。

617 0
|
3月前
|
机器学习/深度学习 算法 PyTorch
|

机器学习:模型训练术语大扫盲——别再混淆Step、Epoch和Iter等

本文用通俗类比讲清机器学习核心术语:Epoch是完整训练一轮,Batch Size是每次训练的数据量,Step/Iter是每批数据处理及参数更新的最小单位。结合学习率、损失值、过拟合等概念,帮你快速掌握训练过程关键要点,打通术语任督二脉。(238字)

943 9
|
1月前
|
数据采集 人工智能 监控
|

别让大模型“学废了”!从数据清洗到参数调优,一次讲透微调实战

本文深入浅出讲解大模型微调(Fine-tuning):为何需要“岗前培训”,如何通过数据准备、参数调优(如LoRA)、训练监控与效果评估,让通用模型精准适配专业场景。强调“数据质量>数量”“监控胜过猜测”,助力开发者高效落地AI定制化应用。(239字)

300 4
|
2月前
|
数据采集 人工智能 监控
|

告别“垃圾进垃圾出”:打造高质量数据集的完整指南

本文深入解析AI时代“数据比算法更重要”的核心理念,系统阐述高质量数据集的定义、黄金标准(含16条可操作规范)与七步构建法,并提供自动化检查、基线验证及人工评审等实用评估手段,助力开发者高效打造可靠、合规、可持续迭代的优质训练数据。(239字)

422 12
|
3月前
|
SQL Java 关系型数据库
|

二、Hive安装部署详细过程

手把手教你完成 Hive 的安装、配置和可视化连接,适合初学者快速搭建自己的大数据分析平台。内容涵盖从环境准备、Metastore配置,到 DataGrip 连接的全流程,并附带实用的排错指南,助你轻松迈出 Hive 入门第一步。

743 14

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

6
今日
69174
内容
128
活动
439740
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务