|
4月前
|
数据采集 人工智能 监控
|

从原理到实操:大模型微调效果评估完全指南

微调大模型后如何判断效果?本文系统讲解评估核心方法:结合人工与自动化评估,覆盖通用能力与专项技能。通过明确目标、构建测试集、选用工具(如OpenCompass)、分析结果四步,打造完整评估体系。强调“对比”与“迭代”,助你避免灾难性遗忘,真实提升模型性能。

550 3
|
4月前
|
消息中间件 运维 监控
|

别只盯着充电枪:聊聊一个真正“能赚钱、能扩展、能运维”的智慧充电桩系统架构

别只盯着充电枪:聊聊一个真正“能赚钱、能扩展、能运维”的智慧充电桩系统架构

293 7
|
4月前
|
数据采集 人工智能 算法
|

AI数字人技术厂商市场格局观察

AI数字人技术正从娱乐迈向多元实用场景,2024年市场规模达41.2亿元,增速超85%。世优科技深耕全栈技术,拥60余项专利,服务千余家品牌,助力政企智能化升级,推动行业向标准化、生态化发展。

321 1
来自: 人工智能平台PAI  版块
|
4月前
|
人工智能 自然语言处理 搜索推荐
|

当AI搜索“偏爱”某些信息:GEO优化的技术逻辑与生活影响

AI搜索时代,信息分发由GEO优化主导:它通过语义匹配、结构化呈现与可信度背书,让优质内容被AI“选中”。从亲子游到咖啡机推荐,企业、个人皆需掌握这一新规则,重塑信息传播方式,提升曝光效率。

488 2
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
|

复旦大学×阿里云产学合作协同育人合作案例

复旦大学联合阿里云开展“天池AI案例100开发”项目,赵卫东团队依托产业级平台构建“理论-实训-实战”教学新体系,开发4大综合性AI案例,覆盖图像识别、自然语言处理等方向。通过MOOC、教材、师资培训多渠道辐射全国,累计惠及超13万学习者,形成可复制的产教融合示范范式,推动人工智能人才培养与产业需求无缝对接。(238字)

345 5
|
4月前
|
算法 搜索推荐
|

当流量失效之后,企业真正的增长变量是什么?

“系统信任增长范式”提出:当流量红利消退,增长逻辑正从“获取用户”转向“积累可复用的信任资产”。信任不再是话语表达,而是跨时间、跨场景的行为一致性与可验证修复能力。企业需被系统判定为“值得持续推荐”,方能获得长期增长动力。这是一场规则层面的迁移,而非策略优化。

393 4
来自: 智能搜索推荐  版块
|
5月前
|
人工智能 Java 关系型数据库
|

[舍弃,后续需调整][Blog]JPA实现分页需求(☆☆)

本任务要求在博客系统中实现分页查询功能,需掌握SpringBoot、MySQL、Maven及JPA基础知识。建议使用AI辅助开发,预计耗时1-4小时。需自行添加测试数据以展示分页效果,可基于现有工程改造,注重实践而非标准答案。

281 0
|
5月前
|
Kubernetes IDE Java
|

2.部署篇(开发部署)

本文介绍如何将SpringCloud应用部署到Kubernetes云端。通过EDAS导入ACK集群,初始化应用并选择运行环境,开发者可利用IDE插件快速上传JAR/WAR包部署,提升开发效率。后续将讲解运维视角的自动化构建与部署流程。(238字)

140 0
|
5月前
|
XML 算法 安全
|

详解RAG五种分块策略,技术原理、优劣对比与场景选型之道

RAG通过检索与生成结合,提升大模型在企业场景的准确性与安全性。分块策略是其核心,直接影响检索效果与回答质量。本文系统解析五种主流分块方法:固定大小、语义、递归、基于文档结构及LLM分块,对比其优缺点与适用场景,并提出组合优化路径,助力构建高效、可信的RAG系统。

395 0
|
5月前
|
人工智能 JSON 数据挖掘
|

大模型应用开发中MCP与Function Call的关系与区别

MCP与Function Call是大模型应用的两大关键技术。MCP为模型与外部工具提供标准化通信协议,实现跨模型、跨平台集成;Function Call则是模型调用外部函数的内置机制。前者如“蓝牙协议”,支持多设备互联,后者像“语音助手”,限于单机操作。两者在功能上互补:MCP支持工具热插拔、权限控制与远程调用,适用于企业级复杂系统;Function Call开发简单,适合快速验证单一模型能力。未来趋势将走向融合,形成“模型解析-协议传输-工具执行”的分层架构,推动AI应用生态标准化发展。

435 0
|
5月前
|
人工智能 数据处理 Apache
|

Forrester发布流式数据平台报告:Flink 创始团队跻身领导者行列,实时AI能力获权威认可

Ververica,由Apache Flink创始团队创立、阿里云旗下企业,首次入选Forrester 2025流式数据平台领导者象限,凭借在实时AI与流处理领域的技术创新及全场景部署能力获高度认可,成为全球企业构建实时数据基础设施的核心选择。

458 10
来自: 实时计算 Flink  版块
|
5月前
|
SQL 存储 分布式计算
|

Parquet 和 ORC 到底有啥区别?别再云里雾里了,咱今天把列式存储聊明白!

Parquet 和 ORC 到底有啥区别?别再云里雾里了,咱今天把列式存储聊明白!

514 9
|
6月前
|
存储 Web App开发 前端开发
|

新手如何建站.新手建站的全流程

建站是通过整合域名、服务器等要素搭建可访问数字平台的过程,分自助建站、CMS系统和代码开发三类工具。核心流程包括需求规划、域名注册(实名认证)、服务器配置(国内需ICP备案),搭建后填充内容并测试优化,解析域名上线,做好后续维护。

781 10
来自: 人工智能平台PAI  版块
|
6月前
|
供应链 算法 大数据
|

数据不是水晶球,却能让我们少踩 90% 的坑:未来经济预测的真实力量

数据不是水晶球,却能让我们少踩 90% 的坑:未来经济预测的真实力量

393 1
|
6月前
|
运维 Kubernetes Devops
|

从DevOps到GitOps:自动化再进化,运维的未来不靠“人”,靠“流

从DevOps到GitOps:自动化再进化,运维的未来不靠“人”,靠“流

424 3
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
|

教育行业如何做GEO?让AI成为你的课程推荐官

过去,学生找课程靠搜索;现在,他们直接问AI:“附近有哪些性价比高的编程课?”或“商科最好的在线大学?”——AI不会简单罗列链接,而是直接推荐答案。如果你的教育机构没被AI“看见”,可能已经错过了新一轮流量红利。 作为深耕GEO领域的实战团队,数聚酷科技结合教育行业特性,总结出以下可落地的GEO优化策略,帮助你的课程和…

496 6
来自: 智能搜索推荐  版块
|
6月前
|
数据采集 机器学习/深度学习 人工智能
|

AI 十大论文精讲(二):GPT-3 论文全景解析——大模型 + 提示词如何解锁 “举一反三” 能力?

摘要 2020年发表的《Language Models are Few-Shot Learners》(GPT-3论文)开创了AI新时代。该论文突破性地证明:当Transformer模型参数规模扩大到1750亿时,仅通过文本交互即可实现任务无关的少样本学习。GPT-3采用"预训练+提示词"的新范式,无需微调就能在翻译、问答等40+任务上展现强大性能。论文系统验证了模型在语言建模、闭卷问答等9类任务中的表现,其中在LAMBADA长文本任务上准确率达86.4%,较此前最优提升18.4%。这一研

1094 152
|
6月前
|
消息中间件 存储 Kafka
|

流、表与“二元性”的幻象

本文探讨流与表的“二元性”本质,指出实现该特性需具备主键、变更日志语义和物化能力。强调Kafka与Iceberg因缺乏更新语义和主键支持,无法真正实现二元性,唯有统一系统如Flink、Paimon或Fluss才能无缝融合流与表。

461 7
来自: 实时计算 Flink  版块
|
7月前
|
人工智能 运维 监控
|

Flink 智能调优:从人工运维到自动化的实践之路

本文由阿里云Flink产品专家黄睿撰写,基于平台实践经验,深入解析流计算作业资源调优难题。针对人工调优效率低、业务波动影响大等挑战,介绍Flink自动调优架构设计,涵盖监控、定时、智能三种模式,并融合混合计费实现成本优化。展望未来AI化方向,推动运维智能化升级。

923 8
来自: 实时计算 Flink  版块
|
7月前
|
机器学习/深度学习 大数据 关系型数据库
|

基于python大数据的台风灾害分析及预测系统

针对台风灾害预警滞后、精度不足等问题,本研究基于Python与大数据技术,构建多源数据融合的台风预测系统。利用机器学习提升路径与强度预测准确率,结合Django框架实现动态可视化与实时预警,为防灾决策提供科学支持,显著提高应急响应效率,具有重要社会经济价值。

647 4
|
8月前
|
XML JSON 算法
|

京东商品 SKU 信息接口(jingdong.ware.sku.get)技术干货:数据拉取、规格解析与字段治理(附踩坑总结 + 可运行代码)

本文详解京东商品SKU接口对接技术,涵盖核心参数、权限申请、签名生成、规格解析及常见坑点解决方案,结合可运行代码与实战经验,助力开发者高效集成SKU数据,实现库存、价格等关键信息精准获取。

652 1
|
8月前
|
人工智能 JSON 测试技术
|

AI智能体开发实战:从提示工程转向上下文工程的完整指南

曾被热捧的提示工程正逐渐退潮,本文揭示其局限性,并提出“上下文工程”新范式:通过结构化提示、精准上下文管理、工具调用与统一状态,构建可扩展、可恢复、生产级的智能体工作流,推动AI系统迈向工程化与可控化。

949 9
|
8月前
|
存储 人工智能 NoSQL
|

用Context Offloading解决AI Agent上下文污染,提升推理准确性

上下文工程是将AI所需信息(如指令、数据、工具等)动态整合到模型输入中,以提升其表现。本文探讨了“上下文污染”问题,并提出“上下文卸载”策略,通过LangGraph实现,有效缓解长文本处理中的信息干扰与模型幻觉,提升AI代理的决策准确性与稳定性。

1066 2
|
9月前
|
分布式计算 MaxCompute
|

DBeaver连接MaxCompute权限问题

381 1
来自:大数据计算 MaxCompute 版块
|
10月前
|
JSON Java API
|

如何获取sku详情信息

`item_sku`接口用于获取商品的SKU详细信息,支持通过商品ID和SKU ID查询。提供公共参数及请求参数说明,并包含请求和响应示例。支持多种开发语言,如Curl、PHP、JAVA等,适用于电商应用开发。

542 0
|
10月前
|
数据采集 自然语言处理 NoSQL
|

利用中间件实现任务去重与分发精细化:股吧舆情数据采集与分析实战

本项目针对东方财富股吧设计精细化采集方案,解决重复采集、调度混乱与反爬等问题,构建舆情分析数据模型。通过采集帖子内容、用户行为与情绪信号,实现情绪趋势可视化、热点识别与个股预警,助力把握市场风向。

585 0
|
11月前
|
机器学习/深度学习 数据采集 算法
|

Python AutoML框架选型攻略:7个工具性能对比与应用指南

本文系统介绍了主流Python AutoML库的技术特点与适用场景,涵盖AutoGluon、PyCaret、TPOT、Auto-sklearn、H2O AutoML及AutoKeras等工具,帮助开发者根据项目需求高效选择自动化机器学习方案。

1334 1
|
12月前
|
人工智能 开发框架 自然语言处理
|

企业级AI搜索解决方案:阿里云AI搜索开放平台

本文介绍了 阿里云 AI 搜索开放平台作提供丰富的 AI 搜索组件化服务,兼容主流开发框架 LangChain和 LlamaIndex,支持搜索专属大模型、百炼等大模型服务,以及 Elasticsearch、Havenask 等开源引擎。用户可灵活调用多模态数据解析、大语言模型、效果测评等数十个服务,实现智能搜索、检索增强生成(RAG)、多模态搜索等场景的搭建。

1136 0
来自: 智能搜索推荐  版块
|
13天前
|
数据采集 Java API
|

拒绝 403 Forbidden!实战解析全球流媒体元数据的高并发爬虫架构(附完整核心源码)

这篇文档介绍了使用Python和代理构建流媒体平台元数据采集方案。包括动态代理池配置、伪装浏览器指纹、实战Demo、高并发避坑指南。旨在帮助构建稳定有效的采集方案。

102 2
|
1月前
|
人工智能 JSON 监控
|

天猫商品详情API数据解析

天猫商品详情API解析方案,涵盖taobao/tmall.item.get接口字段说明、JSON结构、解析代码及SKU/详情图/规格提取。支持价格库存、竞品监测、舆情预警等场景,AI智能清洗、卖点解析与爆款预测,助力中小卖家高效用数。(239字)

153 0
|
1月前
|
监控 安全 Unix
|

智慧港口:NTP时钟服务器赋能铸造网络高墙

智慧港口依托NTP时钟服务器构建高精度时间同步网络,为视频监控、智能闸口、广播等弱电系统提供毫秒级统一授时。系统融合GPS/北斗双模授时、多网口隔离输出、子钟自动校对、远程监测告警及灵活扩展能力,筑牢港口数字化运营的时间基石。(239字)

197 1
|
1月前
|
存储 人工智能 API
|

基于Flutter3.41+Dart3.11+DeepSeek生成式AI对话应用App助手

Flutter3.41+Dart3+Dio+Getx+Markdown聚合DeepSeek-chat实战AI流式打字智能会话模板。新增深度思考模式、latex公式、mermaid图表,代码高亮/复制代码、图片预览、链接、表格等功能。

150 4
|
1月前
|
并行计算 算法框架/工具 iOS开发
|

TorchRec在macos ARM芯片(Apple Silicon)上无法安装

JaggedTensor等在macOS ARM芯片上无法运行,主因是ARM64与x86_64架构不兼容,且TorchRec深度依赖CUDA——而Apple Silicon仅支持Metal。fbgemm-gpu缺失、Rosetta 2不支持CUDA指令,导致关键操作失败。建议改用MLX框架或标准PyTorch张量替代。

281 4
来自: 智能搜索推荐  版块
|
1月前
|
算法 调度 数据库
|

演化计算与抽样方法构造新算法流程:从 AlphaEvolve 看 LLM × EA 融合范式

本文系统解析AlphaEvolve——Google DeepMind提出的LLM×EA融合新范式:以语义引导的抽样机制、双模型协同进化(Gemini Flash+Pro)、自动评估闭环,实现算法的自主发现与优化,已突破矩阵乘法纪录并提升训练效率。(239字)

262 15
|
2月前
|
自然语言处理
|

别再只会“复制粘贴数据”了:聊聊 NLP 数据增强的那些实战骚操作

别再只会“复制粘贴数据”了:聊聊 NLP 数据增强的那些实战骚操作

241 3
|
2月前
|
安全
|

1949AI 零代码本地自动化工具:轻量化部署适配低配置电脑设备

本文介绍1949AI轻量化本地自动化方案:零代码、免配置、纯本地运行,安全合规无数据外传;低资源占用,兼容低配电脑;面向小白用户,三步搞定表格整理、文件批量重命名等重复任务,离线可用,开箱即用。(239字)

440 0
|
2月前
|
机器学习/深度学习 人工智能 算法
|

SEP-YOLO:当频域分析遇上YOLO,透明物体实例分割迎来新突破,ISCAS 2026

本文提出SEP-YOLO框架,首创频域细节增强模块(可学习复数权重强化高频边界)、多尺度空间细化流(内容感知对齐+门控细化),并为Trans10K提供首个高质量实例标注。在Trans10K/GVD上mAP50超SOTA 3%+,兼顾精度与实时性。

318 5
|
2月前
|
人工智能 自然语言处理 数据管理
|

零安装在线网站制作,为什么正在成为新主流

零安装在线网站制作将开发环境云端化,用户无需配置本地环境,打开浏览器即可完成建站、编码、数据管理与部署。依托浏览器能力提升、云基建成熟及AI生成技术,如lynxcode(原lynx AI)支持自然语言生成全栈代码,大幅降低门槛,加速原型验证与快速迭代,尤其适合创业者与非技术人员。

236 5
|
3月前
|
存储 人工智能 缓存
|

一种基于分层记忆与注意力约束的对话AI架构

本文提出一种新型对话AI记忆架构:从空白记忆库起步,分三层(核心/中层/临时)动态存储信息;通过两层过滤(模型识别+用户反馈)精准入库;采用注意力降压、高频抑制等机制杜绝复读;核心记忆上锁保护,满库自动清理。让AI真正“记得住、不啰嗦、不乱记、越聊越懂你”。(239字)

471 4
|
3月前
|
人工智能 机器人 API
|

从“调个 API”到“自己养模型”:用 Python 快速构建聊天机器人的完整路径

从“调个 API”到“自己养模型”:用 Python 快速构建聊天机器人的完整路径

464 4
|
3月前
|
缓存 负载均衡 安全
|

Nginx 反向代理:原理、优势与配置指南

Nginx反向代理是核心服务器架构技术,可实现请求转发、负载均衡、高可用与安全防护。它隐藏后端服务器,自动剔除故障节点,并支持SSL终止、缓存等高级功能,配置简洁灵活,广泛应用于高性能Web系统。

484 13
|
3月前
|
人工智能 物联网 Shell
|

告别“人工智障”:零代码驯服大语言模型,打造你的专属AI助手

本文详解大模型微调(Fine-tuning)如何破解通用AI“懂但不专”的痛点:用专属数据为大模型做“岗前培训”。全程零代码、纯在线,基于ModelScope与QLoRA技术,30分钟即可完成Yi-6B模型微调,重塑其身份认知。兼顾原理通俗解读与手把手实战,助你真正掌握“塑造AI”的主动权。(239字)

400 3
|
4月前
|
存储 机器学习/深度学习 人工智能
|

别让大模型“失忆”:手把手教你用向量数据库打造它的专属知识库

本文深入浅出地讲解向量数据库原理与实践:用“语义身份证”比喻Embedding,以图书管理员类比关键词与语义搜索差异;手把手用Python+Faiss+BGE搭建中文语义检索系统,并详解RAG流程、效果评估与调优要点,助你为大模型装配真正懂业务的“外挂大脑”。

552 4
|
4月前
|
SQL 机器学习/深度学习 运维
|

MLflow / Feast 实战手记:MLOps 不是装工具,是治内伤

MLflow / Feast 实战手记:MLOps 不是装工具,是治内伤

270 13
|
4月前
|
人工智能 运维 物联网
|

民用卡 vs 专业卡 vs 云 GPU:大模型微调该选哪种?

本文深入解析大模型微调中民用卡、专业卡与云GPU的选型难题,从显存、算力、稳定性、成本四大维度对比三类GPU差异,结合个人、团队、企业不同场景,提供“三步选型法”与实测数据,帮你匹配最优方案,实现性能与成本的平衡。

489 2
|
4月前
|
SQL 人工智能 自然语言处理
|

企业落地 AI 数据分析,如何做好敏感数据安全防护?

在 AI 问数时代,数据安全与使用效率并非零和博弈。

414 8
|
4月前
|
消息中间件 Prometheus 监控
|

别等系统“凉了”才响铃:聊聊延迟敏感系统的监控与报警设计

别等系统“凉了”才响铃:聊聊延迟敏感系统的监控与报警设计

445 4
|
4月前
|
数据采集 JSON 监控
|

淘宝商品评论API使用指南

淘宝商品评论API可批量获取指定商品的评论数据,支持筛选评价类型、分页查询及提取评论内容、评分、晒图、买家信息等。需入驻淘宝开放平台,获取AppKey/AppSecret,调用接口taobao.item.review.get,通过签名验证,实现结构化数据采集,适用于电商分析与口碑监控。(239字)

308 1
|
5月前
|
运维 Devops 开发工具
|

生产环境缺陷管理

为解决大型团队多分支开发中bug管理混乱、人为疏漏导致生产事故的问题,我们基于go-git开发了分布式工具git-poison。它实现bug的追溯、查询与发布卡点,自动化同步“投毒-解毒”信息,阻塞带未修复bug的版本发布,降低协同成本,避免“重复翻车”。已集成至发布与运维平台,提升缺陷管理效率与系统稳定性。

317 0

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69522
内容
128
活动
439956
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务