|
自然语言处理 机器人 人机交互
|

智能语音交互概述(一)

智能语音交互概述(一)

1586 0
|
数据采集 消息中间件 关系型数据库
|

数据采集(二)

数据采集(二)

1362 0
|
机器学习/深度学习 数据采集 人工智能
|

LLM系列 | 02: Vicuna简介及模型部署实测

今天这篇小作文主要介绍Vicuna模型、基于官方模型13B模型部署服务及对话实测。

5038 1
|
安全 小程序 搜索推荐
|

HTTPS证书是什么?

HTTPS证书准确来说是SSL证书(安全套接字层)或数字证书负责在您的网站和访问者浏览器之间创建安全连接。它确保网站和浏览器之间传递的所有数据保持私密和安全。当您使用SSL加密时,黑客将无法窃取您的私人信息,包括信用卡和借记卡号码、登录详细信息。

1395 0
|
分布式计算 自然语言处理 DataWorks
|

高效使用 PyODPS 最佳实践

以更清晰的认知 PyODPS,DataWorks PyODPS 节点以及 PyODPS 何时在计算集群运行,开发者如何利用 PyODPS 更高效地进行数据开发。

18934 3
来自: 大数据计算 MaxCompute  版块
|
搜索推荐 测试技术 定位技术
|

DCN(Deep & Cross Network)模型在手淘分类地图CTR预估上的应用

一:背景       分类地图业务是指手淘首页首屏的"分类"入口,目前整个产品已经有300万左右日活跃用户和6000多万pv, 目前产品业务点较多,本文重点介绍点击品类词后的商品二跳页模块,具体如下图所示:当用户点击相应的品类词图片后,则会进入该类目下的商品集合。

11267 0
来自: 智能搜索推荐  版块
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
|

驯服AI的魔法:PPO是如何让机器学会说人话的

本文深入浅出解析PPO算法如何赋能RLHF,解决AI“说人话”的核心难题:通过策略限制与价值函数估计,使大模型学会语气适配、内容得体、表达自然的对话能力,推动从机械输出到人性交互的关键跃迁。

27 1

chunk size 变大,模型为什么更容易胡说

本文揭示RAG中最隐蔽的风险:增大chunk size看似提升回答完整性,实则削弱模型对不确定性的识别能力。它不增加真实知识,反掩盖证据缺口、混淆适用条件、抑制合理拒答,将“答不出”悄然转为“答得像却错”。警惕“自信幻觉”,回归证据单元设计本质。

50 1
|
21天前
|
人工智能 PyTorch 算法框架/工具
|

在无网络与8G内存约束下,个人计算机部署AI实践

本文探讨在无网络、仅8GB内存、无GPU的老旧PC上本地部署大语言模型的实践路径。通过构建纯净Python环境、选用PyTorch格式小模型(Qwen1.5-0.5B)、规避系统陷阱(如长路径限制、注册表关联错误等),成功实现离线中文对话,形成可复现的避坑指南与技术参考。(239字)

258 13
|
1月前
|
弹性计算 小程序 关系型数据库
|

阿里云服务器多少钱一年?整理2026年云服务器新购、续费和升级配置费用清单

阿里云2026年服务器价格出炉!轻量服务器低至38元/年,ECS新购续费同价,2核2G仅99元/年起。本文详解轻量服务器与ECS区别、配置费用、升级规则及省钱技巧,助你选对方案,轻松上云,一年省下上千元。

298 1
|
2月前
|
SQL NoSQL 前端开发
|

大厂如何解决订单幂等问题

本文详解分布式系统中订单接口幂等性设计:通过唯一订单号与数据库主键约束防止重复下单,结合Redis标识记录确保请求仅处理一次;针对ABA问题,引入版本号机制,更新时校验并自增版本,保证数据一致性。方案适用于各类数据库场景,保障服务在重试、并发下数据准确。

130 0
|
2月前
|
机器学习/深度学习 存储 自然语言处理
|

大模型基础概念术语解释

大语言模型(LLM)基于Transformer架构,通过海量文本训练,实现强大语言理解与生成。其核心为自注意力机制,结合Token化、位置编码与嵌入层,支持万亿级参数规模。参数增长带来涌现能力,如复杂推理与泛化性能。混合专家模型(MoE)提升效率,推动模型持续扩展。

342 0
|
4月前
|
人工智能 运维 监控
|

Flink 智能调优:从人工运维到自动化的实践之路

本文由阿里云Flink产品专家黄睿撰写,基于平台实践经验,深入解析流计算作业资源调优难题。针对人工调优效率低、业务波动影响大等挑战,介绍Flink自动调优架构设计,涵盖监控、定时、智能三种模式,并融合混合计费实现成本优化。展望未来AI化方向,推动运维智能化升级。

756 8
来自: 实时计算 Flink  版块
|
5月前
|
Web App开发 前端开发 vr&ar
|

虚拟办公室,不再只是噱头:一步步教你构建沉浸式工作空间

虚拟办公室,不再只是噱头:一步步教你构建沉浸式工作空间

336 7
|
9月前
|
机器学习/深度学习 Python
|

拯救数据不平衡:imbalanced-learn库详解

当你的数据像翘翘板一样严重倾斜时,该如何挽救你的机器学习模型?本文详解imbalanced-learn库的四大绝招,帮你轻松应对数据不平衡问题,提升模型性能。

370 8
|
11月前
|
供应链 API 开发者
|

1688商品列表API接口详解

1688是国内知名的批发采购平台,提供海量商品资源。开发者通过1688商品列表API可获取商品的名称、价格、销量等信息,支持构建电商数据分析工具、比价应用等。接口采用HTTP GET/POST请求,需提供关键词、页码、每页数量等必填参数,响应数据包含商品列表及总记录数。示例代码展示了如何使用Python进行请求和处理响应。供稿者:Taobaoapi2014。

338 5
|
Ubuntu Linux Shell
|

/etc/rc.d/rc.local 的作用

/etc/rc.d/rc.local是Linux系统中的一个重要配置文件,其主要作用是在系统启动时执行特定的命令或脚本。以下是关于/etc/rc.d/rc.local的详细解释: ### 作用 * **系统启动任务配置**:该文件允许系统管理员或用户配置在系统启动时需要自动运行的任务。这些任务可以是启动服务、运行特定程序或执行脚本等。 * **开机自启动程序**:通过编辑/etc/rc.d/rc.local文件,用户可以自定义开机启动程序。只需将需要开机启动的程序命令或脚本路径添加到该文件中,并在系统启动时该文件将被自动执行。 ### 文件内容 * 通常包含一个shell脚本,该脚本在

1236 12
|
机器学习/深度学习 数据采集 数据挖掘
|

11种经典时间序列预测方法:理论、Python实现与应用

本文将总结11种经典的时间序列预测方法,并提供它们在Python中的实现示例。

3558 2
|
编解码
|

「4K Ultra HD蓝光」与普通蓝光有何区别?

本文将介绍 4K Ultra HD蓝光的特征并总结它与普通蓝光的区别,如果您对蓝光光盘的知识有兴趣,或者计划购买新的蓝光播放机,那么可以参考本文。

2221 0
|
存储 数据采集 人工智能
|

重磅再推 | 基于OpenSearch向量检索版+大模型,搭建对话式搜索

阿里云OpenSearch再推面向企业开发者的PaaS方案:基于OpenSearch向量检索版,为企业开发者提供性能表现优秀、性价比优异的向量检索服务,并提供与大模型结合脚本工具,用户可在使用能力可靠的向量检索服务的同时,自由选择文档切片方案、向量化模型、大语言模型。

16684 1
来自: 智能搜索推荐  版块
|
存储 分布式计算 运维
|

钱大妈数据中台建设最佳实践

钱大妈数据中台建设最佳实践

9806 2
来自: 实时数仓 Hologres  版块
|
固态存储 Java 弹性计算
|

【最佳实践】简单配置,实现Filebeat多行日志传送

在解决应用程序问题时,多行日志为开发人员提供了宝贵的信息。 堆栈跟踪就是一个例子。 堆栈跟踪是引发异常时应用程序处于中间的一系列方法调用。 堆栈跟踪包括遇到错误的相关行以及错误本身。

10381 0
|
搜索推荐 流计算
|

基于实时计算(Flink)打造一个简单的实时推荐系统

本文为您介绍如何基于阿里云实时计算快速搭建实时推荐系统。

15350 1
来自: 实时计算 Flink  版块
|
弹性计算 数据可视化 API
|

数据库开放权限太危险,又不想写API。DataV给你另外一个选择。

~ DataV 后台21日晚上线,现在暂时还不能用哦 ~ DataV 增加了一个新的数据代理协议,旨在提供更安全的数据查询。它将 SQL 查询字符串和数据库 id 加密后传到这个应用,而后这个应用连接数据库将查询后的结果返回到 DataV 的页面中。 根据新的协议,我做了一个示例应用在githu

47546 141
来自: 数据可视化DataV  版块
|
算法 搜索推荐 前端开发
|

搜索双链路实时计算体系@双11实战

该文章来自阿里巴巴技术协会(ATA)精选集  0. 前言 何为双链路实时计算体系?微观实时计算链路 a) 最细粒度商品/店铺/用户数据的实时 b) 底层模型的实时宏观实时计算链路 相比微观实时,宏观实时的对象粒度更粗,更上层 a) 以实时效果为目标,基于bandit learning的实

16261 0
来自: 智能搜索推荐  版块
|
7天前
|
安全 搜索推荐 物联网
|

微调后模型“记住用户信息”,通常发生在什么阶段

本文揭示模型“记住用户信息”并非突发事故,而是贯穿预训练、SFT、LoRA微调、偏好对齐等七阶段的渐进式演化过程。关键在于:**不是模型学会了记忆,而是训练中持续奖励“具体化”,使用户特征被逐步绑定、放大并合法化。** 风险隐蔽且无明显红线,需在各环节警惕“身份可推断性”。

51 4
|
1月前
|
编解码 并行计算 物联网
|

【实战教程】Flux.1-dev 360° 全景驾驶舱:从零到一的“零坑”部署指南

本教程教你如何在24G显存单卡环境下部署超大文生图模型Flux.1-dev。通过ModelScope极速下载、Hugging Face身份鉴权与显存顺序卸载技术,解决下载慢、授权难、显存溢出等问题,实现稳定推理。

269 1
|
2月前
|
缓存 算法 Java
|

线程池

本文深入剖析Java线程池的实现原理,涵盖ThreadPoolExecutor与ScheduledThreadPoolExecutor的核心机制,解析线程复用、任务队列、调度策略及Executors工具类,帮助开发者理解其底层架构与工作流程。

78 0
|
3月前
|
消息中间件 存储 Kafka
|

流、表与“二元性”的幻象

本文探讨流与表的“二元性”本质,指出实现该特性需具备主键、变更日志语义和物化能力。强调Kafka与Iceberg因缺乏更新语义和主键支持,无法真正实现二元性,唯有统一系统如Flink、Paimon或Fluss才能无缝融合流与表。

362 7
来自: 实时计算 Flink  版块
|
4月前
|
机器学习/深度学习 数据采集 人工智能
|

从ChatGPT到文心一言:AI为什么能“懂人话”?——大语言模型的底层逻辑揭秘

从ChatGPT到文心一言:AI为什么能“懂人话”?——大语言模型的底层逻辑揭秘

626 9
|
5月前
|
JavaScript Java 关系型数据库
|

基于springboot的快递分拣管理系统

本系统基于SpringBoot框架,结合Java、MySQL与Vue技术,构建智能化快递分拣管理平台。通过自动化识别、精准分拣与实时跟踪,提升分拣效率与准确性,降低人力成本,推动快递行业向智能化、高效化转型,助力电商物流高质量发展。

702 0
|
5月前
|
存储 编解码 监控
|

针对3-15分钟视频的抽帧策略:让Qwen2.5 VL 32B理解视频内容

针对3-15分钟视频,提出高效抽帧策略:通过每5-10秒定间隔或关键帧检测方法,提取30-100帧关键图像,结合时间均匀采样与运动变化捕捉,降低冗余,提升Qwen2.5 VL 32B对视频内容的理解效率与准确性。

1161 2
|
5月前
|
数据可视化 搜索推荐 大数据
|

基于python大数据的北京旅游可视化及分析系统

本文深入探讨智慧旅游系统的背景、意义及研究现状,分析其在旅游业中的作用与发展潜力,介绍平台架构、技术创新、数据挖掘与服务优化等核心内容,并展示系统实现界面。

385 3
|
6月前
|
Java 测试技术 API
|

2025 年 Java 开发者必知的最新技术实操指南全览

本指南涵盖Java 21+核心实操,详解虚拟线程、Spring Boot 3.3+GraalVM、Jakarta EE 10+MicroProfile 6微服务开发,并提供现代Java开发最佳实践,助力开发者高效构建高性能应用。

973 4
|
6月前
|
存储 分布式计算 数据处理
|

「48小时极速反馈」阿里云实时计算Flink广招天下英雄

阿里云实时计算Flink团队,全球领先的流计算引擎缔造者,支撑双11万亿级数据处理,推动Apache Flink技术发展。现招募Flink执行引擎、存储引擎、数据通道、平台管控及产品经理人才,地点覆盖北京、杭州、上海。技术深度参与开源核心,打造企业级实时计算解决方案,助力全球企业实现毫秒洞察。

649 0
来自: 实时计算 Flink  版块
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
|

原来AI也能“读心术”?——聊聊AI在心理学研究中的那些突破

原来AI也能“读心术”?——聊聊AI在心理学研究中的那些突破

341 1
|
7月前
|
人工智能 自然语言处理 搜索推荐
|

AI做广告,效果还真不差?聊聊怎么用AI搞定个性化广告创作

AI做广告,效果还真不差?聊聊怎么用AI搞定个性化广告创作

444 7
|
8月前
|
SQL 数据建模 关系型数据库
|

别光知道存数据库了,数据建模才是王道!(入门指南+实战代码)

别光知道存数据库了,数据建模才是王道!(入门指南+实战代码)

1621 4
|
8月前
|
人工智能 前端开发 搜索推荐
|

LangGraph实战教程:构建会思考、能记忆、可人工干预的多智能体AI系统

本文介绍了使用LangGraph和LangSmith构建企业级多智能体AI系统的完整流程。从简单的ReAct智能体开始,逐步扩展至包含身份验证、人工干预、长期内存管理和性能评估的复杂架构。文章详细讲解了状态管理、工具集成、条件流程控制等关键技术,并对比了监督者架构与群体架构的优劣。通过系统化的方法,展示了如何构建可靠、可扩展的AI系统,为现代AI应用开发提供了坚实基础。*作者:Fareed Khan*

1890 0
|
9月前
|
定位技术 API
|

HarmonyOS实战:高德地图定位功能完整流程详解

本文详细介绍了在鸿蒙系统中使用高德地图实现完整定位功能的流程。首先分析需求,包括权限申请、检查GPS状态、单次或多次定位选择以及定位失败处理。接着通过代码实现具体步骤:添加定位权限、申请用户权限、检查GPS开关状态、启动定位服务,并处理定位成功或失败的情况。若定位失败,可尝试获取历史定位信息或使用默认位置。最后总结指出,虽然定位功能基础简单,但完整的流程与细节处理才是关键。建议读者动手实践,掌握高德地图定位功能的使用。

1262 15
|
11月前
|
算法
|

重磅!2025年中科院预警期刊名单正式发布!

中国科学院文献情报中心发布的《国际期刊预警名单》旨在防范学术不端与不当出版行为,保护科研生态良性发展。2025年版本聚焦两大问题:学术不端(如引用操纵、论文工厂)和不利于中国学术成果国际化传播的行为(如中国作者占比过高或APC费用不合理)。预警名单动态调整,发布时点从年底改为年初,便于科研人员及时调整投稿策略。被列入预警名单的期刊可能影响职称评审及科研经费认可,建议优先选择中科院分区表推荐期刊,警惕“快速代发”陷阱,并关注期刊官网声明。未来科研生态将更注重规范化与原创性,推动高质量学术发表。维护健康的学术环境对提升中国科研全球影响力至关重要。

1740 0
|
人工智能 算法 物联网
|

企业级RAG全链路优化关键技术

本文深入解析了企业级RAG全链路的关键技术、效果优化、性能优化及应用实践。

2694 2
|
存储 Ubuntu 搜索推荐
|

构建多用户的 Jupyter 服务器 —— 利用 JupyterHub

【8月更文第29天】**摘要** JupyterHub 是一个易于使用的、可伸缩的、多用户的 Jupyter Notebook 服务器。它允许您在一个集中式服务器上托管多个独立的 Jupyter Notebook 会话,非常适合团队协作和教学环境。本文将详细介绍如何安装和配置 JupyterHub,以及如何利用它来构建一个多用户 Jupyter 服务器环境。

5304 0
|
机器学习/深度学习 并行计算 PyTorch
|

ONNX 优化技巧:加速模型推理

【8月更文第27天】ONNX (Open Neural Network Exchange) 是一个开放格式,用于表示机器学习模型,使模型能够在多种框架之间进行转换。ONNX Runtime (ORT) 是一个高效的推理引擎,旨在加速模型的部署。本文将介绍如何使用 ONNX Runtime 和相关工具来优化模型的推理速度和资源消耗。

7397 4
|
机器学习/深度学习 人工智能 供应链
|

AI在各行业的具体应用与未来展望

人工智能(Artificial Intelligence, AI)作为一项颠覆性技术,正在逐步改变我们的生活和工作方式。从语音助手到自动驾驶汽车,AI的应用已经深入到各个领域。本文将详细探讨AI在不同行业中的具体应用,以及未来可能的发展方向。

4237 6
|
存储 人工智能 安全
|

使用‘消除’技术绕过LLM的安全机制,不用训练就可以创建自己的nsfw模型

本文探讨了一种名为“abliteration”的技术,该技术能够在不重新训练大型语言模型(LLM)的情况下移除其内置的安全审查机制。通常,LLM在接收到潜在有害输入时会拒绝执行,但这一安全特性牺牲了模型的灵活性。通过对模型残差流的分析,研究人员发现可以识别并消除导致拒绝行为的特定方向,从而允许模型响应所有类型的提示。

2243 1
|
传感器 算法 机器人
|

基于 IMU 的位姿解算

解算 IMU 采样数据的过程与惯导解算技术原理有关,而提高定位精度的方法主要依赖于IMU自身精度的提高和算法改进。

2502 0
|
机器学习/深度学习 人工智能 数据挖掘
|

基于神经网络——鸢尾花识别(Iris)

鸢尾花识别是学习AI入门的案例,这里和大家分享下使用Tensorflow 2框架,编写程序,获取鸢尾花数据,搭建神经网络,最后训练和识别鸢尾花。

763 0
|
传感器 机器人 C++
|

机器人操作系统ROS 编程开发--详细总结

最近工作涉及到自动驾驶的,需要学习ROS,学习中总结了一些知识点,分享给大家。 机器人操作系统ROS,是一种分布式处理框架(又名Nodes),ROS常用C++和python编程语言开发;(这里项目开发采用C++ 11版本)。ROS的点对点设计以及服务和节点管理器等机制,可以分散由计算机视觉和语音识别等功能带来的实时计算压力,能够适应多机器人遇到的挑战。ROS免费并且开源。

3442 0
|
存储 人工智能 分布式计算
|

【云栖2023】张治国:MaxCompute架构升级及开放性解读

本文根据2023云栖大会演讲实录整理而成,演讲信息如下 演讲人:张治国|阿里云智能计算平台研究员、阿里云MaxCompute负责人 演讲主题:MaxCompute架构升级及开放性解读 活动:2023云栖大会

61886 17
来自: 大数据计算 MaxCompute  版块

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69094
内容
128
活动
439688
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务