|
机器学习/深度学习 数据采集 数据可视化
|

使用Python实现深度学习模型:智能舆情监测与分析

【8月更文挑战第16天】 使用Python实现深度学习模型:智能舆情监测与分析

1023 1
|
SQL 分布式计算 DataWorks
|

MaxCompute产品使用合集之整库离线同步至MC的配置中,是否可以清除原表所有分区数据的功能

MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。

259 6
来自: 大数据计算 MaxCompute  版块
|
SQL 消息中间件 关系型数据库
|

ClickHouse(10)ClickHouse合并树MergeTree家族表引擎之ReplacingMergeTree详细解析

`ReplacingMergeTree`是ClickHouse的一种表引擎,用于数据去重。与`MergeTree`不同,它在合并分区时删除重复行,但不保证无重复。去重基于`ORDER BY`列,在ver列未指定时保留最新行,否则保留ver值最大者。数据处理策略包括延迟合并导致的不确定性及按分区去重。`CREATE TABLE`语法中,`ReplacingMergeTree`需要指定可选的`ver`列。相关系列文章提供了更深入的解析。

1153 0
|
人工智能 监控 开发者
|

阿里云PAI发布DeepRec Extension,打造稳定高效的分布式训练,并宣布开源!

阿里云人工智能平台PAI正式发布自研的 DeepRec Extension(即 DeepRec 扩展),旨在以更低成本,更高效率进行稀疏模型的分布式训练。

1037 6
来自: 人工智能平台PAI  版块
|
SQL HIVE
|

【Hive SQL 每日一题】环比增长率、环比增长率、复合增长率

该文介绍了环比增长率、同比增长率和复合增长率的概念及计算公式,并提供了SQL代码示例来计算商品的月度增长率。环比增长率是相邻两期数据的增长率,同比增长率是与去年同期相比的增长率,复合增长率则是连续时间段内平均增长的速率。文章还包含了一组销售数据用于演示如何运用这些增长率进行计算。

1283 4
|
SQL 存储 JSON
|

Hive 解析 JSON 字符串数据的实现方式

Hive 提供 `get_json_object` 函数解析 JSON 字符串,如 `{"database":"maxwell"}`。`path` 参数使用 `$`、`.`、`[]` 和 `*` 来提取数据。示例中展示了如何解析复杂 JSON 并存储到表中。此外,Hive 3.0.0及以上版本内置 `JsonSerDe` 支持直接处理 JSON 文件,无需手动解析。创建表时指定 `JsonSerDe` 序列化器,并在 HDFS 上存放 JSON 文件,可以直接查询字段内容,方便快捷。

1446 3
|
Docker 容器
|

两个docker能用同一个端口吗 - 蓝易云

然后,你可以在另一个容器中运行相同的应用,让它监听容器的80端口,并将其映射到主机的8081端口。

1074 0
|
缓存 前端开发 API
|

API接口封装系列

API(Application Programming Interface)接口封装是将系统内部的功能封装成可复用的程序接口并向外部提供,以便其他系统调用和使用这些功能,通过这种方式实现系统之间的通信和协作。下面将介绍API接口封装的一些关键步骤和注意事项。

1029 2
|
存储 分布式计算 Hadoop
|

ClickHouse(01)什么是ClickHouse,ClickHouse适用于什么场景

ClickHouse是一款高性能的列式存储OLAP数据库,由俄罗斯的Yandex公司开发,用于在线分析处理(OLAP)。它提供秒级大数据查询,适用于商业智能、广告流量等领域。ClickHouse速度快的原因包括列式存储、数据压缩、向量化执行和多线程分布式处理。然而,它不支持事务,不适合OLTP操作。相比Hadoop生态中的查询引擎,ClickHouse在大量数据查询上表现出色。一系列的文章详细介绍了ClickHouse的各个方面,包括安装、表引擎和使用场景。

2586 2
|
存储 人工智能 自然语言处理
|

从API到Agent:万字长文洞悉LangChain工程化设计

给“AI外行人士”引入一下LangChain,试着从工程角度去理解LangChain的设计和使用。同时大家也可以将此文档作为LangChain的“10分钟快速上手”手册,本意是希望帮助需要的同学实现AI工程的Bootstrap。

1019 2
|
自然语言处理 机器人 人机交互
|

智能语音交互概述(一)

智能语音交互概述(一)

1586 0
|
数据采集 消息中间件 关系型数据库
|

数据采集(二)

数据采集(二)

1362 0
|
机器学习/深度学习 数据采集 人工智能
|

LLM系列 | 02: Vicuna简介及模型部署实测

今天这篇小作文主要介绍Vicuna模型、基于官方模型13B模型部署服务及对话实测。

5038 1
|
分布式计算 自然语言处理 DataWorks
|

高效使用 PyODPS 最佳实践

以更清晰的认知 PyODPS,DataWorks PyODPS 节点以及 PyODPS 何时在计算集群运行,开发者如何利用 PyODPS 更高效地进行数据开发。

18934 3
来自: 大数据计算 MaxCompute  版块
|
搜索推荐 测试技术 定位技术
|

DCN(Deep & Cross Network)模型在手淘分类地图CTR预估上的应用

一:背景       分类地图业务是指手淘首页首屏的"分类"入口,目前整个产品已经有300万左右日活跃用户和6000多万pv, 目前产品业务点较多,本文重点介绍点击品类词后的商品二跳页模块,具体如下图所示:当用户点击相应的品类词图片后,则会进入该类目下的商品集合。

11267 0
来自: 智能搜索推荐  版块
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
|

驯服AI的魔法:PPO是如何让机器学会说人话的

本文深入浅出解析PPO算法如何赋能RLHF,解决AI“说人话”的核心难题:通过策略限制与价值函数估计,使大模型学会语气适配、内容得体、表达自然的对话能力,推动从机械输出到人性交互的关键跃迁。

27 1

chunk size 变大,模型为什么更容易胡说

本文揭示RAG中最隐蔽的风险:增大chunk size看似提升回答完整性,实则削弱模型对不确定性的识别能力。它不增加真实知识,反掩盖证据缺口、混淆适用条件、抑制合理拒答,将“答不出”悄然转为“答得像却错”。警惕“自信幻觉”,回归证据单元设计本质。

50 1
|
21天前
|
人工智能 PyTorch 算法框架/工具
|

在无网络与8G内存约束下,个人计算机部署AI实践

本文探讨在无网络、仅8GB内存、无GPU的老旧PC上本地部署大语言模型的实践路径。通过构建纯净Python环境、选用PyTorch格式小模型(Qwen1.5-0.5B)、规避系统陷阱(如长路径限制、注册表关联错误等),成功实现离线中文对话,形成可复现的避坑指南与技术参考。(239字)

258 13
|
1月前
|
弹性计算 小程序 关系型数据库
|

阿里云服务器多少钱一年?整理2026年云服务器新购、续费和升级配置费用清单

阿里云2026年服务器价格出炉!轻量服务器低至38元/年,ECS新购续费同价,2核2G仅99元/年起。本文详解轻量服务器与ECS区别、配置费用、升级规则及省钱技巧,助你选对方案,轻松上云,一年省下上千元。

298 1
|
2月前
|
SQL NoSQL 前端开发
|

大厂如何解决订单幂等问题

本文详解分布式系统中订单接口幂等性设计:通过唯一订单号与数据库主键约束防止重复下单,结合Redis标识记录确保请求仅处理一次;针对ABA问题,引入版本号机制,更新时校验并自增版本,保证数据一致性。方案适用于各类数据库场景,保障服务在重试、并发下数据准确。

130 0
|
2月前
|
机器学习/深度学习 存储 自然语言处理
|

大模型基础概念术语解释

大语言模型(LLM)基于Transformer架构,通过海量文本训练,实现强大语言理解与生成。其核心为自注意力机制,结合Token化、位置编码与嵌入层,支持万亿级参数规模。参数增长带来涌现能力,如复杂推理与泛化性能。混合专家模型(MoE)提升效率,推动模型持续扩展。

342 0
|
4月前
|
人工智能 运维 监控
|

Flink 智能调优:从人工运维到自动化的实践之路

本文由阿里云Flink产品专家黄睿撰写,基于平台实践经验,深入解析流计算作业资源调优难题。针对人工调优效率低、业务波动影响大等挑战,介绍Flink自动调优架构设计,涵盖监控、定时、智能三种模式,并融合混合计费实现成本优化。展望未来AI化方向,推动运维智能化升级。

756 8
来自: 实时计算 Flink  版块
|
5月前
|
Web App开发 前端开发 vr&ar
|

虚拟办公室,不再只是噱头:一步步教你构建沉浸式工作空间

虚拟办公室,不再只是噱头:一步步教你构建沉浸式工作空间

336 7
|
9月前
|
机器学习/深度学习 Python
|

拯救数据不平衡:imbalanced-learn库详解

当你的数据像翘翘板一样严重倾斜时,该如何挽救你的机器学习模型?本文详解imbalanced-learn库的四大绝招,帮你轻松应对数据不平衡问题,提升模型性能。

370 8
|
11月前
|
供应链 API 开发者
|

1688商品列表API接口详解

1688是国内知名的批发采购平台,提供海量商品资源。开发者通过1688商品列表API可获取商品的名称、价格、销量等信息,支持构建电商数据分析工具、比价应用等。接口采用HTTP GET/POST请求,需提供关键词、页码、每页数量等必填参数,响应数据包含商品列表及总记录数。示例代码展示了如何使用Python进行请求和处理响应。供稿者:Taobaoapi2014。

338 5
|
Ubuntu Linux Shell
|

/etc/rc.d/rc.local 的作用

/etc/rc.d/rc.local是Linux系统中的一个重要配置文件,其主要作用是在系统启动时执行特定的命令或脚本。以下是关于/etc/rc.d/rc.local的详细解释: ### 作用 * **系统启动任务配置**:该文件允许系统管理员或用户配置在系统启动时需要自动运行的任务。这些任务可以是启动服务、运行特定程序或执行脚本等。 * **开机自启动程序**:通过编辑/etc/rc.d/rc.local文件,用户可以自定义开机启动程序。只需将需要开机启动的程序命令或脚本路径添加到该文件中,并在系统启动时该文件将被自动执行。 ### 文件内容 * 通常包含一个shell脚本,该脚本在

1236 12
|
机器学习/深度学习 数据采集 数据挖掘
|

11种经典时间序列预测方法:理论、Python实现与应用

本文将总结11种经典的时间序列预测方法,并提供它们在Python中的实现示例。

3558 2
|
编解码
|

「4K Ultra HD蓝光」与普通蓝光有何区别?

本文将介绍 4K Ultra HD蓝光的特征并总结它与普通蓝光的区别,如果您对蓝光光盘的知识有兴趣,或者计划购买新的蓝光播放机,那么可以参考本文。

2221 0
|
存储 数据采集 人工智能
|

重磅再推 | 基于OpenSearch向量检索版+大模型,搭建对话式搜索

阿里云OpenSearch再推面向企业开发者的PaaS方案:基于OpenSearch向量检索版,为企业开发者提供性能表现优秀、性价比优异的向量检索服务,并提供与大模型结合脚本工具,用户可在使用能力可靠的向量检索服务的同时,自由选择文档切片方案、向量化模型、大语言模型。

16684 1
来自: 智能搜索推荐  版块
|
存储 分布式计算 运维
|

钱大妈数据中台建设最佳实践

钱大妈数据中台建设最佳实践

9806 2
来自: 实时数仓 Hologres  版块
|
固态存储 Java 弹性计算
|

【最佳实践】简单配置,实现Filebeat多行日志传送

在解决应用程序问题时,多行日志为开发人员提供了宝贵的信息。 堆栈跟踪就是一个例子。 堆栈跟踪是引发异常时应用程序处于中间的一系列方法调用。 堆栈跟踪包括遇到错误的相关行以及错误本身。

10381 0
|
搜索推荐 流计算
|

基于实时计算(Flink)打造一个简单的实时推荐系统

本文为您介绍如何基于阿里云实时计算快速搭建实时推荐系统。

15350 1
来自: 实时计算 Flink  版块
|
弹性计算 数据可视化 API
|

数据库开放权限太危险,又不想写API。DataV给你另外一个选择。

~ DataV 后台21日晚上线,现在暂时还不能用哦 ~ DataV 增加了一个新的数据代理协议,旨在提供更安全的数据查询。它将 SQL 查询字符串和数据库 id 加密后传到这个应用,而后这个应用连接数据库将查询后的结果返回到 DataV 的页面中。 根据新的协议,我做了一个示例应用在githu

47546 141
来自: 数据可视化DataV  版块
|
算法 搜索推荐 前端开发
|

搜索双链路实时计算体系@双11实战

该文章来自阿里巴巴技术协会(ATA)精选集  0. 前言 何为双链路实时计算体系?微观实时计算链路 a) 最细粒度商品/店铺/用户数据的实时 b) 底层模型的实时宏观实时计算链路 相比微观实时,宏观实时的对象粒度更粗,更上层 a) 以实时效果为目标,基于bandit learning的实

16261 0
来自: 智能搜索推荐  版块
|
7天前
|
安全 搜索推荐 物联网
|

微调后模型“记住用户信息”,通常发生在什么阶段

本文揭示模型“记住用户信息”并非突发事故,而是贯穿预训练、SFT、LoRA微调、偏好对齐等七阶段的渐进式演化过程。关键在于:**不是模型学会了记忆,而是训练中持续奖励“具体化”,使用户特征被逐步绑定、放大并合法化。** 风险隐蔽且无明显红线,需在各环节警惕“身份可推断性”。

51 4
|
11天前
|
缓存 负载均衡 安全
|

Nginx 反向代理:原理、优势与配置指南

Nginx反向代理是核心服务器架构技术,可实现请求转发、负载均衡、高可用与安全防护。它隐藏后端服务器,自动剔除故障节点,并支持SSL终止、缓存等高级功能,配置简洁灵活,广泛应用于高性能Web系统。

126 13
|
1月前
|
编解码 并行计算 物联网
|

【实战教程】Flux.1-dev 360° 全景驾驶舱:从零到一的“零坑”部署指南

本教程教你如何在24G显存单卡环境下部署超大文生图模型Flux.1-dev。通过ModelScope极速下载、Hugging Face身份鉴权与显存顺序卸载技术,解决下载慢、授权难、显存溢出等问题,实现稳定推理。

269 1
|
2月前
|
缓存 算法 Java
|

线程池

本文深入剖析Java线程池的实现原理,涵盖ThreadPoolExecutor与ScheduledThreadPoolExecutor的核心机制,解析线程复用、任务队列、调度策略及Executors工具类,帮助开发者理解其底层架构与工作流程。

78 0
|
2月前
|
人工智能 Java 网络安全
|

Spring AI Alibaba:本地运行(☆)

简介:本任务要求使用SSH方式拉取私有Git仓库代码,基于SpringCloud、MySQL、Maven技术栈,完成聊天机器人、智能体、工作流三大功能模块的本地运行。需录制8分钟以上视频,结构化输出项目理解,包括技术栈、核心功能、数据库关系及未解困惑,帮助新人快速融入开发环境。(239字符)

119 0
|
3月前
|
消息中间件 存储 Kafka
|

流、表与“二元性”的幻象

本文探讨流与表的“二元性”本质,指出实现该特性需具备主键、变更日志语义和物化能力。强调Kafka与Iceberg因缺乏更新语义和主键支持,无法真正实现二元性,唯有统一系统如Flink、Paimon或Fluss才能无缝融合流与表。

362 7
来自: 实时计算 Flink  版块
|
4月前
|
机器学习/深度学习 数据采集 人工智能
|

从ChatGPT到文心一言:AI为什么能“懂人话”?——大语言模型的底层逻辑揭秘

从ChatGPT到文心一言:AI为什么能“懂人话”?——大语言模型的底层逻辑揭秘

626 9
|
5月前
|
JavaScript Java 关系型数据库
|

基于springboot的快递分拣管理系统

本系统基于SpringBoot框架,结合Java、MySQL与Vue技术,构建智能化快递分拣管理平台。通过自动化识别、精准分拣与实时跟踪,提升分拣效率与准确性,降低人力成本,推动快递行业向智能化、高效化转型,助力电商物流高质量发展。

702 0
|
5月前
|
存储 编解码 监控
|

针对3-15分钟视频的抽帧策略:让Qwen2.5 VL 32B理解视频内容

针对3-15分钟视频,提出高效抽帧策略:通过每5-10秒定间隔或关键帧检测方法,提取30-100帧关键图像,结合时间均匀采样与运动变化捕捉,降低冗余,提升Qwen2.5 VL 32B对视频内容的理解效率与准确性。

1161 2
|
5月前
|
数据可视化 搜索推荐 大数据
|

基于python大数据的北京旅游可视化及分析系统

本文深入探讨智慧旅游系统的背景、意义及研究现状,分析其在旅游业中的作用与发展潜力,介绍平台架构、技术创新、数据挖掘与服务优化等核心内容,并展示系统实现界面。

385 3
|
6月前
|
Java 测试技术 API
|

2025 年 Java 开发者必知的最新技术实操指南全览

本指南涵盖Java 21+核心实操,详解虚拟线程、Spring Boot 3.3+GraalVM、Jakarta EE 10+MicroProfile 6微服务开发,并提供现代Java开发最佳实践,助力开发者高效构建高性能应用。

973 4
|
6月前
|
存储 分布式计算 数据处理
|

「48小时极速反馈」阿里云实时计算Flink广招天下英雄

阿里云实时计算Flink团队,全球领先的流计算引擎缔造者,支撑双11万亿级数据处理,推动Apache Flink技术发展。现招募Flink执行引擎、存储引擎、数据通道、平台管控及产品经理人才,地点覆盖北京、杭州、上海。技术深度参与开源核心,打造企业级实时计算解决方案,助力全球企业实现毫秒洞察。

649 0
来自: 实时计算 Flink  版块
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
|

原来AI也能“读心术”?——聊聊AI在心理学研究中的那些突破

原来AI也能“读心术”?——聊聊AI在心理学研究中的那些突破

341 1
|
7月前
|
人工智能 自然语言处理 搜索推荐
|

AI做广告,效果还真不差?聊聊怎么用AI搞定个性化广告创作

AI做广告,效果还真不差?聊聊怎么用AI搞定个性化广告创作

444 7
|
8月前
|
SQL 数据建模 关系型数据库
|

别光知道存数据库了,数据建模才是王道!(入门指南+实战代码)

别光知道存数据库了,数据建模才是王道!(入门指南+实战代码)

1621 4
|
8月前
|
人工智能 前端开发 搜索推荐
|

LangGraph实战教程:构建会思考、能记忆、可人工干预的多智能体AI系统

本文介绍了使用LangGraph和LangSmith构建企业级多智能体AI系统的完整流程。从简单的ReAct智能体开始,逐步扩展至包含身份验证、人工干预、长期内存管理和性能评估的复杂架构。文章详细讲解了状态管理、工具集成、条件流程控制等关键技术,并对比了监督者架构与群体架构的优劣。通过系统化的方法,展示了如何构建可靠、可扩展的AI系统,为现代AI应用开发提供了坚实基础。*作者:Fareed Khan*

1890 0

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69094
内容
128
活动
439688
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务