|
编解码 数据可视化 定位技术
|

60行代码就可以训练/微调 Segment Anything 2 (SAM 2)

本文演示了如何在仅60行代码内(不包括标注和导入)对SAM2进行微调。

1513 1
|
并行计算 算法 Python
|

Dantzig-Wolfe分解算法解释与Python代码示例

Dantzig-Wolfe分解算法解释与Python代码示例

1369 2
来自: 人工智能平台PAI  版块
|
人工智能 安全 物联网
|

2024年6月后2周重要的大语言模型论文总结:LLM进展、微调、推理和对齐

本文总结了2024年6月后两周发表的一些最重要的大语言模型论文。这些论文涵盖了塑造下一代语言模型的各种主题,从模型优化和缩放到推理、基准测试和增强性能。

739 0
|
存储 运维 关系型数据库
|

探索 Apache Paimon 在阿里智能引擎的应用场景

本文整理自Apache Yarn && Flink Contributor,阿里巴巴智能引擎事业部技术专家王伟骏(鸿历)老师在 5月16日 Streaming Lakehouse Meetup · Online 上的分享。

26411 34
来自: 实时计算 Flink  版块
|
人工智能 弹性计算 运维
|

操作系统智能助手OS Copilot 产品体验评测

**OS Copilot 体验摘要** - AI爱好者评价其部署简单,一键快捷,无使用障碍,适合作为智能助手。 - 初次使用者表示聊天功能最吸引人,但无法立即评出对工作帮助的程度。 - 愿意推荐给他人,且有参与开源开发及模型训练的兴趣。 **功能反馈** - 用户尝试了全部功能,特别喜欢聊天交互。 - 与通义千问等多款产品对比,OS Copilot的速度较快。 - 希望增加功能:集成云端Notebook,自动代码生成和错误修正,支持所有操作系统。 - 潜在应用:与阿里云服务如魔搭、ECS结合,打造智能开发和工作流程。

378 1
|
文字识别 异构计算 Python
|

关于云端Jupyter Notebook的使用过程与感想

在自学Python时,由于家庭电脑使用冲突和设备老旧,转向云端平台。体验了多个服务:1. 魔搭modelscope(最喜欢,赠送资源丰富,社区活跃),2. Colaboratory(免费GPU,但有时重启,建议用阿里云),3. Deepnote(免费环境有限,但GPT-4代码生成功能强大),4. 飞桨aistudio(适合PaddlePaddle用户),5. ModelArts(曾有免费实例,现难找)。综合来看,阿里云的稳定性与服务更优,尤其是魔搭的自动代码修正功能。对于AIGC,推荐魔搭和付费版PAI-DSW。欢迎分享更多云端Jupyter平台体验。

993 1
|
Python
|

新手向 Python:VsCode环境下Manim配置

该文介绍了如何准备和配置开发环境以使用Manim,主要包括两个步骤:一是准备工作,需要下载并安装VsCode和Anaconda,其中Anaconda需添加到系统PATH环境变量,并通过清华镜像源配置;二是配置环境,VsCode中安装中文插件和Python扩展,激活并配置虚拟环境。最后,安装ffmpeg和manim,通过VsCode运行测试代码验证配置成功。

1929 1
|
存储 分布式计算 Hadoop
|

ClickHouse(01)什么是ClickHouse,ClickHouse适用于什么场景

ClickHouse是一款高性能的列式存储OLAP数据库,由俄罗斯的Yandex公司开发,用于在线分析处理(OLAP)。它提供秒级大数据查询,适用于商业智能、广告流量等领域。ClickHouse速度快的原因包括列式存储、数据压缩、向量化执行和多线程分布式处理。然而,它不支持事务,不适合OLTP操作。相比Hadoop生态中的查询引擎,ClickHouse在大量数据查询上表现出色。一系列的文章详细介绍了ClickHouse的各个方面,包括安装、表引擎和使用场景。

2705 2
|
数据处理 数据库 流计算
|

FlinkCDC的性能如何

FlinkCDC的性能如何

481 1
|
机器学习/深度学习 算法 Python
|

CatBoost中级教程:集成学习与模型融合

CatBoost中级教程:集成学习与模型融合【2月更文挑战第13天】

638 3
|
SQL JSON 分布式计算
|

DataWorks产品使用合集之DataWorks一键maxcompute数据同步的操作步骤是什么

DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。

857 1
|
SQL 消息中间件 存储
|

Flink报错问题之Flink报错:Table sink 'a' doesn't support consuming update and delete changes which is produced by node如何解决

Flink报错通常是指在使用Apache Flink进行实时数据处理时遇到的错误和异常情况;本合集致力于收集Flink运行中的报错信息和解决策略,以便开发者及时排查和修复问题,优化Flink作业的稳定性。

2984 0
来自: 实时计算 Flink  版块
|
SQL Oracle 关系型数据库
|

SQL 的 with as 临时中间表

SQL 的 with as 临时中间表

596 1
|
存储 前端开发 机器人
|

通过4个任务比较LangChain和LlamaIndex

我们在本地使用大模型的时候,尤其是构建RAG应用的时候,一般会有2个成熟的框架可以使用

3318 2
|
Linux 网络虚拟化
|

Debian系统安装OpenVPN

Debian系统安装OpenVPN

2398 0
|
缓存 算法 NoSQL
|

【分布式详解】一致性算法、全局唯一ID、分布式锁、分布式事务、 分布式缓存、分布式任务、分布式会话

分布式系统通过副本控制协议,使得从系统外部读取系统内部各个副本的数据在一定的约束条件下相同,称之为副本一致性(consistency)。副本一致性是针对分布式系统而言的,不是针对某一个副本而言。强一致性(strong consistency):任何时刻任何用户或节点都可以读到最近一次成功更新的副本数据。强一致性是程度最高的一致性要求,也是实践中最难以实现的一致性。单调一致性(monotonic consistency):任何时刻,任何用户一旦读到某个数据在某次更新后的值,这个用户不会再读到比这个值更旧的值。

1701 0
|
机器学习/深度学习 算法 数据挖掘
|

【MATLAB 】RBF径向基神经网络回归预测

【MATLAB 】RBF径向基神经网络回归预测

755 0
|
Web App开发 Linux 开发工具
|

Centos7 yum 安装chrome

Centos7 yum 安装chrome配置yum源vim /etc/yum.repos.d/google-chrome.repo写入以下内容[google-chrome]name=google-chromebaseurl=http://dl.google.com/linux/chrome/rpm/stable/$basearchenabled=1gpgcheck=1gpgkey=http...

1267 0
|
传感器 编解码
|

什么是HDR?HDR与SDR的区别?

HDR(高动态范围)技术是一种近年来变得流行的图像技术,用于拍摄更自然、更真实的影像,尤其在Audio / Visual设备和数码相机等方面得到了广泛应用。在这里,我们将解释HDR技术的具体是什么,HDR与SDR的区别,HDR与4K的关系,以及HDR一般内置在哪些设备中。

4885 0
|
XML JSON 编解码
|

Thrift 介绍

Thrift 介绍

599 0
|
机器学习/深度学习 数据处理 Python
|

Python应用专题 | 5:Python多进程处理数据

本文介绍如何使用多进程的方式高效处理海量任务数据

441 0
|
机器学习/深度学习 人工智能 自然语言处理
|

人工智能生成内容(AIGC):一种新兴的内容创造方式

在数字经济的挑战面前,人工智能生成内容(Artificial Intelligence Generated Content,AIGC)应运而生。AIGC是一种新型的内容创造方式,通过使用人工智能(AI)技术,根据用户输入的关键词或需求生成内容。大型模型算法的发展极大地增强了AIGC的能力,使AIGC产品成为一种有前景的生成工具,并为我们的生活带来了便利。作为上游技术,AIGC具有无限的潜力来支持不同的下游应用。分析AIGC的当前能力和短板,理解如何在未来的应用中最好地利用它,这是非常重要的

841 0
|
安全 5G 定位技术
|

IM开发者的零基础通信技术入门(十二):上网卡顿?网络掉线?一文即懂!

本文将详细介绍生活中遇到的常见网络问题,及可能的解决方法,虽说是一篇技术文章,但内容将一如既往地通俗易懂,简单实用。

561 0
|
存储 SQL 缓存
|

使用实践:Hologres对接MaxCompute常见问题排查

本文总结了Hologres对接MaxCompute时的常见问题与处理方法。

4146 3
来自: 实时数仓 Hologres  版块
|
SQL 运维 DataWorks
|

DataWorks数据服务介绍及最佳实践 | 《一站式大数据开发治理DataWorks使用宝典》

DataWorks作为一站式大数据开发治理平台,构建了从数据集成、数据开发、数据服务到应用开发的全链路解决方案。在整个大数据链路中,数据服务将数仓、数据库和数据应用进行串联,形成了一座数据与应用之间的桥梁。数据服务通过将数据封装成数据API的方式,可以为个人、团队及企业提供全面的数据开放及共享能力。借助这个平台,用户能够统一管理面向内外部的API服务。数据服务提供了向下对接数据源、向上支撑业务应用的有效连接。

4209 1
|
存储 SQL 关系型数据库
|

实时数仓入门训练营:Hologres性能调优实践

《实时数仓入门训练营》由阿里云研究员王峰、阿里云高级产品专家刘一鸣等实时计算Flink版和 Hologres 的多名技术/产品一线专家齐上阵,合力搭建此次训练营的课程体系,精心打磨课程内容,直击当下同学们所遇到的痛点问题。由浅入深全方位解析实时数仓的架构、场景、以及实操应用,7 门精品课程帮助你 5 天时间从小白成长为大牛!

2975 0
来自: 实时计算 Flink  版块
|
存储 SQL 缓存
|

Hologres揭秘:深度解析高效率分布式查询引擎

从阿里集团诞生到云上商业化,随着业务的发展和技术的演进,Hologres也在持续不断优化核心技术竞争力,为了让大家更加了解Hologres,我们计划持续推出Hologers底层技术原理揭秘系列,从高性能存储引擎到高效率查询引擎,高吞吐写入到高QPS查询等,全方位解读Hologers,请大家持续关注!

13362 4
来自: 实时数仓 Hologres  版块
|
人工智能 自然语言处理 算法
|

电商行业智能搜索技术原理全解析

对于电商平台来说,智能搜索功能是至关重要的。本文剖析电商行业的搜索专属特点和业务需求,并介绍开放搜索提供的【电商行业模板】智能搜索能力,希望带给企业更多提升业务转化的思路和解决方案~

6351 1
来自: 智能搜索推荐  版块
|
SQL 机器学习/深度学习 消息中间件
|

十大行业经典案例!Apache Flink 的 40 个最佳实践

如今,Apache Flink 行业应用几何?在降本增效的需求驱动下,企业如何实现数据与算力价值最大化?本文整理了 Flink 社区近一年的社区案例,并按照行业进行分类,供大家参考!

18321 1
来自: 实时计算 Flink  版块
|
存储 SQL 缓存
|

详解 Flink 实时应用的确定性

最近几年随着 Google The Dataflow Model 的提出,实时计算和离线计算的关系逐渐清晰,在实时计算中提供与离线计算一致的确定性成为可能。本文将基于流行实时计算引擎 Apache Flink,梳理构建一个确定性的实时应用要满足什么条件。

1661 0
来自: 实时计算 Flink  版块
|
SQL 分布式计算 数据管理
|

Delta Lake 平台化实践(离线篇)

本文是在 Delta Lake 0.4 与 Spark 2.4 集成、平台化过程中的一些实践与思考

1858 0
|
18天前
|
监控 算法 数据可视化
|

别再瞎调学习率了:一套用 Python 搞定“自动调参 + 训练监控”的实战方案

别再瞎调学习率了:一套用 Python 搞定“自动调参 + 训练监控”的实战方案

150 4
|
18天前
|
Java 容器 JavaScript
|

从"代码跑不通"到"答辩演示丝滑流畅":毕设部署避坑完全指南

毕设答辩“最后一公里”常因部署失败翻车!本文提供本地一键、云服务器、Docker三种部署方案,重点推荐智码方舟AI生成器——10分钟获取配置完备的部署文档+脚本,规避90%环境问题,助你稳过答辩。

133 2
|
21天前
|
人工智能 缓存 安全
|

OpenClaw:当 AI 开始 “做事”,我们该如何选择

OpenClaw是开源、本地优先的AI任务执行引擎,可听懂指令并自动完成文件处理、API调用等实操任务。支持本地/云端/混合部署,适配多类模型与交互入口(WebUI/CLI/IM),严守隐私与安全底线,兼顾可控性、成本与效率。(239字)

212 2
|
23天前
|
人工智能 安全 程序员
|

50%的人给了差评:龙虾为何在技术论坛翻车了?

OpenClaw(龙虾)AI工具因“自动赚钱”“代约主播”等夸张宣传走红,但吾爱破解论坛投票显示:50%技术用户未下载且不认可其能力。技术圈冷静源于见惯“神器”泡沫——AI擅写代码(搬砖),却难懂需求、统筹系统。它不是神药,而是待磨的砍柴刀。

204 3
|
1月前
|
消息中间件 监控 算法
|

别只盯着离线指标了:用大数据把模型“在线状态”盯死

别只盯着离线指标了:用大数据把模型“在线状态”盯死

143 2
|
2月前
|
安全 网络协议 网络安全
|

Socks5代理隐私保护攻略:高效、安全,一步到位

在数字时代,Socks5代理成隐私防护利器:作为会话层中介,隐藏真实IP、兼容TCP/UDP、不篡改数据,并支持认证。高效使用需选优质节点、合理配置协议、搭配加密工具防DNS泄漏,合规使用方能构筑“隐形防护盾”。

279 1
|
2月前
|
存储 分布式计算 OLAP
|

数仓-湖仓-湖流,人力家基于阿里云OpenLake架构演进与思考

人力家资深数据工程师石玉阳(Thorne),Flink-CDC Contributor,分享其公司湖仓一体实践:以Paimon为数据基座、StarRocks为OLAP引擎、Flink+Fluss实现湖流融合,打通离线/实时/增量计算,支持多模态与DATA+AI演进,构建开放、统一、可持续的大数据架构。(239字)

200 2
|
2月前
|
存储 人工智能 JSON
|

32B大模型塞进消费级显卡?我用“人情味”做了场春节实验

本文分享用LoRA+量化在单卡/双卡上轻量微调Qwen3-32B,打造懂关系、有分寸的春节祝福助手。聚焦“人情世故”六要素填空式训练,自建3000+场景化数据,借助LLaMA-Factory Online实现低门槛实战,让AI从背模板转向调记忆。(239字)

392 16
|
2月前
|
人工智能 自然语言处理 搜索推荐
|

RAG不只是问答!看完这些应用案例,才发现它的潜力这么大

RAG(检索增强生成)技术正赋能企业知识管理、智能客服、辅助决策、内容创作与教育培训等多元场景,通过语义检索+精准生成,提升信息获取效率与AI实用性,助力零代码构建专属智能系统。

283 5
|
3月前
|
机器学习/深度学习 人工智能 监控
|

从原理到实践:零代码也能搞定的PPO微调全攻略

本文深入浅出解析PPO(近端策略优化)算法——大模型对齐人类偏好的核心技术。通过“温和教练”比喻、四步原理拆解与实操指南,零基础也能理解其剪切机制、优势函数与稳定训练逻辑,并亲手微调出更懂你的AI。(239字)

244 0
|
3月前
|
存储
|

RAG 为什么总是“看起来能用,实际不好用”?

RAG效果不佳?问题往往不在模型,而在于文档切分。错误的切分会导致语义断裂、关键信息丢失,使召回内容“看似相关却无用”。本文深入剖析切分误区:固定长度切割、过度依赖overlap、忽视文档结构等,并提出核心原则——保障语义完整性。不同文档需定制切分策略,FAQ按问答切,技术文档依章节分,流程类保完整上下文。切分是RAG的地基,而非细节,唯有夯实,才能让检索与生成真正生效。

194 3
|
3月前
|
消息中间件 运维 监控
|

别只盯着充电枪:聊聊一个真正“能赚钱、能扩展、能运维”的智慧充电桩系统架构

别只盯着充电枪:聊聊一个真正“能赚钱、能扩展、能运维”的智慧充电桩系统架构

179 7
|
3月前
|
数据采集 安全 数据安全/隐私保护
|

代理地址≠协议!HTTPS使用误区拆解

跨境运营、爬虫从业者必看!99%人混淆的代理误区:代理地址带https≠HTTPS代理。关键看目标网站协议!目标为HTTPS时,即使代理是http,仍为HTTPS代理。掌握核心:目标URL决定代理类型,代理前缀仅影响传输加密。三步避坑指南,提升效率与隐私安全。

235 0
|
3月前
|
存储 定位技术
|

北斗GPS卫星授时服务器运行介绍

北斗GPS授时服务器通过接收GNSS卫星信号,利用NTP/PTP协议输出精准时间,部分设备如SYN2136系列还支持串口RMC语句输出。本文介绍冷启动(需数分钟)、温启动(数十秒至数分钟)、热启动(数秒)的区别,以及常用通信语句GGA与RMC的对比。RMC提供位置、速度、航向和时间等全面信息,更适用于导航等综合场景,而GGA主要用于基础定位。根据需求选择合适模式与语句,可提升授时效率与精度。(238字)

184 1
|
3月前
|
存储 SQL 运维
|

Hologres Dynamic Table:高效增量刷新,构建实时统一数仓的核心利器

在实时数据架构中,Hologres Dynamic Table 基于有状态增量计算模型,有效解决“海量历史+少量新增”场景下的数据刷新难题。相比传统全量刷新,其通过持久化中间状态,实现复杂查询下的高效增量更新,显著降低延迟与资源消耗,提升实时数仓性能与运维效率。

388 36
来自: 实时数仓 Hologres  版块
|
4月前
|
人工智能 JSON 数据挖掘
|

大模型应用开发中MCP与Function Call的关系与区别

MCP与Function Call是大模型应用中两大关键技术。前者为跨模型标准化通信协议,实现工具与模型解耦;后者是模型调用外部功能的内置机制。二者互补协作,推动AI应用向更开放、灵活、可扩展的方向发展。

196 0
|
4月前
|
XML 算法 安全
|

详解RAG五种分块策略,技术原理、优劣对比与场景选型之道

RAG通过检索与生成结合,提升大模型在企业场景的准确性与可控性。分块策略是其核心,直接影响检索效果与生成质量。本文系统解析五种主流分块方法:固定大小、语义、递归、基于结构及LLM分块,对比其优缺点与适用场景,并提出组合优化建议,助力构建高效、可信的RAG系统。

217 0
|
4月前
|
JavaScript Dubbo Java
|

Http

基于HTTP表单的远程调用协议,使用Spring HttpInvoker实现,支持多连接、短连接、同步传输,采用表单序列化,适用于参数大小混合场景,可被浏览器和JS调用,需符合Bean规范,推荐配合Servlet Bridge使用。

161 0
|
4月前
|
机器学习/深度学习 数据采集 人工智能
|

大模型训练方法与技术术语解释

预训练、微调、RLHF、思维链等技术共同构建大模型能力。预训练打基础,微调适配具体任务,RLHF融入人类偏好,思维链提升推理,少/零样本学习增强泛化,指令微调优化交互,自监督学习利用海量无标注数据,温度控制生成风格,蒸馏实现知识迁移,缩放定律指导模型扩展。这些核心技术推动大模型在多领域智能应用中持续突破,实现从理解到创造的跨越。(238字)

253 0

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

4
今日
69318
内容
128
活动
439805
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务