|
7月前
|
分布式计算 MaxCompute 人工智能
|

ODPS 的下一个15年,大数据将迎来春天还是寒冬?

7367 55
来自:大数据计算 MaxCompute 版块
|
3月前
|
Python Windows
|

Miniconda 安装与环境配置全流程图解(2025 最新版)

Miniconda 可以看作是 Anaconda 的“轻装版”,只自带 conda 包管理器与基础的 Python 运行时。它体积小、部署速度快,特别适合按需创建与管理虚拟环境的用户。与 Anaconda 相比,Miniconda 不会预先安装一大堆科学计算库,你可以根据项目需求再单独选择、安装需要的包,因此整体更轻巧、更灵活。 本文将手把手演示在 Windows 下安装 Miniconda 的全过程:从下载安装器、完成向导配置、设置环境变量,到最后的基础验证与简单示例,帮助你迅速把 Miniconda 用起来。

2174 12
来自: 人工智能平台PAI  版块
|
12月前
|
流计算 关系型数据库 MySQL
|

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

7832 25
来自:实时计算 Flink 版块
|
4月前
|
Windows
|

Microsoft Activation Scripts v3.6 (MAS)激活工具安装教程!中文汉化版(激活工具)

Microsoft Activation Scripts v3.6(MAS)是一款开源、轻量级的批量激活工具,支持HWID、KMS38、TSforge等多种方式,可离线永久激活Win7至Win11及Office全系列。兼容旧系统如Vista,操作简单,无误报风险。

5928 0
|
6月前
|
人工智能 边缘计算 自然语言处理
|

普通电脑也能跑AI:10个8GB内存的小型本地LLM模型推荐

随着模型量化技术的发展,大语言模型(LLM)如今可在低配置设备上高效运行。本文介绍本地部署LLM的核心技术、主流工具及十大轻量级模型,探讨如何在8GB内存环境下实现高性能AI推理,涵盖数据隐私、成本控制与部署灵活性等优势。

3540 0
|
17天前
|
存储 人工智能 并行计算
|

别再搞混了!一文看懂“显存”与“内存”:从办公桌到实验室的硬核分工

本文以生动比喻与硬核解析,深入浅出地讲清内存(RAM)与显存(VRAM)的本质区别:内存是CPU的通用工作台,显存是GPU的专用高速实验室。二者分工明确,数据需通过PCIe传输,无法互相替代。尤其在AI训练中,显存容量与带宽直接决定模型能否运行。文章结合代码实例、性能对比表及排错指南,帮助开发者理解“CUDA out of memory”等常见问题,并提供优化策略与云平台建议,是迈向高效AI开发的必读指南。

576 0
|
3月前
|
存储 安全 搜索推荐
|

企业网站模板 网站源码下载 网站源码建站

在数字化时代,企业需专业网站拓展市场,网站源码建站因高性价比、强灵活性成中小企业首选,比定制开发成本低、比模板建站自由。选源码要明确需求、看质量售后与 SEO 扩展性,下载用官方渠道,经准备服务器域名、安装设置可上线,助企业低成本建高自由度安全网站。

1901 2
来自: 人工智能平台PAI  版块
|
3月前
|
人工智能 UED Windows
|

Egde卸载教程!edge浏览器卸载工具!EdgeRemover v18.38新版本,单文件便携版!

Edge浏览器虽功能强大,却常因无法彻底卸载让用户体验困扰。本文推荐一款专清工具——Edge Remover,支持一键移除Edge及WebView2运行时,两种模式灵活选择,操作简单,无需专业技能,彻底清理不留残留,释放C盘空间,提升系统纯净度,是Windows用户必备的卸载利器。

1677 2
|
9月前
|
存储 JSON 数据可视化
|

从零构建知识图谱:使用大语言模型处理复杂数据的11步实践指南

本文将基于相关理论知识和方法构建一个完整的端到端项目,系统展示如何利用知识图谱方法对大规模数据进行处理和分析。

2445 11
|
3月前
|
人工智能 前端开发 数据挖掘
|

AI学习全景图:从大模型到RAG,从工具到变现,一条从0到1的路线

告别碎片化学习!本文系统梳理AI知识五层结构:从基础认知到商业变现,提供完整学习路径与优质资源链接。帮你构建AI知识网络,实现从工具使用到能力落地的跃迁。

1948 2
|
10月前
|
开发工具 C++ git
|

五分钟看懂推送本地项目到 GitHub新手菜鸡

五分钟看懂推送本地项目到 GitHub新手菜鸡

2334 0
|
10月前
|
机器学习/深度学习 并行计算 PyTorch
|

英伟达新一代GPU架构(50系列显卡)PyTorch兼容性解决方案

本文记录了在RTX 5070 Ti上运行PyTorch时遇到的CUDA兼容性问题,分析其根源为预编译二进制文件不支持sm_120架构,并提出解决方案:使用PyTorch Nightly版本、更新CUDA工具包至12.8。通过清理环境并安装支持新架构的组件,成功解决兼容性问题。文章总结了深度学习环境中硬件与框架兼容性的关键策略,强调Nightly构建版本和环境一致性的重要性,为开发者提供参考。

6540 64
|
14天前
|
数据安全/隐私保护 流计算
|

pyflink在读取hdfs文件的时候如何使用通配符?

231 0
来自:实时计算 Flink 版块
|
5月前
|
并行计算 数据格式 异构计算
|

完整教程:从0到1在Windows下训练YOLOv8模型

本文详细介绍在Windows系统下使用YOLOv8训练目标检测模型的完整步骤,涵盖环境配置、数据集准备、模型训练与测试、常见问题解决及GPU加速技巧。提供详细命令与代码示例,并推荐现成数据集与工具,助您高效完成模型训练。

2365 16
|
6天前
|
存储 人工智能 Apache
|

Apache Paimon多模态数据湖实践:从结构化到非结构化的技术演进

在Streaming Lakehouse Meetup中,Apache Paimon PMC叶俊豪分享了Paimon多模态数据湖创新:首创列分离架构(基于全局Row ID),解决AI场景下结构化特征动态变更难题;引入Blob类型,实现非结构化数据物理分离、跨引擎统一抽象与blob-as-descriptor流式加载;已支撑淘宝日均10PB多模态数据,并规划Deletion Vector、Blob Compaction及全局索引等演进。

155 2
来自: 实时计算 Flink  版块
|
10月前
|
机器学习/深度学习 JSON 监控
|

国内最大的MCP中文社区来了,4000多个服务等你体验

国内最大的MCP中文社区MCPServers来了!平台汇聚4000多个服务资源,涵盖娱乐、监控、云平台等多个领域,为开发者提供一站式技术支持。不仅有丰富的中文学习资料,还有详细的实战教程,如一键接入MCP天气服务等。MCPServers专注模块稳定性和实用性,经过99.99% SLA认证,是高效开发的理想选择。立即访问mcpservers.cn,开启你的开发之旅!

13124 16
|
10月前
|

Multisim14.0中文下载安装步骤教程

Multisim14.0是由美国NI公司开发的EDA工具,适用于电路设计与仿真。本文提供详细中文安装步骤:下载安装包后解压,运行安装程序并设置路径,填写用户信息,选择安装位置,接受协议完成安装。随后安装NILicense激活器及中文语言包,最终实现软件汉化与正常运行。附带网盘下载链接,方便国内用户获取资源。

6734 15
|
11月前
|
数据安全/隐私保护
|

5分钟注册一个可用Gemini的谷歌邮箱账号

5分钟注册一个可用Gemini的谷歌邮箱账号

4894 23
|
2月前
|
数据挖掘 C++ 计算机视觉
|

Python:ImportError:DLL loadfailed while importing onnxruntime_pybind11_state: 动态链接库(DLL)初始化例程失败 报错解决

在进行文件夹内人脸识别与对比聚类时,遇到onnxruntime库报错,通常因版本不兼容或环境冲突导致。本文整理了五种解决方案:降级onnxruntime至1.14.1、重装库、区分GPU/CPU版本、安装Visual C++运行库、创建Python虚拟环境。通过版本匹配与环境隔离,有效解决DLL初始化失败等问题,提升项目稳定性。

925 8
|
2月前
|
前端开发 安全 JavaScript
|

网站代码 网站源代码 网页源代码 网页代码网站

本文深入解析网站源代码与网页源代码的核心概念及区别,阐述其作为互联网技术基石的关键作用。通过剖析PageAdmin等典型源码案例,揭示源代码在技术学习、网站优化、安全维护等方面的核心价值,并探讨如何高效利用代码网站资源进行创新开发。文章强调在尊重版权的前提下,开发者可借助源码资源提升能力,推动网页技术持续发展。

648 10
来自: 大数据计算 MaxCompute  版块
|
8月前
|
数据挖掘 计算机视觉 Windows
|

Origin2024 汉化安装专业解析|企业级部署教程+批量激活解决方案

Origin是一款由OriginLab开发的科学绘图与数据分析软件,支持Windows系统,提供丰富的2D/3D图形模板和强大的数据分析功能,如统计、信号处理、图像处理等。本文详细介绍Origin2024的下载与安装步骤,包括解压文件、运行安装程序、输入序列号、安装路径设置及破解方法,帮助用户快速完成软件安装与激活。

2824 21
|
8月前
|
数据采集 自动驾驶 Java
|

PAI-TurboX:面向自动驾驶的训练推理加速框架

PAI-TurboX 为自动驾驶场景中的复杂数据预处理、离线大规模模型训练和实时智能驾驶推理,提供了全方位的加速解决方案。PAI-Notebook Gallery 提供PAI-TurboX 一键启动的 Notebook 最佳实践

2675 2
来自: 人工智能平台PAI  版块
|
22小时前
|
人工智能 安全 C++
|

一个项目能长期活下去,靠的从来不是模型

AI项目成败关键不在模型强弱,而在于系统性生存能力:厘清责任边界、接纳不确定性、严控复杂度、建立止损机制、允许模型“不万能”、并在模型成功时保持克制。真正活久的项目,清醒、务实、敬畏现实。

106 12
|
10月前
|
Linux 网络安全 虚拟化
|

阿里云开发者分享VMware17 Pro保姆级安装秘籍,详细步骤助你轻松搞定安装!

这是一篇超详细的VMware 17 Pro虚拟机下载与安装教程。VMware 17 Pro支持多操作系统模拟运行,适合开发、测试及教育使用。文章涵盖从下载到安装的全流程,包括解压安装包、接受协议、配置安装路径等步骤,并提供虚拟机优化(如安装VMware Tools、配置快照和共享文件夹)及使用指南。同时,针对常见问题如虚拟化未启用或软件阻止启动,提供了具体解决方案,帮助用户顺利部署和使用虚拟机环境。

5020 36
|
5天前
|
数据采集 人工智能 JSON
|

给大模型“开小灶”:一文读懂微调原理与实战,让你的AI更懂你

本文深入浅出讲解大模型微调:为何需“开小灶”?详解全量微调、LoRA(装插件)、Prompt Tuning(学咒语)及RLHF等主流方法;手把手演示LoRA三步实践——数据准备、配置训练、测试部署;并提供效果评估与低门槛工具推荐。助力开发者快速打造领域专属AI。(239字)

104 0
|
1月前
|
机器学习/深度学习 数据采集 人工智能
|

人工智能技术全流程入门:10 个关键步骤快速上手

本教程系统讲解人工智能入门10大核心步骤,涵盖基础认知、工具使用、数据理解、实操应用与伦理规范,结合场景导向与避坑指南,帮助新手快速掌握AI技术应用逻辑,轻松实现从零到一的跨越,助力职场增效与技能提升。

688 1
|
28天前
|
人工智能 算法 新能源
|

从入门到选型:GEO生成式引擎优化科普与优质geo优化服务商推荐

GEO(生成式引擎优化)正取代SEO,助力企业在AI搜索中抢占流量先机。本文解析GEO核心逻辑,对比SEO差异,揭示其提升获客效率2.8倍的潜力,并结合国内外权威数据,分场景推荐适配的优质服务商,助企业从懂原理到会选型,规避布局风险。

637 1
|
7天前
|
消息中间件 存储 Kafka
|

湖流一体:基于  Fluss+ Paimon 的实时湖仓数据底座

阿里云Fluss是面向分析场景的新一代列式流存储系统,填补“分析型+流处理”空白。它原生支持Schema、实时更新与Changelog,通过Union Read实现湖流一体,与Paimon/Iceberg无缝协同,提供秒级新鲜度、低成本回溯与统一SQL查询能力。

145 5
来自: 实时计算 Flink  版块
|
2月前
|
编译器 程序员 Linux
|

实用工具:VS Code 配置 Markdown 编译器全指南

本文介绍如何在VS Code中配置高效Markdown写作环境,通过启用内置预览、安装Markdown All in One与Markdown Preview Enhanced插件,并配置Princexml实现PDF等格式导出,全面提升编辑、预览与输出效率,适合程序员、学生及内容创作者使用。

799 2
|
6月前
|
SQL 关系型数据库 Apache
|

从 Flink 到 Doris 的实时数据写入实践 —— 基于 Flink CDC 构建更实时高效的数据集成链路

本文将深入解析 Flink-Doris-Connector 三大典型场景中的设计与实现,并结合 Flink CDC 详细介绍了整库同步的解决方案,助力构建更加高效、稳定的实时数据处理体系。

2582 0
来自: 实时计算 Flink  版块
|
16天前
|
人工智能 搜索推荐 数据库
|

从零搭建RAG系统:原理剖析+代码实践,解锁大模型“记忆力”新姿势

RAG(检索增强生成)为大模型配备“外接大脑”,通过连接专属知识库,提升回答准确性。广泛应用于医疗、法律、客服等领域,兼具专业性与可解释性。本文详解其原理、实战步骤与优化技巧,助你快速构建个性化AI助手。

416 11
|
6天前
|
人工智能 自动驾驶 算法
|

智能体来了!2026 AI 元年:在全新赛道上重构人类生产力边界

2026年被定义为“智能体元年”:AI从“能说”跃升为“能干”,实现自主决策、跨系统协作与具身执行。产业迎来智能体市场、数字劳动力网络和可信治理三大爆发点,人类角色转向目标设定与智能体调度。技术终指向人的升华。(239字)

110 3
|
13天前
|
存储 人工智能 数据库
|

2026 AI Agent 搭建师职业全景指南:从技术基石到商业闭环

2026年,AI职业迎来范式变革,“AI Agent搭建师”取代提示词工程师,成为集架构设计、系统集成与智能协同于一体的“数字流程总设计师”。他们构建具备感知-思考-行动闭环的智能体,推动企业从“聊天机器人”迈向“行动中心”与“数字员工团队”。通过异构模型路由、多智能体编排、MCP工具协议与GraphRAG记忆系统等核心技术,实现业务流程自动化与决策智能化。该职业融合技术、业务与战略,人才缺口巨大,薪酬领先,被誉为AI时代的“黄金职业”,并持续向AI架构师与伦理治理等方向演进。

410 1
|
2月前
|
人工智能 自然语言处理 监控
|

通义AI搜索排名优化全攻略

武汉得知网络AI搜索优化基于内容质量、用户意图匹配与交互数据,通过语义深度、页面体验及权威链接提升排名,结合技术性能与多模态策略,助力企业精准抢占AI搜索流量高地。

459 4
来自: 实时数仓 Hologres  版块
|
5月前
|
机器学习/深度学习 传感器 编解码
|

DINOv3上手指南:改变视觉模型使用方式,一个模型搞定分割、检测、深度估计

DINOv3是Meta推出的自监督视觉模型,支持冻结主干、仅训练轻量任务头即可在分割、深度估计等任务上达到SOTA,极大降低训练成本。其密集特征质量优异,适用于遥感、工业检测等多领域,真正实现“一个模型走天下”。

4256 2
|
8天前
|
SQL 存储 分布式计算
|

【赵渝强老师】基于Hudi的大数据湖仓一体架构

Apache Hudi(Hadoop Upserts Delete and Incremental)是开源的流式数据湖平台,支持事务、高效upsert/delete、增量处理、多引擎SQL读写(Spark/Flink/Trino等),自动管理小文件与压缩,兼容云存储,助力构建湖仓一体架构。

124 3
|
7月前
|
并行计算 机器人 网络安全
|

阿里云服务器上部署ROS2+Isaac-Sim4.5实现LeRobot机械臂操控

本文介绍了如何在阿里云上申请和配置一台GPU云服务器,并通过ROS2与Isaac Sim搭建机械臂仿真平台。内容涵盖服务器申请、系统配置、远程连接、环境搭建、仿真平台使用及ROS2操控程序的编写,帮助开发者快速部署机器人开发环境。

2857 4
|
9天前
|
算法 搜索推荐 Serverless
|

为什么 ES 的搜索结果只到 10,000?强制“数清楚”的代价有多大

Elasticsearch 7.x后默认返回10,000总数,实为Block-Max WAND算法的性能优化——跳过低分文档块以提升查询速度。强行开启`track_total_hits:true`将禁用该优化,导致CPU飙升、延迟激增。本文深入Lucene底层,解析其原理、陷阱与治理方案。

225 1
|
15天前
|
机器学习/深度学习 人工智能 算法
|

大模型微调新篇章:从“学会知识”到“理解偏好”,PPO算法全解析与实践指南

本文深入解析大模型对齐人类偏好的核心技术——近端策略优化(PPO)。从原理到实践,详解PPO如何通过Actor、Reference、Reward与Critic四模型协作,结合强化学习实现更自然、安全、有用的对话。涵盖训练流程、常见问题、评估方法及进阶技巧,并以LLaMA-Factory为例演示操作,助力开发者快速上手,打造更“懂你”的AI助手。

335 3
|
6天前
|
存储 机器学习/深度学习 人工智能
|

文档切分实战:5种方法详解,打造高效RAG系统的第一步

本文深入解析RAG中至关重要的文档切分技术,系统介绍5种主流策略(句子、定长、重叠、递归、语义切分),结合代码示例与实战调优技巧,涵盖PDF/Markdown/代码等多格式处理,并提供质量评估与避坑指南,助你打造高精度、高效率的私有知识库。

105 7
|
3月前
|
SQL 分布式计算 大数据
|

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert:大数据数据流写业务迁移的实践与突破

本系列文章将围绕东南亚头部科技集团的真实迁移历程展开,逐步拆解 BigQuery 迁移至 MaxCompute 过程中的关键挑战与技术创新。本篇为第八篇,MaxCompute Streaming Insert:大数据数据流写业务迁移的实践与突破。 注:客户背景为东南亚头部科技集团,文中用 GoTerra 表示。

435 38
来自: 大数据计算 MaxCompute  版块
|
10月前
|
网络协议 网络安全 网络架构
|

开发者急盼!Cisco Packet Tracer超详细下载安装教程,附中文版插件使用步骤!

Cisco Packet Tracer是思科推出的专业路由器模拟器,适用于学习IOS配置、故障排查及网络拓扑构建。支持多种协议(STP、OSPF等),含无线功能与安全设备。本文提供下载链接、安装教程及高级功能介绍,如复杂网络仿真、可视化调试、自动化脚本和行业场景模拟等,助你高效学习网络技术并启用中文语言包。

6277 17
|
11月前
|
监控 Linux iOS开发
|

告别数据丢失!跨平台同步工具FreeFileSync 14.2下载教程|手把手配置多设备备份

FreeFileSync 14.2 是一款开源跨平台文件同步工具,支持 Windows、macOS 和 Linux 系统。新增功能包括实时同步监控、云存储集成(Google Drive 和 Dropbox)、智能冲突解决及性能优化,适用于数据备份、服务器文件同步等场景。本文详细介绍其下载、安装、配置及高级使用技巧,并提供常见问题解答和延伸学习资源。

3596 8
|
24天前
|
人工智能 PyTorch Linux
|

GLM-4V-9B 视觉多模态模型本地部署教程【保姆级教程】

本教程详细介绍如何在Linux服务器上本地部署智谱AI的GLM-4V-9B视觉多模态模型,涵盖环境配置、模型下载、推理代码及4-bit量化、vLLM加速等优化方案,助力高效实现图文理解与私有化应用。

384 2
|
12月前
|
机器学习/深度学习 算法 安全
|

用PyTorch从零构建 DeepSeek R1:模型架构和分步训练详解

本文详细介绍了DeepSeek R1模型的构建过程,涵盖从基础模型选型到多阶段训练流程,再到关键技术如强化学习、拒绝采样和知识蒸馏的应用。

1634 5
|
4月前
|
机器学习/深度学习 人工智能 物联网
|

AR技术融入到产品质量检测:提升效率与精度的未来趋势

元幂境认为,AR技术正革新产品质量检测,通过虚实融合提升精度、降低门槛、强化培训与协作,广泛应用于制造、电子、医疗及航空航天领域,未来结合AI将迈向智能检测新阶段。

692 0
|
12天前
|
机器学习/深度学习 分布式计算 Java
|

训练时一套,线上跑一套?离线训练与在线服务数据一致性这坑,我替你踩过了

训练时一套,线上跑一套?离线训练与在线服务数据一致性这坑,我替你踩过了

169 7
|
11月前
|
机器学习/深度学习 人工智能 数据挖掘
|

AI概率学预测足球大小球让球数据分析

在足球数据分析中,AI概率学预测主要用于大小球和让球盘口的分析。大小球预测通过历史数据、机器学习和实时数据动态调整进球数;让球分析则利用Elo评分等评估实力差距,结合盘口数据预测比赛结果。数据来源包括历史比赛、球队和球员信息及外部因素。模型选择涵盖回归、分类和时间序列模型,并通过交叉验证、误差分析进行优化。实际应用包括制定投注策略、风险管理及开发自动化系统。代码示例展示了使用随机森林回归模型预测进球数的过程。

1831 1

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
68971
内容
128
活动
439672
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务