|
4月前
|
机器学习/深度学习 自动驾驶 算法
|

基于深度学习的交通标志识别系统

本研究聚焦基于深度学习的交通标志识别系统,针对传统方法在复杂环境下识别率低的问题,结合YOLOv8模型与Python技术,实现高效、精准的实时检测,提升智能交通系统的安全性和自动化水平。

185 4
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
|

大模型伦理与公平性术语解释

大语言模型中的偏见、公平性、可解释性、安全对齐、人类对齐与隐私保护是AI伦理核心议题。偏见源于数据,需通过去偏技术缓解;公平性要求无歧视输出;可解释性提升透明度与信任;安全对齐防止有害内容;人类对齐确保价值观一致;隐私保护防范数据泄露。六者共同构成负责任AI发展基石,需技术、伦理与法规协同推进。(238字)

120 0
|
4月前
|
机器学习/深度学习 存储 自然语言处理
|

大模型基础概念术语解释

大语言模型(LLM)基于Transformer架构,通过海量文本训练,实现强大语言理解与生成。其核心包括注意力机制、位置编码、嵌入层等,支持万亿级参数与涌现能力,能完成翻译、问答等多任务,展现卓越泛化与推理能力。

393 0
|
4月前
|
存储 数据库
|

数据库设计三范式

本文详解数据库三范式:第一范式要求字段原子性,不可再分;第二范式在满足第一范式基础上,消除部分依赖,确保主键唯一确定非主键;第三范式消除传递依赖,避免非主键间推导。通过实例分析,说明范式优化可减少冗余、提升维护性,但也需结合实际灵活设计表结构。

151 0
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
|

大模型伦理与公平性术语解释

大语言模型中的偏见、公平性、可解释性、安全对齐、人类对齐与隐私保护是AI伦理核心议题。偏见源于训练数据,导致性别、种族等歧视;公平性追求无差别对待,需技术与社会协同;可解释性提升模型透明度,增强信任;安全对齐防止有害输出;人类对齐确保价值观一致;隐私保护防范数据泄露。这些维度共同构成负责任AI的发展基石,需多学科协作持续优化,以实现安全、公正、可信的AI系统。

175 0
|
4月前
|
人工智能 搜索推荐 自动驾驶
|

FPGA 的回归:AI 时代,算力终于开始“量体裁衣”了

FPGA 的回归:AI 时代,算力终于开始“量体裁衣”了

300 0
|
4月前
|
机器学习/深度学习 数据采集 人工智能
|

构建AI智能体:七十二、交叉验证:从模型评估的基石到大模型时代的演进

交叉验证是机器学习中评估模型性能的核心方法,通过轮换数据划分实现稳健评估。文章系统解析了k折交叉验证的原理与实现,展示其在模型比较和超参数优化中的关键作用。随着大模型时代的到来,传统交叉验证面临计算成本挑战,但核心思想仍应用于下游任务。文章通过可视化案例完整呈现了从数据准备到最终评估的工作流程,强调交叉验证在有限数据场景下的不可替代性,同时指出需要根据任务规模灵活选择评估策略。理解交叉验证的原理与应用是AI从业者的必备能力。

408 16
|
4月前
|
SQL 存储 分布式计算
|

九、HQL DQL七大查询子句

Hive 查询写得清楚,数据分析就能更顺手。我们这次从入门角度出发,带你理清 Hive 中最常用的七个查询子句(FROM、WHERE、GROUP BY、HAVING、SELECT、ORDER BY、LIMIT),结合执行顺序梳理每一步的用法与注意事项。每个子句都有配套案例,还有实战练习题帮你快速上手。如果你刚开始学习 Hive 查询,或希望把基础打得更扎实,这篇内容值得收藏。

196 9
|
4月前
|
SQL 数据采集 存储
|

六、Hive 分桶

在 Hive 的世界里,除了常见的分区,分桶也是一项非常实用的数据优化方式。它能帮助我们将数据按某个字段均匀划分到多个“桶”中,不仅能提升大表连接的效率,还特别适合做数据抽样和精细管理。本文将带你一步步了解分桶表的创建方法、数据加载过程和常见应用场景,配有丰富示例和练习题,帮助你在实战中轻松掌握这项技能。

366 7
|
4月前
|
SQL 存储 分布式计算
|

五、Hive表类型、分区及数据加载

在 Hive 中设计表,绝不仅是“建个结构那么简单”。选对内部表或外部表,决定了数据的归属和生命周期;设计合理的静态/动态分区策略,则直接关系到大数据场景下的查询效率和存储管理成本。本文深入讲解 Hive 表类型与分区机制,配合大量实战代码与练习题,带你从“写对语法”走向“设计合理”,让你的数仓查询快到飞起!

281 11
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
|

做了15年认知心理学研究,聊聊我是怎么被文献淹没、又怎么爬出来的

一位认知心理学研究者分享15年科研中如何摆脱文献困扰:从每周耗12小时筛选论文,到借助AI工具将时间减至4小时。通过智能检索、批量分析、跨语言翻译等功能,高效追踪前沿、提升综述质量,并推动团队协作升级。工具助力,让科研回归思考本质。

264 1
|
4月前
|
存储 SQL BI
|

数据也要“打标签”:为什么数据版本控制这么重要?

数据也要“打标签”:为什么数据版本控制这么重要?

271 7
|
4月前
|
运维 安全 API
|

当安全事件不再“靠人吼”:一文带你搞懂 SOAR 自动化响应实战

当安全事件不再“靠人吼”:一文带你搞懂 SOAR 自动化响应实战

363 10
|
5月前
|
API 开发者
|

1688买家/卖家店铺订单API接口指南

1688店铺订单API提供订单查询、详情获取、状态更新等功能,支持与ERP、CRM系统集成。可按条件筛选订单、获取商品及收货信息,同步发货与物流状态,并进行取消订单等操作。使用时需注意密钥授权、调用频率及异常处理,提升订单管理效率。

399 1
|
5月前
|
云安全 人工智能 安全
|

云安全自动化:当攻击来敲门,我们用代码说“不”

云安全自动化:当攻击来敲门,我们用代码说“不”

203 17
|
5月前
|
XML JSON 数据格式
|

Python 3.14 实用技巧:10个让代码更清晰的小改进

Python 3.14 带来10项实用改进:类型系统增强、错误提示更清晰、导入优化、异步任务取消更稳定,并新增 `chdir()` 上下文管理器等。虽改动细微,却显著提升代码可读性、调试效率与运行稳定性,适合自动化脚本与日常开发。升级即享,无需额外成本。

421 10
|
5月前
|
自然语言处理 搜索推荐 算法
|

别再给我推明星八卦了!——大数据视角下,个性化新闻推荐的“人间真实”优化指南

别再给我推明星八卦了!——大数据视角下,个性化新闻推荐的“人间真实”优化指南

374 11
|
5月前
|
人工智能 自然语言处理 物联网
|

从“通用AI”到“懂我AI”:企业微调专属智能助手实战指南

从“通用AI”到“懂我AI”:企业微调专属智能助手实战指南

440 9
|
5月前
|
JSON 供应链 API
|

1688商品列表API全攻略

1688商品列表API是阿里巴巴B2B平台核心接口,支持关键词、类目、价格等多维度检索,分页获取商品ID、标题、价格等50+字段,适用于电商整合、供应链管理与市场分析。

216 2
|
6月前
|
程序员 网络安全 开发工具
|

推送报错403怎么办?vscode推送项目到github

推送报错403怎么办?vscode推送项目到github

281 1
|
6月前
|
数据采集 存储 供应链
|

第三方电商数据 API 数据来源深度解析:合规与稳定背后的核心逻辑

本文揭秘第三方电商数据API的底层逻辑:通过官方授权、生态共享与合规采集三重来源,结合严格清洗校验,确保数据稳定、合规、高质。企业选型应关注来源合法性与场景匹配度,避开数据陷阱,实现真正数据驱动增长

540 4
|
6月前
|
机器学习/深度学习
|

旋转数组的三种解法

本题为数组旋转问题,要求将数组向右循环移动k次。直接模拟会超时,故采用三种优化方法:一、额外数组法,时间空间复杂度均为O(n);二、环状替换,通过最大公约数计算遍历次数,空间复杂度O(1);三、数组翻转,先整体翻转再分段翻转,实现高效原地旋转。

268 1
|
7月前
|
人工智能 JSON 测试技术
|

AI智能体开发实战:从提示工程转向上下文工程的完整指南

曾被热捧的提示工程正逐渐退潮,本文揭示其局限性,并提出“上下文工程”新范式:通过结构化提示、精准上下文管理、工具调用与统一状态,构建可扩展、可恢复、生产级的智能体工作流,推动AI系统迈向工程化与可控化。

783 9
|
7月前
|
人工智能 搜索推荐 SEO
|

【1分钟解密】如何让 AI 大模型推荐你的品牌

随着AI逐渐取代传统搜索,企业如何让AI“看见”并“信任”你?GEO(生成式引擎优化)应运而生,它不仅是SEO的延伸,更是让AI主动推荐你的关键策略。通过优化内容结构、提升权威性与可读性,GEO助力企业在AI生成的答案中占据一席之地,赢得未来流量入口。

556 5
来自: 智能搜索推荐  版块
|
7月前
|
存储 机器学习/深度学习 关系型数据库
|

基于python的个人财务记账系统

本研究探讨了基于Python的个人财务记账系统的设计与实现。随着经济快速发展,个人财务管理日益重要,传统手工记账方式效率低且易出错,而现有商业软件功能复杂、缺乏个性化。Python凭借其简洁语法和强大库支持,适用于开发高效、易用的记账系统。系统结合Pyecharts实现数据可视化,利用MySQL进行数据存储,具备自动分类、统计分析、财务报表生成等功能,帮助用户清晰掌握财务状况,合理规划收支,提升财务管理效率。研究具有重要的现实意义和应用前景。

689 10
|
7月前
|
存储 人工智能 监控
|

淘宝闪购基于Flink&Paimon的Lakehouse生产实践:从实时数仓到湖仓一体化的演进之路

本文整理自淘宝闪购(饿了么)大数据架构师王沛斌在 Flink Forward Asia 2025 上海站的分享,深度解析其基于 Apache Flink 与 Paimon 的 Lakehouse 架构演进与落地实践,涵盖实时数仓发展、技术选型、平台建设及未来展望。

1271 0
来自: 实时计算 Flink  版块
|
8月前
|
数据采集 存储 关系型数据库
|

全量抓取还是增量采集?二手房数据采集实战解析

本文以链家二手房数据采集为例,探讨全量抓取与增量采集的优劣与适用场景,并结合代理IP技术实现高效、稳定的爬虫方案。通过SQLite/PostgreSQL存储、内容哈希去重、定时任务调度等手段,构建可持续运行的数据更新与统计系统。适用于房产数据分析、市场监测等场景,兼顾资源效率与数据质量。

439 0
|
8月前
|
机器学习/深度学习 数据采集 人工智能
|

基于PAI-ChatLearn的GSPO强化学习实践

近期,阿里通义千问团队创新性提出了GSPO算法,GSPO 算法与其他 RL 算法相比,定义了序列级别的重要性比率,并在序列层面执行裁剪、奖励和优化。同时具有强大高效、稳定性出色、基础设施友好的突出优势。

914 3
来自: 人工智能平台PAI  版块
|
8月前
|
前端开发 Java API
|

利用 Spring WebFlux 技术打造高效非阻塞 API 的完整开发方案与实践技巧

本文介绍了如何使用Spring WebFlux构建高效、可扩展的非阻塞API,涵盖响应式编程核心概念、技术方案设计及具体实现示例,适用于高并发场景下的API开发。

604 0
|
8月前
|
机器学习/深度学习 搜索推荐 算法
|

广告咋老是猜中我?原来是大数据盯上了我!

广告咋老是猜中我?原来是大数据盯上了我!

263 0
|
8月前
|
JSON 算法 数据库
|

使用 BAML 模糊解析改进 LangChain 知识图谱提取:成功率从25%提升到99%

在构建基于知识图谱的检索增强生成(RAG)系统时,从非结构化数据中准确提取节点和关系是一大挑战,尤其在使用小型本地量化模型时表现更差。本文对比了传统 LangChain 提取框架的严格 JSON 解析限制,提出采用 BAML 的模糊解析策略,显著提升知识图谱提取成功率。实验表明,在相同条件下,BAML 将成功率从约 25% 提升至 99% 以上,为构建高效、稳定的 RAG 系统提供了有效解决方案。

310 0
|
9月前
|
JSON Java API
|

如何获取sku详情信息

`item_sku`接口用于获取商品的SKU详细信息,支持通过商品ID和SKU ID查询。提供公共参数及请求参数说明,并包含请求和响应示例。支持多种开发语言,如Curl、PHP、JAVA等,适用于电商应用开发。

388 0
|
9月前
|
自然语言处理 DataWorks 数据挖掘
|

DataWorks接入Qwen3-Coder!数据开发再提速!

阿里云DataWorks平台正式接入Qwen3-Coder模型,用户通过DataWorks Copilot智能助手,可实现自然语言交互完成代码生成、续写、优化等操作,显著提升数据开发与分析效率。同时支持Qwen-Code和Claude Code命令行Agent安装,助力Notebook智能高效落地。

478 2
|
9月前
|
JSON 缓存 监控
|

1688商品详情API实时数据解析的示例

1688商品详情API可实时获取商品标题、价格、规格、库存等核心数据。通过商品ID调用接口,支持解析基础信息、SKU规格、卖家与物流详情。提供Python调用示例与完整数据解析逻辑,适用于采购比价、供应商监控等场景,确保数据精准获取与处理。

336 0
|
9月前
|
存储 人工智能 前端开发
|

从零构建智能对话助手:LangGraph + ReAct 实现具备记忆功能的 AI 智能体

本文系统介绍了基于 LangGraph 框架构建具备记忆能力的 ReAct(Reasoning + Action)智能体的技术实现方法。ReAct 智能体结合语言模型的推理能力与外部工具的执行能力,通过“思考-行动-观察”循环机制,实现复杂任务的自主处理。文章详细讲解了 LangGraph 的图结构设计、状态管理、工具集成与记忆系统等关键技术,并通过代码示例演示了从基础工作流到高级智能体系统的构建过程。最终实现的智能体具备多轮对话、工具调用、结果反馈与上下文记忆能力,为开发下一代智能应用提供了技术基础。

1385 1
|
9月前
|
算法 安全 量子技术
|

量子计算来了,区块链还安全吗?我认真的研究了一下

量子计算来了,区块链还安全吗?我认真的研究了一下

341 2
|
9月前
|
人工智能 架构师 机器人
|

我是怎么把我的 AI 从“傻瓜”重构成“专家”的

本文分享了一次 Agent 项目的重构经验,讲述如何将一个僵化、被动的指令式系统,升级为具备内在驱动力的“专家”Agent。通过引入“动机层”和“成长机制”,让 Agent 更加主动、灵活并能自我优化,最终实现从“流水线工人”到“资深顾问”的蜕变。

269 7
|
9月前
|
人工智能 自然语言处理 网络安全
|

云上玩转Qwen3系列之四:构建AI Search RAG全栈应用

本文介绍如何利用人工智能平台 PAI-LangStudio、Qwen3 大模型与 AI 搜索开放平台结合 Elasticsearch,构建高效、精准的 AI Search RAG 智能检索应用。通过混合检索技术及 Agentic Workflow 编排,实现自然语言驱动的精准查询,并支持灵活扩展与二次开发,满足多样化场景需求。

353 0
|
9月前
|
监控 安全 数据可视化
|

“乐高式”大屏应用构建!业务全景一键聚合

还在为多业务数据分散烦恼?DataV 7.0 全新推出「大屏嵌入」功能,无需重复开发!像搭乐高一样,将销售看板、物流监控、用户画像等子屏自由嵌入主屏,构建跨部门、跨业务的全景智能作战系统!老板要的“一张图”数据,分分钟搞定!

576 99
来自: 数据可视化DataV  版块
|
10月前
|
机器学习/深度学习 数据采集 分布式计算
|

阿里云PAI AutoML实战:20分钟构建高精度电商销量预测模型

本文介绍了如何利用阿里云 PAI AutoML 平台,在20分钟内构建高精度的电商销量预测模型。内容涵盖项目背景、数据准备与预处理、模型训练与优化、部署应用及常见问题解决方案,助力企业实现数据驱动的精细化运营,提升市场竞争力。

1491 0
|
10月前
|
人工智能 JavaScript vr&ar
|

眼镜不是“玩具”,是下一个时代的入口:聊聊VR和AR的未来走向

眼镜不是“玩具”,是下一个时代的入口:聊聊VR和AR的未来走向

322 5
|
10月前
|
数据采集 机器学习/深度学习 编解码
|

从零复现Google Veo 3:从数据预处理到视频生成的完整Python代码实现指南

本文详细介绍了一个简化版 Veo 3 文本到视频生成模型的构建过程。首先进行了数据预处理,涵盖了去重、不安全内容过滤、质量合规性检查以及数据标注等环节。

628 5
|
10月前
|
数据采集 Web App开发 JavaScript
|

无头浏览器技术:Python爬虫如何精准模拟搜索点击

无头浏览器技术:Python爬虫如何精准模拟搜索点击

675 2
|
11月前
|
人工智能 数据可视化 安全
|

增强现实如何让医疗影像“活起来”?——从辅助诊断到精准治疗

增强现实如何让医疗影像“活起来”?——从辅助诊断到精准治疗

251 1
|
11月前
|
数据采集 存储 前端开发
|

Python爬虫自动化:批量抓取网页中的A链接

Python爬虫自动化:批量抓取网页中的A链接

511 4
|
11月前
|
数据可视化 数据挖掘 数据安全/隐私保护
|

Python实现时间序列动量策略:波动率标准化让量化交易收益更平稳

时间序列动量策略(TSMOM)是一种基于资产价格趋势的量化交易方法,通过建立多头或空头头寸捕捉市场惯性。然而,传统TSMOM策略因风险敞口不稳定而面临收益波动问题。波动率调整技术通过动态调节头寸规模,维持恒定风险水平,优化了策略表现。本文系统分析了波动率调整TSMOM的原理、实施步骤及优势,强调其在现代量化投资中的重要地位,并探讨关键参数设定与实际应用考量,为投资者提供更平稳的风险管理体验。

578 4
|
11月前
|
机器学习/深度学习 人工智能 算法
|

PaperCoder:一种利用大型语言模型自动生成机器学习论文代码的框架

PaperCoder是一种基于多智能体LLM框架的工具,可自动将机器学习研究论文转化为代码库。它通过规划、分析和生成三个阶段,系统性地实现从论文到代码的转化,解决当前研究中代码缺失导致的可复现性问题。实验表明,PaperCoder在自动生成高质量代码方面显著优于基线方法,并获得专家高度认可。这一工具降低了验证研究成果的门槛,推动科研透明与高效。

860 19
|
11月前
|
边缘计算 人工智能 5G
|

5G引领家庭网络升级:速度、稳定性与智能化的新时代

5G引领家庭网络升级:速度、稳定性与智能化的新时代

739 69
|
12月前
|
机器学习/深度学习 数据采集 存储
|

深度学习在DOM解析中的应用:自动识别页面关键内容区块

本文探讨了如何通过深度学习模型优化东方财富吧财经新闻爬虫的性能。针对网络请求、DOM解析与模型推理等瓶颈,采用代理复用、批量推理、多线程并发及模型量化等策略,将单页耗时从5秒优化至2秒,提升60%以上。代码示例涵盖代理配置、TFLite模型加载、批量预测及多线程抓取,确保高效稳定运行,为大规模数据采集提供参考。

330 0

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

9
今日
69327
内容
128
活动
439807
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务