数据库

首页 标签 数据库
# 数据库 #
关注
184192内容
|
1天前
|
视频 RAG 中分块策略:基于停顿、滑动窗口与基于 LLM 的方法
本文探讨视频RAG中的核心挑战——如何为无时间结构的视频转录文本设计有效分块策略。对比传统文本分块,提出基于停顿、重叠窗口、递归切分及LLM驱动的主题分块四层方案,实现细粒度检索与全局理解兼顾,提升视频内容检索准确性与上下文完整性。
|
1天前
|
《ZAKU渗透论:卓伊凡的2026渗透工程》第四章:Web攻击原理(下)——XSS、CSRF、文件上传漏洞
本章详解XSS、CSRF与文件上传三大Web漏洞:XSS通过注入恶意脚本窃取Cookie;CSRF伪造已登录用户请求执行非自愿操作;文件上传漏洞则因校验缺失致服务器被控。三者共性——过度信任用户输入。(239字)
|
1天前
|
《ZAKU渗透论:卓伊凡的2026渗透工程》第三章:Web攻击原理(上)——注入与SQL注入
本章详解Web攻击核心——注入与SQL注入。通过“小明输入‘小明’OR‘1’=‘1’秒变管理员”的生动案例,揭示攻击本质:程序混淆数据与代码,导致恶意SQL被执行。深入剖析万能密码、数据窃取、权限绕过等危害,并指出漏洞长期存在的根源:历史代码、意识不足与修复成本。
拒绝“大模型幻觉”:一文彻底搞懂 RAG(检索增强生成)技术全流程
本文深入解析RAG(检索增强生成)技术,直击大模型落地私有知识场景的核心痛点——如何让LLM精准、低成本、高时效地基于企业文档作答。从文本分片、向量化索引,到召回重排、增强生成,系统拆解五大关键步骤,揭示RAG作为“AI外挂”的底层逻辑与工程实践精髓。
|
1天前
| |
医疗AI智能体:整体效能评估可视化:从原理到实践的10大核心量化指标体系.130
本文系统阐述医疗AI智能体的量化评估体系,强调其行业特殊性——关乎生命健康、强合规要求、用户多元、闭环严苛。提出覆盖技术(幻觉率、准确率、响应时间、召回率)与业务(满意度、审核通过率、问诊完成率、交互时长)的8大核心指标,配套数据采集、计算、监控、迭代闭环流程及可落地代码实现,为临床合规落地提供客观依据。
培训机构如何快速搭建自己的在线教育平台?网校系统源码搭建指南
随着在线教育行业快速发展,越来越多培训机构开始搭建自主在线教育平台。本文从网校系统源码的优势、核心功能、搭建流程以及未来发展趋势等方面进行详细解析,帮助教育培训机构快速完成在线教育平台建设
知识库为谁而建 ?
随着 Agent 的逐步广泛应用,知识库的使用者正在从人变成 Agent。 知识库的设计逻辑、维护方式、甚至存在的意义,都需要重新思考。
|
2天前
|
医疗行业数据泄露驱动因素与技术防控体系研究 —— 基于 2026 年 Verizon 数据泄露报告的实证分析
本文基于Verizon 2026年DBIR报告,系统剖析医疗数据泄露五大主因:勒索攻击、人为失误、配置错误、移动社工及AI插件滥用(合计占比81%)。提出覆盖威胁识别、技术防御、代码实现与应急响应的闭环防控体系,并提供恶意URL检测、医疗钓鱼识别、AI插件审计等可部署代码,兼具理论深度与工程实践价值。(239字)
|
2天前
|
软件开发新手入门五大核心技能之版本控制工具(四)
教程来源 http://ltglu.cn/ 本章详解 Git 远程协作与标签管理:涵盖远程仓库配置、克隆、推送/拉取、fetch、分支跟踪及冲突解决;并介绍轻量与附注标签的创建、查看、推送与删除,助力团队高效协同与版本精准标记。
|
2天前
|
软件开发新手入门五大核心技能之逻辑思维与问题排查(一)
教程来源 http://qeext.cn/ 程序员的核心生产力不是写代码,而是解决问题。本书揭示:80%工作时间用于理解代码、排查Bug。以逻辑三要素(概念、命题、推理)为根基,结合真值表、德摩根定律、逆向思维与MECE原则,系统训练问题分析与定位能力,助你告别“面向搜索引擎编程”。
免费试用