|
3月前
|
机器学习/深度学习 存储 缓存
|

Chonkie:面向大语言模型的轻量级文本分块处理库

Chonkie是一个专为大语言模型(LLM)应用场景设计的轻量级文本分块处理库,提供高效的文本分割和管理解决方案。该库采用最小依赖设计理念,特别适用于现实世界的自然语言处理管道。本文将详细介绍Chonkie的核心功能、设计理念以及五种主要的文本分块策略。

168 0
|
3月前
|
人工智能 JavaScript vr&ar
|

眼镜不是“玩具”,是下一个时代的入口:聊聊VR和AR的未来走向

眼镜不是“玩具”,是下一个时代的入口:聊聊VR和AR的未来走向

93 5
|
3月前
|
数据采集 人工智能 算法
|

数据没洗干净,分析全白干:聊聊大数据里的“洗澡水”工程

数据没洗干净,分析全白干:聊聊大数据里的“洗澡水”工程

90 1
|
3月前
|
人工智能 自然语言处理 数据可视化
|

AI重新定义体育直播

2024年的AI体育直播正以前所未有的方式革新观赛体验:进球瞬间生成多语言解说、预判精彩镜头、实时战术分析、自动生成集锦。AI不仅取代传统导播,还提供风格化解说、情绪化运镜和防作弊辅助,让比赛更智能、互动更丰富。开发者可借助开源工具入局,未来或将实现全息解说与脑机直连,为体育注入科技魅力!

157 2
|
3月前
|
消息中间件 机器学习/深度学习 Java
|

java 最新技术驱动的智能教育在线实验室设备管理与实验资源优化实操指南

这是一份基于最新技术的智能教育在线实验室设备管理与实验资源优化的实操指南,涵盖系统搭建、核心功能实现及优化策略。采用Flink实时处理、Kafka消息队列、Elasticsearch搜索分析和Redis缓存等技术栈,结合强化学习动态优化资源调度。指南详细描述了开发环境准备、基础组件部署、数据采集与处理、模型训练、API服务集成及性能调优步骤,支持高并发设备接入与低延迟处理,满足教育机构数字化转型需求。代码已提供下载链接,助力快速构建智能化实验室管理系统。

125 44
|
3月前
|
机器学习/深度学习 存储 运维
|

机器学习异常检测实战:用Isolation Forest快速构建无标签异常检测系统

本研究通过实验演示了异常标记如何逐步完善异常检测方案和主要分类模型在欺诈检测中的应用。实验结果表明,Isolation Forest作为一个强大的异常检测模型,无需显式建模正常模式即可有效工作,在处理未见风险事件方面具有显著优势。

223 46
|
3月前
|
Windows
|

Windows下版本控制器(SVN)-启动服务器端程序

Windows下版本控制器(SVN)-启动服务器端程序

109 4
|
3月前
|
数据采集 人工智能 编解码
|

2025年颠覆闭源大模型?MonkeyOCR:这款开源AI文档解析模型,精度更高,速度更快!

还在依赖昂贵且慢的闭源OCR工具?华中科技大学开源的MonkeyOCR文档解析模型,以其超越GPT4o的精度和更快的推理速度,在单机单卡(3090)上即可部署,正颠覆业界认知。本文将深入解析其设计哲学、核心突破——大规模自建数据集,并分享实测体验与避坑指南。

1033 87
|
3月前
|
数据可视化 API vr&ar
|

AR不是玄学,是“搬来”的智能家居说明书!——增强现实在智慧家居里的那些玩法

AR不是玄学,是“搬来”的智能家居说明书!——增强现实在智慧家居里的那些玩法

83 3
|
3月前
|
存储 传感器 安全
|

数据不是“铁打的”,从出生到销毁它也有生命周期

数据不是“铁打的”,从出生到销毁它也有生命周期

186 1
|
3月前
|
缓存 人工智能 负载均衡
|

PAI 重磅发布模型权重服务,大幅降低模型推理冷启动与扩容时长

阿里云人工智能平台PAI 平台推出模型权重服务,通过分布式缓存架构、RDMA高速传输、智能分片等技术,显著提升大语言模型部署效率,解决模型加载耗时过长的业界难题。实测显示,Qwen3-32B冷启动时间从953秒降至82秒(降幅91.4%),扩容时间缩短98.2%。

202 1
来自: 人工智能平台PAI  版块
|
3月前
|
数据采集 机器学习/深度学习 编解码
|

从零复现Google Veo 3:从数据预处理到视频生成的完整Python代码实现指南

本文详细介绍了一个简化版 Veo 3 文本到视频生成模型的构建过程。首先进行了数据预处理,涵盖了去重、不安全内容过滤、质量合规性检查以及数据标注等环节。

235 5
|
3月前
|
XML JSON 监控
|

1688商品列表API接口全解析:从关键词搜索到分页处理方案

1688商品列表数据接口用于获取1688平台商品信息,支持关键词、价格区间、销量范围及类目等条件筛选,返回标题、价格、销量等基本信息。接口采用HTTP/GET或POST请求,响应格式为JSON或XML。主要功能包括商品信息获取、筛选与排序、分页查询及店铺商品获取。调用时需构造参数(如app_key、sign等),并处理返回数据。常用参数有搜索关键词(q)、页码(page)、每页数量(pageSize)、价格区间(priceStart/priceEnd)和类目ID(categoryId)。适用于商家数据分析与运营优化。

148 0
|
3月前
|
JSON 供应链 算法
|

跨境卖家必看!2025年1688API新功能解锁全球供应链

1688商品详情接口是阿里巴巴1688平台提供的API,用于获取商品标题、价格、库存、图片等详细信息。支持GET和POST请求,返回JSON格式数据,包含商品描述、商家信息等。适用于电商数据分析、比价系统等场景。调用流程包括申请权限、准备参数并发送请求、处理响应内容,需使用通用参数(如app_key、timestamp)和业务参数(如product_id)。该接口助力提升业务效率与决策准确性。

136 0
|
3月前
|
Cloud Native Java 微服务
|

最新 Java 从入门到实战技术实操指南

这是一份全面的Java实操指南,涵盖从入门到微服务架构的完整学习路径。内容包括Java 21新特性(虚拟线程、Record类)、响应式编程(Spring WebFlux)、微服务架构(Spring Boot 3.2、Spring Cloud、Kubernetes)、数据库与缓存(Redis 8、R2DBC)以及云原生部署和监控(Prometheus、Grafana)。通过电商系统实战项目,掌握最新技术栈与开发技巧。适合初学者及进阶开发者,附带代码示例与资源链接,助你快速提升技能。

72 0
|
3月前
|
存储 数据采集 数据可视化
|

Java 大视界 -- 基于 Java 的大数据可视化在城市地下管网管理与风险预警中的应用(275)

本文系统阐述 Java 与大数据可视化技术在城市地下管网管理中的应用,涵盖数据采集、三维建模、风险预警及性能优化,结合真实案例提供可落地的技术方案。

206 1
|
3月前
|
数据采集 搜索推荐 算法
|

Java 大视界 -- Java 大数据在智能教育学习社区用户互动分析与社区活跃度提升中的应用(274)

本文系统阐述 Java 大数据技术在智能教育学习社区中的深度应用,涵盖数据采集架构、核心分析算法、活跃度提升策略及前沿技术探索,为教育数字化转型提供完整技术解决方案。

117 10
|
3月前
|
SQL Kubernetes Java
|

Java 最新技术实操:从基础到进阶的详细指南

本文介绍了Java 17及后续版本的核心技术实操,涵盖新特性、集合框架、异常处理和多线程编程等内容。主要包括:密封类(Sealed Classes)的继承层级控制、模式匹配(Pattern Matching)简化类型判断、文本块(Text Blocks)处理多行字符串;集合框架中的工厂方法和Stream API高级操作;异常处理的最佳实践如自动资源管理(ARM)和自定义异常;多线程编程中的CompletableFuture异步编程和ReentrantLock显式锁使用。

123 6
|
3月前
|
存储 运维 Java
|

官宣 | Fluss 0.7 发布公告:稳定性与架构升级

Fluss 0.7 版本正式发布!历经 3 个月开发,完成 250+ 次代码提交,聚焦稳定性、架构升级、性能优化与安全性。新增湖流一体弹性无状态服务、流式分区裁剪功能,大幅提升系统可靠性和查询效率。同时推出 Fluss Java Client 和 DataStream Connector,支持企业级安全认证与鉴权机制。未来将在 Apache 孵化器中继续迭代,探索多模态数据场景,欢迎开发者加入共建!

255 8
来自: 实时计算 Flink  版块
|
3月前
|
缓存 网络协议 API
|

MyEMS开源能源管理系统核心代码解读014

这是一个基于Python的API应用Dockerfile,使用`python:slim`镜像构建。它安装了必要工具(如nano、telnet),创建了上传文件目录,复制了应用代码,并通过`pip`安装依赖。容器暴露8000端口,使用Gunicorn运行API服务,配置了4个工作进程和600秒超时。适合部署Python API应用,提高可移植性和一致性。

74 4
|
3月前
|
数据可视化 安全 调度
|

eBay页面解析与动态加载:数据抓取实战

本文从舞台调度的角度类比网页行为,探讨了平台(如eBay)页面加载与数据提取的技术逻辑。通过将用户访问视为“观众”体验,分析了浏览器请求、异步加载及反作弊机制的运作原理,并提供了一个Python脚本示例,展示如何模拟正常访问行为以抓取商品信息。文章强调理解页面调度节奏和行为逻辑的重要性,提出跨领域思维在技术实践中的应用价值,启发读者以全新视角看待网页交互与数据提取。

87 10
|
3月前
|

Quick BI移动微应用,提升企业数据消费效率

Quick BI 移动微应用,助力企业提升数据消费效率。通过微应用实现数据的灵活消费,员工直接在办公软件微应用上查看Quick BI报表数据。

79 0
|
3月前
|
存储 安全 Java
|

2025 最新史上最全 Java 面试题独家整理带详细答案及解析

本文从Java基础、面向对象、多线程与并发等方面详细解析常见面试题及答案,并结合实际应用帮助理解。内容涵盖基本数据类型、自动装箱拆箱、String类区别,面向对象三大特性(封装、继承、多态),线程创建与安全问题解决方法,以及集合框架如ArrayList与LinkedList的对比和HashMap工作原理。适合准备面试或深入学习Java的开发者参考。附代码获取链接:[点此下载](https://pan.quark.cn/s/14fcf913bae6)。

619 48
|
3月前
|
存储 JSON 数据安全/隐私保护
|

移动端跨域防护解析与信息获取对策

本文介绍了移动端数据访问限制机制及突破方法,以BOSS直聘为例,详细解析了其数据结构与接口特性。通过比喻“档案馆安保”生动阐述跨域访问限制原理,如身份验证、客户端识别和IP控制等。提供了基于Python的职位信息自动化获取代码示例,使用`requests`库结合代理服务完成数据提取与存储。同时建议学习移动端通信协议、接口分析工具(如mitmproxy)等内容,强调合规访问的重要性。

77 11
|
3月前
|
存储 自然语言处理 算法
|

Adaptive-k 检索:RAG 系统中自适应上下文长度选择的新方法

本文介绍 Adaptive-k 检索技术,这是一种通过相似性分布分析动态确定最优上下文规模的即插即用方法,该技术在显著降低 token 消耗的同时实现了检索增强生成系统的性能提升。

86 1
|
3月前
|
算法
|

基于遗传优化算法的带时间窗多车辆路线规划matlab仿真

本程序基于遗传优化算法,实现带时间窗的多车辆路线规划,并通过MATLAB2022A仿真展示结果。输入节点坐标与时间窗信息后,算法输出最优路径规划方案。示例结果包含4条路线,覆盖所有节点并满足时间窗约束。核心代码包括初始化、适应度计算、交叉变异及局部搜索等环节,确保解的质量与可行性。遗传算法通过模拟自然进化过程,逐步优化种群个体,有效解决复杂约束条件下的路径规划问题。

62 3
|
3月前
|
移动开发 搜索推荐 数据挖掘
|

这个全功能体育直播平台我愿称为观赛神器

熊猫比分是一款专为体育迷打造的全能观赛平台,支持多端同步和高清直播,提供赛事直播、即时比分、新闻资讯等功能。其1080P画质、多路信号源切换及弹幕互动让球迷仿佛身临其境;秒级更新的实时数据覆盖20+赛事类型,自定义关注球队功能确保用户不错过任何关键瞬间。此外,平台采用分布式架构与CDN加速技术,保证高并发下流畅体验,且隐私保护完善。无论是普通球迷还是体育从业者,都能在熊猫比分找到理想中的观赛生态。

59 5
|
3月前
|
数据采集 Web App开发 数据可视化
|

Python爬取豆瓣短评并生成词云分析

Python爬取豆瓣短评并生成词云分析

69 1
|
3月前
|
安全 Linux Android开发
|

如何将Kindle电子书下载到电脑:技术流程与操作解析

随着数字阅读兴起,Kindle成为主流电子书平台。然而,Amazon的封闭生态和DRM限制,使用户难以灵活管理书籍。本文从技术角度出发,讲解如何合法下载Kindle电子书至电脑,包括使用Kindle for PC、USB导出及进阶方案(如Android模拟器、WINE环境)。同时介绍文件格式处理、自动化备份与阅读体验优化方法,并强调版权合规的重要性,助您构建个人数字图书馆。

1096 3
|
3月前
|
人工智能 自然语言处理 算法
|

AI时代如何让大模型「读懂」企业数据?——从“单一问数”到“复杂决策”的智能跃迁

从早期的传统BI,到敏捷BI,再到智能BI,BI工具正逐步进化为具备类人推理能力的数字助手。Gartner预测,到2025年,增强型消费者体验将首次推动增强型BI(ABI)能力的采用率超过50%,这将深刻重塑企业的业务流程与决策模式,“人人都是数据消费者”的时代正加速到来。

364 1
|
3月前
|
数据采集 移动开发 算法
|

动态与静态结合:抓取移动端新闻数据的探索实践

本文探讨了移动设备上新闻App数据采集的挑战和应对策略。随着App迭代,数据结构变得复杂,今日头条等App的数据多来自动态接口而非静态HTML。应对策略包括界面分析、请求模拟、身份伪装和IP切换。实战案例展示了如何通过H5接口抓取今日头条热门要闻和评论。建议初学者先分析H5页面接口,合理使用代理服务以避免被封锁。文档强调了现代App数据采集需要采用多种技术手段,以应对复杂的数据结构和接口,保证数据采集的稳定性和有效性。

69 12
|
3月前
|
人工智能 监控 前端开发
|

AI工具:前端与后端的终极对决?谁将成为新时代的宠儿?

深入探讨AI工具对前端和后端开发的具体影响、各自的机遇与挑战,并分析未来开发者如何驾驭AI,实现能力跃迁。

159 0
|
3月前
|
机器学习/深度学习 移动开发 供应链
|

基于时间图神经网络多的产品需求预测:跨序列依赖性建模实战指南

本文展示了如何通过学习稀疏影响图、应用图卷积融合邻居节点信息,并结合时间卷积捕获演化模式的完整技术路径,深入分析每个步骤的机制原理和数学基础。

98 1
|
3月前
|
存储 分布式计算 API
|

基于PAI-FeatureStore的LLM embedding功能,结合通义千问大模型,可通过以下链路实现对物品标题、内容字段的离线和在线特征管理。

本文介绍了基于PAI-FeatureStore和通义千问大模型的LLM embedding功能,实现物品标题、内容字段的离线与在线特征管理。核心内容包括:1) 离线特征生产(MaxCompute批处理),通过API生成Embedding并存储;2) 在线特征同步,实时接入数据并更新Embedding至在线存储;3) Python SDK代码示例解析;4) 关键步骤说明,如客户端初始化、参数配置等;5) 最佳实践,涵盖性能优化、数据一致性及异常处理;6) 应用场景示例,如推荐系统和搜索排序。该方案支持端到端文本特征管理,满足多种语义理解需求。

115 1
|
3月前
|
数据采集 人工智能 自然语言处理
|

AI重构数据价值链,解码「智能问数」如何赋能医药制造

随着中国医药制造业的蓬勃发展,中国已跃居全球第二大医药市场。随着监管政策的深入实施,市场对医药企业在生产、运营、管理等方面提出了更为严苛的要求。2025年政府工作报告明确提出,持续推进“人工智能+”行动,将数字技术与制造优势、市场优势更好结合起来,支持大模型广泛应用。

308 26
|
3月前
|
数据采集 存储 Web App开发
|

多线程爬虫优化:快速爬取并写入CSV

多线程爬虫优化:快速爬取并写入CSV

77 1
|
3月前
|

HarmonyOS实战:List拖拽位置交换的多种实现方式

本文介绍了在鸿蒙系统中实现List元素位置交换的两种方法。方式一是通过列表的手势事件,利用`onItemDragStart`和`onItemDrop`方法,结合坐标与下标完成元素交换;方式二是借助元素和列表的拖拽事件,使用`onDragStart`与`onDrop`实现交互逻辑。文中详细解析了每一步代码,并指出当前方案存在交互动画不足的问题,未来将对此优化。希望读者能从中掌握实现技巧。

121 1
|
3月前
|
传感器 算法 安全
|

基于云模型的车辆行驶速度估计算法matlab仿真

本项目基于云模型的车辆行驶速度估计算法,利用MATLAB2022A实现仿真。相比传统传感器测量方法,该算法通过数据驱动与智能推理间接估计车速,具备低成本、高适应性特点。核心程序通过逆向正态云发生器提取样本数据的数字特征(期望、熵、超熵),再用正向云发生器生成云滴进行速度估算。算法结合优化调整云模型参数及规则库更新,提升速度估计准确性。验证结果显示,其估算值与高精度传感器测量值高度吻合,适用于交通流量监测、安全预警等场景。

48 0
|
3月前
|
算法 定位技术
|

我已证明P=NP

无论多难的问题,其实都有一个前提和”线索“。只要找到线索,就能解题。 I think I have proved P=NP problem from math.

143 0
|
3月前
|
存储 安全 Java
|

2025 年 Java 秋招面试必看的 Java 并发编程面试题汇总

文章摘要: 本文系统梳理Java并发编程核心知识点,助力2025年秋招面试。内容涵盖:1)基础概念,包括线程/进程区别、创建线程的3种方式(Thread/Runnable/Callable)、6种线程状态及转换;2)关键机制,对比sleep()与wait()的锁行为差异,解释start()而非run()启动线程的原因;3)工具类与典型应用场景。通过技术原理与代码示例结合的方式,帮助开发者深入理解并发模型、线程同步等核心问题,为高并发系统设计打下坚实基础。(150字)

198 0
|
3月前
|
JSON API 数据格式
|

淘宝天猫店铺订单列表、订单详情、订单物流 API 接口全攻略

淘宝天猫订单API接口简介:支持订单列表查询、订单详情获取及物流轨迹追踪功能。通过taobao.trades.sold.get等接口批量查询订单,按状态/时间筛选;taobao.trade.fullinfo.get获取订单详细信息;taobao.logistics.trade.trackget实时跟踪物流状态。开发者需注册账号、申请权限,并使用编程语言调用API,传递必要参数(如App Key、订单ID),处理JSON返回数据。适用于多场景订单管理与物流同步。

407 5
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
|

解决RAG检索瓶颈:RAPL线图转换让知识图谱检索准确率提升40%

本文探讨了RAPL框架,一种创新的人工智能架构,用于改进知识图谱环境下的检索增强生成系统。RAPL通过线图转换和合理化监督技术,构建高效且可泛化的检索器,显著提升大型语言模型在知识问答中的准确性和可解释性。文章分析了现有RAG系统的缺陷,即最短路径并非总是合理路径,并提出RAPL的三步解决方案:利用大型语言模型生成高质量训练数据、将知识图谱转换为线图以实现基于路径的推理,以及通过双向图神经网络进行路径检索。实验结果表明,RAPL不仅提高了检索精度,还缩小了小型与大型语言模型间的性能差距,推动了更高效、透明的AI系统发展。

105 4
|
3月前
|
API 开发者
|

深入研究:淘宝店铺所有商品API接口详解

淘宝店铺商品API接口(item_search_shop)用于获取指定店铺内所有商品信息,包括商品ID、名称、价格、库存、描述、图片URL等。开发者可通过必填参数shop_id及可选参数(如page、sort、category_id等)实现分页查询、排序和分类筛选功能。响应数据包含状态码、消息、商品总数及详细列表,适用于电商平台与第三方应用展示店铺商品场景。

120 3
|
3月前
|
算法 自动驾驶 机器人
|

基于Astar的复杂栅格地图路线规划算法matlab仿真

本项目基于A*算法实现复杂栅格地图的路径规划,适用于机器人导航、自动驾驶及游戏开发等领域。通过离散化现实环境为栅格地图,每个栅格表示空间区域属性(如可通行性)。A*算法利用启发函数评估节点,高效搜索从起点到终点的近似最优路径。项目在MATLAB2022a中运行,核心程序包含路径回溯与地图绘制功能,支持障碍物建模和路径可视化。理论结合实践,该方法具有重要应用价值,并可通过技术优化进一步提升性能。

95 0
|
3月前
|
机器学习/深度学习 存储 监控
|

ProRL:基于长期强化学习让1.5B小模型推理能力超越7B大模型

该研究通过长期强化学习训练(ProRL)挑战了强化学习仅能放大模型输出的传统观点,证明其能使基础模型发现全新推理策略。ProRL体系包含KL散度控制、参考策略重置及多元化任务训练集。核心算法GRPO优化了传统PPO,缓解熵坍塌问题并提升探索能力。Nemotron-Research-Reasoning-Qwen-1.5B模型基于此方法训练,在数学、编程、STEM等领域显著超越基础模型,性能提升达15.7%-25.9%,并在分布外任务中展现更强泛化能力。

75 3
|
3月前
|
算法 数据可视化
|

基于自混合干涉测量系统的线展宽因子估计算法matlab仿真

本程序基于自混合干涉测量系统,使用MATLAB2022A实现线展宽因子(a因子)估计算法仿真。通过对比分析自由载流子效应、带间跃迁、带隙收缩等因素对a因子的影响,揭示其物理机制。核心代码分别计算了不同效应对a因子的贡献,并绘制相应曲线进行可视化展示。自混合干涉测量技术利用激光反馈效应实现物体物理量测量,而线展宽因子描述了激光输出频率随功率变化的敏感程度,是研究半导体激光器特性的重要参数。该算法为光学测量和激光器研究提供了有效工具。

51 2