|
9月前
|
机器学习/深度学习 自然语言处理 监控
|

保险行业的“算命术”?——数据驱动的风险评估真相

保险行业的“算命术”?——数据驱动的风险评估真相

245 6
|
9月前
|
机器学习/深度学习 传感器 算法
|

“机器人变聪明,得靠量子加速?”——聊聊量子计算在机器人学习里的玩法

“机器人变聪明,得靠量子加速?”——聊聊量子计算在机器人学习里的玩法

383 0
|
9月前
|
机器学习/深度学习 运维 Java
|

Java 大视界 -- 基于 Java 的大数据实时流处理在能源行业设备状态监测与故障预测中的应用(210)

本篇文章探讨了基于 Java 的大数据实时流处理技术在能源行业设备状态监测与故障预测中的应用。文章分析了传统能源设备运维的局限性,如人工巡检效率低、数据处理滞后等问题,并引入 Java 大数据技术作为解决方案。通过实时流处理引擎如 Apache Flink,实现多源异构数据的采集、清洗与异常检测,提升了设备监测的实时性与准确性。同时,文章还介绍了数字孪生、边缘计算等前沿技术的融合应用,并结合国家电网和海上风电场的实际案例,展示了 Java 大数据技术在提升运维效率、降低故障风险和节约成本方面的显著效果。

371 0
|
9月前
|
文字识别 算法 语音技术
|

基于模型蒸馏的大模型文案生成最佳实践

本文介绍了基于模型蒸馏技术优化大语言模型在文案生成中的应用。针对大模型资源消耗高、部署困难的问题,采用EasyDistill算法框架与PAI产品,通过SFT和DPO算法将知识从大型教师模型迁移至轻量级学生模型,在保证生成质量的同时显著降低计算成本。内容涵盖教师模型部署、训练数据构建及学生模型蒸馏优化全过程,助力企业在资源受限场景下实现高效文案生成,提升用户体验与业务增长。

963 23
|
9月前
|
人工智能 算法 量子技术
|

北京百思可瑞教育:模拟天气这件事,量子计算机轻松实现模拟天气气候

本文探讨了气候预测的复杂性及量子计算在该领域的潜力。传统超级计算机难以应对气候模型的庞大计算量,而量子计算凭借其并行性和量子纠缠特性,有望大幅提升气候模拟的效率与精度。文章介绍了量子计算的基本原理、相关实验进展,以及其在碳捕捉、城市微气候预测等方面的应用前景,展望了未来量子技术在气候科学中的深远影响。

276 0
|
10月前
|
JSON 自然语言处理 API
|

闲鱼商品详情API响应数据python解析

闲鱼商品详情API(goodfish.item_get)通过商品ID获取标题、价格、描述、图片等信息,支持Python等多语言调用。本文提供Python请求示例,包含请求构造与数据处理方法。

407 0
|
10月前
|
区块链 数据安全/隐私保护
|

还靠人投票?哥们,链上治理早就可以“无需信任”了!

还靠人投票?哥们,链上治理早就可以“无需信任”了!

197 0
|
10月前
|
大数据 Python
|

别让钱悄悄溜走:用大数据把个人财务管得明明白白

别让钱悄悄溜走:用大数据把个人财务管得明明白白

252 0
|
10月前
|
API 开发工具 开发者
|

快速获取线下场景POI数据,分享场景查询API体验指南

本文介绍了如何通过“场景查询(名称关键词)”API快速获取POI数据。该API只需输入场景关键词即可返回丰富的POI信息,如名称、地址、经纬度等,支持品牌、分类、城市等多维度筛选,并提供分页功能。接口简洁易用,响应速度快,适合用于竞品分析、门店扩展等场景。开发者可通过开放平台注册获取API Key,并使用SDK快速集成。推荐有POI查询需求的开发者体验使用。

392 0
|
10月前
|
存储 人工智能 前端开发
|

从零构建智能对话助手:LangGraph + ReAct 实现具备记忆功能的 AI 智能体

本文系统介绍了基于 LangGraph 框架构建具备记忆能力的 ReAct(Reasoning + Action)智能体的技术实现方法。ReAct 智能体结合语言模型的推理能力与外部工具的执行能力,通过“思考-行动-观察”循环机制,实现复杂任务的自主处理。文章详细讲解了 LangGraph 的图结构设计、状态管理、工具集成与记忆系统等关键技术,并通过代码示例演示了从基础工作流到高级智能体系统的构建过程。最终实现的智能体具备多轮对话、工具调用、结果反馈与上下文记忆能力,为开发下一代智能应用提供了技术基础。

1582 1
|
10月前
|
人工智能 缓存 资源调度
|

云上AI推理平台全掌握 (4):大模型分发加速

为应对大模型服务突发流量场景,阿里云人工智能平台 PAI 推理服务 PAI-EAS 提供本地目录内存缓存(Memory Cache)的大模型分发加速功能,有效解决大量请求接入情况下的推理延迟。PAI-EAS 大模型分发加速功能,零代码即可轻松完成配置。

856 3
来自: 人工智能平台PAI  版块
|
10月前
|
人工智能 数据可视化 Java
|

性能提升 10 倍, DIFY 模式迁移至 Spring AI Alibaba 模式 零改造实现

将 Dify 应用迁移至 Spring AI Alibaba,可兼顾可视化开发效率与代码工程灵活性,显著提升系统性能与扩展能力,适用于复杂 AI 业务场景。

1358 0
|
10月前
|
前端开发 Java API
|

基于 Spring Boot 3 与 React 的 Java 学生信息管理系统从入门到精通实操指南

本项目基于Spring Boot 3与React 18构建学生信息管理系统,涵盖前后端开发、容器化部署及测试监控,提供完整实操指南与源码,助你掌握Java全栈开发技能。

543 0
|
10月前
|
测试技术 API 开发者
|

淘宝关键词搜索商品列表API接入指南(含Python示例)

淘宝关键词搜索商品列表API是淘宝开放平台的核心接口,支持通过关键词检索商品,适用于比价、选品、市场分析等场景。接口提供丰富的筛选与排序功能,返回结构化数据,含商品ID、标题、价格、销量等信息。开发者可使用Python调用,需注意频率限制与错误处理,建议先在沙箱环境测试。

460 6
|
10月前
|
人工智能 iOS开发 Windows
|

装了就舍不得卸载的一款电脑截图软件!

这是一款免费且功能强大的截图工具,支持Windows和Mac系统。它不仅界面简洁无广告,还提供带壳截图、文字提取、内容翻译与AI解释等实用功能,极大提升工作与学习效率。下载地址:https://tool.nineya.com/s/1j06j6dmj

1197 0
|
10月前
|
人工智能
|

你花大钱养的 AI,为啥感觉还是个“人工智障”?

这篇文章探讨了为何我们常觉得AI“呆呆的”——问题不在于AI本身,而在于我们“教”的方式。我们往往把AI当成“流水线工人”,用冗长指令让它机械执行任务,却忽略了它本可成为有主动性、创造力的“顾问”。通过赋予AI“欲望”与“成就感”,如《自衍体》项目所做的,AI能变得主动思考、自我驱动。关键在于:别当工头下命令,而要当合伙人点燃它的“心”。

728 62
|
10月前
|
机器学习/深度学习 存储 算法
|

强化学习算法基准测试:6种算法在多智能体环境中的表现实测

本文系统研究了多智能体强化学习的算法性能与评估框架,选用井字棋和连珠四子作为基准环境,对比分析Q-learning、蒙特卡洛、Sarsa等表格方法在对抗场景中的表现。实验表明,表格方法在小规模状态空间(如井字棋)中可有效学习策略,但在大规模状态空间(如连珠四子)中因泛化能力不足而失效,揭示了向函数逼近技术演进的必要性。研究构建了标准化评估流程,明确了不同算法的适用边界,为理解强化学习的可扩展性问题提供了实证支持与理论参考。

518 0
|
10月前
|
监控 算法 数据处理
|

Python 3.14七大新特性总结:从t-string模板到GIL并发优化

本文基于当前最新的beta 2版本,深入分析了Python 3.14中的七项核心新特性。

349 4
|
10月前
|
SQL 关系型数据库 MySQL
|

JOIN顺序优化:小表驱动大表的执行原则

在数据库查询优化中,“小表驱动大表”是一种提升SQL查询效率的常用策略。其核心思想是优先处理数据量较小的表,再与大表进行连接操作,从而减少数据扫描量、降低I/O开销并提高内存使用效率。通过显式指定JOIN顺序、使用EXISTS替代IN以及合理创建索引等方式,可以有效实现该原则。例如,在连接部门表(小表)和员工表(大表)时,先处理小表可显著提升查询性能。掌握这一原则有助于编写高效SQL语句,优化数据库整体表现。

889 0
|
11月前
|
JSON 分布式计算 搜索推荐
|

用 Spark 优化亿级用户画像计算:Delta Lake 增量更新策略详解

在亿级用户画像计算中,传统全量更新面临数据量大、更新频繁、延迟敏感等挑战。本文详解如何结合 Spark 与 Delta Lake 实现高效增量更新,通过仅处理变化数据,显著降低资源消耗并提升实时性,助力构建高性能用户画像系统。

562 3
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
|

不是矫情,是“抑郁”——人工智能如何看懂你没说出口的情绪

不是矫情,是“抑郁”——人工智能如何看懂你没说出口的情绪

309 0
|
11月前
|
机器学习/深度学习 存储 算法
|

SMOTE-XGBoost实战:金融风控中欺诈检测的样本不平衡解决方案

本文深入探讨金融支付风控领域中的欺诈检测问题,针对样本不平衡的核心痛点,提出一种基于动态密度SMOTE算法的改进方案,并结合优化后的XGBoost模型实现高性能检测。相比传统方法,本文方案在IEEE-CIS数据集上显著提升Recall(达0.85)和AUC-PR(达0.72),同时控制推理时延在合理范围。文章还详细解析特征工程体系、在线推理优化及动态阈值调整机制,并展望联邦学习与图神经网络等未来方向,为实际业务应用提供全面指导。

806 1
|
11月前
|
机器学习/深度学习 存储 运维
|

机器学习异常检测实战:用Isolation Forest快速构建无标签异常检测系统

本研究通过实验演示了异常标记如何逐步完善异常检测方案和主要分类模型在欺诈检测中的应用。实验结果表明,Isolation Forest作为一个强大的异常检测模型,无需显式建模正常模式即可有效工作,在处理未见风险事件方面具有显著优势。

918 46
|
11月前
|
存储 安全 Java
|

2025 年 Java 秋招面试必看的 Java 并发编程面试题汇总

文章摘要: 本文系统梳理Java并发编程核心知识点,助力2025年秋招面试。内容涵盖:1)基础概念,包括线程/进程区别、创建线程的3种方式(Thread/Runnable/Callable)、6种线程状态及转换;2)关键机制,对比sleep()与wait()的锁行为差异,解释start()而非run()启动线程的原因;3)工具类与典型应用场景。通过技术原理与代码示例结合的方式,帮助开发者深入理解并发模型、线程同步等核心问题,为高并发系统设计打下坚实基础。(150字)

653 0
|
11月前
|
机器学习/深度学习 存储 PyTorch
|

PyTorch + MLFlow 实战:从零构建可追踪的深度学习模型训练系统

本文通过使用 Kaggle 数据集训练情感分析模型的实例,详细演示了如何将 PyTorch 与 MLFlow 进行深度集成,实现完整的实验跟踪、模型记录和结果可复现性管理。文章将系统性地介绍训练代码的核心组件,展示指标和工件的记录方法,并提供 MLFlow UI 的详细界面截图。

509 2
|
11月前
|
存储 数据可视化 搜索推荐
|

数据可视化实战:如何采集并分析马蜂窝上的热门旅游信息?

通过自动化工具抓取马蜂窝旅游数据,分析杭州热门景点与用户关注焦点,生成排行榜和词云图。项目采用低成本方案,结合Playwright模拟浏览器行为采集信息,并用Python处理数据、绘制图表。结果显示西湖、灵隐寺等为热门景点,游客多关注门票、交通等问题。此方法简单高效,适合个性化旅行攻略分析。

832 8
|
11月前
|
机器学习/深度学习 自然语言处理 并行计算
|

提升长序列建模效率:Mamba+交叉注意力架构完整指南

本文探讨了Mamba架构中交叉注意力机制的集成方法,Mamba是一种基于选择性状态空间模型的新型序列建模架构,擅长处理长序列。通过引入交叉注意力,Mamba增强了多模态信息融合和条件生成能力。文章从理论基础、技术实现、性能分析及应用场景等方面,详细阐述了该混合架构的特点与前景,同时分析了其在计算效率、训练稳定性等方面的挑战,并展望了未来优化方向,如动态路由机制和多模态扩展,为高效序列建模提供了新思路。

873 1
|
11月前
|
JSON API 开发者
|

深入浅出:拼多多商品列表API接口Python攻略

拼多多是中国领先的社交电商平台,为开发者提供了丰富的API接口,用于集成商品数据到第三方应用。通过Python可以轻松调用这些API获取商品列表。主要步骤包括:1) 安装必要库(如`requests`);2) 使用AppKey和AppSecret获取访问令牌;3) 调用商品列表API,传入参数如商品ID、页码等;4) 解析返回的JSON数据提取所需信息。按照此流程,开发者能够快速实现与拼多多平台的数据交互。

765 3
|
11月前
|
算法
|

基于PSO粒子群优化的多无人机路径规划matlab仿真,对比WOA优化算法

本程序基于粒子群优化(PSO)算法实现多无人机路径规划,并与鲸鱼优化算法(WOA)进行对比。使用MATLAB2022A运行,通过四个无人机的仿真,评估两种算法在能耗、复杂度、路径规划效果及收敛曲线等指标上的表现。算法原理源于1995年提出的群体智能优化,模拟鸟群觅食行为,在搜索空间中寻找最优解。环境建模采用栅格或几何法,考虑避障、速度限制等因素,将约束条件融入适应度函数。程序包含初始化粒子群、更新速度与位置、计算适应度值、迭代优化等步骤,最终输出最优路径。

484 2
|
12月前
|
人工智能 安全 Shell
|

Jupyter MCP服务器部署实战:AI模型与Python环境无缝集成教程

Jupyter MCP服务器基于模型上下文协议(MCP),实现大型语言模型与Jupyter环境的无缝集成。它通过标准化接口,让AI模型安全访问和操作Jupyter核心组件,如内核、文件系统和终端。本文深入解析其技术架构、功能特性及部署方法。MCP服务器解决了传统AI模型缺乏实时上下文感知的问题,支持代码执行、变量状态获取、文件管理等功能,提升编程效率。同时,严格的权限控制确保了安全性。作为智能化交互工具,Jupyter MCP为动态计算环境与AI模型之间搭建了高效桥梁。

774 2
|
12月前
|
机器学习/深度学习 数据采集 JavaScript
|

用深度学习提升DOM解析——自动提取页面关键区块

本文介绍了一次二手车数据爬虫事故的解决过程,从传统XPath方案失效到结合深度学习语义提取的成功实践。面对懂车帝平台的前端异步渲染和复杂DOM结构,通过Playwright动态渲染、代理IP隐藏身份,以及BERT模型对HTML块级语义识别,实现了稳定高效的字段提取。此方法抗结构变化能力强,适用于复杂网页数据采集,如二手车、新闻等领域。架构演进从静态爬虫到动态爬虫再到语义解析,显著提升效率与稳定性。

440 13
|
12月前
|
机器学习/深度学习 Python
|

拯救数据不平衡:imbalanced-learn库详解

当你的数据像翘翘板一样严重倾斜时,该如何挽救你的机器学习模型?本文详解imbalanced-learn库的四大绝招,帮你轻松应对数据不平衡问题,提升模型性能。

665 8
|
12月前
|
数据可视化 数据挖掘 数据安全/隐私保护
|

Python实现时间序列动量策略:波动率标准化让量化交易收益更平稳

时间序列动量策略(TSMOM)是一种基于资产价格趋势的量化交易方法,通过建立多头或空头头寸捕捉市场惯性。然而,传统TSMOM策略因风险敞口不稳定而面临收益波动问题。波动率调整技术通过动态调节头寸规模,维持恒定风险水平,优化了策略表现。本文系统分析了波动率调整TSMOM的原理、实施步骤及优势,强调其在现代量化投资中的重要地位,并探讨关键参数设定与实际应用考量,为投资者提供更平稳的风险管理体验。

683 4
|
1月前
|
数据采集 JSON 安全
|

解决 Python 爬虫代理 407 错误:基于 urllib3 更新与爬虫代理的实战指南

在使用Python Requests库进行爬虫开发时,urllib3 1.26+版本对代理认证header格式严格校验可能导致407错误。解决方案包括:1. 正确构造Base64认证头;2. 使用标准代理URL自动解析;3. 临时降级urllib3。上线前需严格验证结果。

128 1
|
1月前
|
存储 算法 BI
|

【图像加密】基于matlab混沌算法图像加密解密

本文提出一种基于逐段线性混沌映射(PWLCM)的图像加密算法。利用混沌系统对初值和参数的极端敏感性、遍历性及伪随机性,生成高安全性密钥流,与图像数据异或加密;通过动态切换控制参数增强抗攻击能力。仿真表明该算法加密效果好、解密准确、密钥空间大、抗初值微扰能力强。(239字)

147 2
|
1月前
|
机器学习/深度学习 搜索推荐 iOS开发
|

TorchEasyRec中INPUT_TILE 环境变量的三个模式

`NPUT_TILE` 是 tzrec 推荐系统在模型导出与在线推理阶段的优化策略,针对“1 用户 → N 商品”场景,避免用户特征重复计算。支持三种模式:`INPUT_TILE=1`(无优化)、`=2`(Embedding前tile)、`=3`(Embedding后tile,计算最优但需拆分Embedding表、依赖FG模式及torchrec,不支持macOS)。

182 6
来自: 智能搜索推荐  版块
|
2月前
|
数据采集 API 调度
|

采集新手必看:选“隧道”还是“API提取”?一文看懂!

文章介绍了Python爬虫的两种代理方式:API提取代理和隧道代理。建议新手或需高并发项目使用隧道代理。提供了Python代码示例,展示如何使用隧道代理和伪装身份。

232 5
|
2月前
|
监控 数据可视化 安全
|

从手动搬运到事件驱动:1949如何改变我对桌面自动化的认知

回顾这段探索,我发现自动化工具的价值不在于取代人,而在于把人从确定性劳动中解放出来,去解决那些不确定的、创造性的问题。无论是用协同自动化工具轻量化部署流程,还是探索多应用协同自动化配置思路,最终目的都是让机器做它擅长的事,让我们做自己擅长的事。

149 2
|
2月前
|
SQL 人工智能 自然语言处理
|

周级交付变分钟级?NoETL 指标平台营销活动分析实战

选择 Aloudata CAN 不仅是选择了一个高效的指标开发平台,更是选择了一条通往智能化数据消费的可靠路径。

198 0
|
2月前
|
安全 Python
|

本地自动化工具 零代码开箱即用 1949AI 适配个人办公单机轻量化运行

本文介绍零代码本地自动化工具的轻量化落地实践,专为个人办公单机场景设计:开箱即用、无需配置、资源占用低、离线运行、安全稳定。支持文件批量重命名、智能归类等高频任务,低配电脑亦流畅执行,零技术基础用户可快速上手。(239字)

741 7
|
2月前
|
自然语言处理 安全 JavaScript
|

Cnfans 反向海淘代购系统搭建经验

面向欧美的淘宝/1688代购集运平台,支持链接粘贴→自动抓取翻译计价→多币种支付→代采合包→国际物流清关→末端派送。集成PayPal/Stripe、4PX等API,采用Vue+FastAPI+Docker技术栈,合规覆盖IOSS、GDPR及仿牌审核,盈利含服务费、物流差价与增值服务。(239字)

274 2
|
3月前
|
人工智能 API Python
|

我用 Python 写诗,居然还挺像那么回事:生成式 AI 在内容创作中的实战玩法

我用 Python 写诗,居然还挺像那么回事:生成式 AI 在内容创作中的实战玩法

299 16
|
3月前
|
数据采集 存储 小程序
|

从踩坑到高效落地:微店商品详情API的实操心得

本文分享电商数据服务商对接微店商品详情API的实战经验:详解OAuth2.0授权、多类型商品字段兼容、滑动窗口限流三大典型坑及解决方案,助力私域电商实现商品/库存/价格实时同步,提升数据准确率至99.5%+。

287 1
|
3月前
|
人工智能 算法 物联网
|

别再骂AI不懂人情世故了,是你没把它“喂”对

春节祝福别再复制粘贴!本文分享如何用30分钟微调Qwen3-32B模型,借助LLaMA-Factory Online平台,注入“关系颗粒度”六维数据(称呼、关系、交往细节等),让AI告别公文腔,学会因人制宜、带梗走心的拜年话——技术不炫技,只为一句刚刚好的祝福。(239字)

276 1
|
3月前
|
数据采集 存储 前端开发
|

Scrapy框架入门指南

Scrapy是Python高性能工业级爬虫框架,基于Twisted异步架构,支持高并发、自动去重、重试与反爬。内置Spider、Item、Pipeline等模块,实现请求调度、数据提取到存储的标准化流程,大幅提升开发效率与系统稳定性。(239字)

382 1
|
3月前
|
安全
|

任务比例设置,如何影响模型的行为偏好

多任务微调中,任务比例绝非简单数据配比,而是塑造模型行为偏好的核心杠杆:它决定模型“更愿成为谁”——影响主任务吸附、风险偏好、风格迁移与隐性遗忘。平均分配最危险,后期微调即“性格旋钮”。比例即价值选择。

197 1
|
3月前
|
存储 并行计算 监控
|

batch size、sequence length 对显存的非线性影响

本文揭示大模型训练OOM的根源:batch size与sequence length并非独立线性因子,而是以乘法甚至平方(如attention的O(L²))方式非线性放大中间态显存。显存不是“用完”,而是被临界点“触发”崩溃。工程调优应优先关注单样本“重量”(length),而非盲目试探batch。

363 12

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69522
内容
128
活动
439957
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务