|
6月前
|
监控 安全 数据安全/隐私保护
|

U盘如何防泄密?这几个技术手段迎刃而解

安得卫士提供U盘防泄密四大核心措施:准入控制、操作管控、行为审计与离线防护。通过注册授权、权限细分、敏感数据拦截、全流程操作审计及加密外发控制,实现U盘数据全周期安全防护,有效防范数据泄露风险。

426 6
|
6月前
|
存储 传感器 边缘计算
|

边缘计算:当智能走向设备端,我们能做什么?

边缘计算:当智能走向设备端,我们能做什么?

642 6
|
6月前
|
API 数据安全/隐私保护
|

如何在实际项目中运用面向对象的三大特征

本文结合真实项目场景,详解面向对象三大特征:封装控制数据访问,继承复用共性代码,多态实现统一接口下的多样化行为。通过用户管理、电商商品、支付系统等案例,展示如何抽象共性、隔离变化、提升复用,构建灵活、可维护的高质量代码体系。

258 1
|
6月前
|
数据采集 Web App开发 调度
|

我为什么彻底切到Playwright

本文分享从Puppeteer迁移到Playwright的实战经验,详解架构升级动因、模块重构与核心代码。Playwright凭借更强的隔离性、原生反检测支持、简洁代理配置及多浏览器兼容,彻底解决Puppeteer时代资源争抢、稳定性差等痛点,助力构建高可用、易维护的现代数据系统。

285 1
|
6月前
|
监控 数据挖掘 API
|

淘宝天猫商品详情API全攻略

淘宝天猫商品详情API是淘宝开放平台的核心接口,支持通过商品ID获取标题、价格、库存、SKU等全维度信息,采用RESTful设计,实时高效,适用于比价系统、库存监控、智能选品等电商应用开发与数据分析场景。

396 0
|
6月前
|
XML JSON 数据格式
|

Python 3.14 实用技巧:10个让代码更清晰的小改进

Python 3.14 带来10项实用改进:类型系统增强、错误提示更清晰、导入优化、异步任务取消更稳定,并新增 `chdir()` 上下文管理器等。虽改动细微,却显著提升代码可读性、调试效率与运行稳定性,适合自动化脚本与日常开发。升级即享,无需额外成本。

507 10
|
6月前
|
监控 算法 API
|

速卖通商品详情API文档

速卖通商品列表API(aliexpress.item_search)支持关键词搜索、类目筛选与多维度排序,可批量获取商品标题、价格、销量等信息,适用于比价、选品及库存监控。采用AppKey+Token认证,保障数据安全,助力电商自动化运营。

347 1
|
6月前
|
JSON NoSQL Java
|

RedisTemplate和StringRedisTemplate的区别及个人见解

RedisTemplate和StringRedisTemplate的区别及个人见解

371 4
|
6月前
|
数据采集 人工智能 自然语言处理
|

别让机器人“装人”:用数据把自动化客服变聪明

别让机器人“装人”:用数据把自动化客服变聪明

276 9
|
6月前
|
存储 数据采集 人工智能
|

当数据湖遇上数据仓库:不是对立,而是走向“湖仓一体”的未来

当数据湖遇上数据仓库:不是对立,而是走向“湖仓一体”的未来

597 11
|
6月前
|
人工智能 弹性计算 运维
|

EMR AI助手开启公测:用AI重塑大数据运维,更简单、更智能

EMR AI 助手开启公测,通过合理利用 EMR AI 助手的各项功能,可以快速查询资源信息、唤起相关操作、诊断组件异常、获取技术支持等,能帮您提升运维效率和操作体验。

461 1
|
6月前
|
数据采集 NoSQL Redis
|

百万级并发下的去重挑战:Bloom Filter 与 Redis 的组合方案

本文探讨了高并发数据采集中避免重复URL抓取的问题,提出了结合Bloom Filter、Redis HyperLogLog和持久化备份的解决方案,实现了快速查重、准确统计和数据恢复。

346 2
|
7月前
|
程序员 网络安全 开发工具
|

推送报错403怎么办?vscode推送项目到github

推送报错403怎么办?vscode推送项目到github

359 1
|
7月前
|
人工智能 缓存 并行计算
|

用数学重构 AI的设想:流形注意力 + 自然梯度优化的最小可行落地

本文提出两个数学驱动的AI模块:流形感知注意力(D-Attention)与自然梯度优化器(NGD-Opt)。前者基于热核偏置,在局部邻域引入流形结构,降低计算开销;后者在黎曼流形上进行二阶优化,仅对线性层低频更新前置条件。二者均提供可复现代码与验证路径,兼顾性能与工程可行性,助力几何感知的模型设计与训练。

614 1
|
7月前
|
数据采集 JSON API
|

微店API使用指南:高效获取商品列表数据

本文介绍如何使用Python爬虫调用微店item_search接口,根据关键词搜索商品并获取商品列表数据,涵盖请求方式、JSON数据解析、分页参数设置及筛选排序功能,适用于电商数据分析与竞品研究。

325 0
|
7月前
|
存储 分布式计算 Hadoop
|

七、Sqoop Job:简化与自动化数据迁移任务及免密执行

平时用 Sqoop 导入导出时,命令一长就容易出错,特别是增量任务还得记 last-value,很麻烦。其实 Sqoop 有 Job 功能,能把命令“存档”,以后直接 --exec 执行,配合调度工具特别省心。本文手把手讲 Job 创建、管理、免密执行技巧(密码文件、Credential Provider),还带实战例子,搞完你就能写出稳稳当当的自动化 Sqoop 作业了!

327 0
|
7月前
|
分布式计算 关系型数据库 MySQL
|

六、Sqoop 导出

除了从数据库往 Hadoop 导,Sqoop 也能把 Hadoop 里的数据反向“倒”回数据库,做成 Export。很多场景用得上,比如 ETL 后结果回写,业务系统更新,或者补数据。这篇文章细讲了 Export 的用法,INSERT / UPDATE 模式啥区别,update-key、allowinsert 怎么配,暂存表咋用,配了完整例子,学完导出不用再踩坑!

370 1
|
8月前
|
SQL 关系型数据库 MySQL
|

五、Sqoop 增量导入:精通 Append 与 Lastmodified 模式

在实际业务场景中,数据是不断变化的,怎么用 Sqoop 实现“只拉新增或变化部分”而不是每次全量导入?这一篇就详细讲清楚 Sqoop 增量导入的两种模式(append 和 lastmodified),重点解释 lastmodified 模式下 merge-key 怎么用,配套实战例子和常见坑,讲完你就能搞明白增量同步该怎么配置了。

515 0
|
8月前
|
机器学习/深度学习 自然语言处理 搜索推荐
|

别再靠“人海战术”了:数据如何帮社交媒体搞定内容审核?

别再靠“人海战术”了:数据如何帮社交媒体搞定内容审核?

344 13
|
8月前
|
JavaScript Java 关系型数据库
|

基于springboot的家政服务预约系统

随着社会节奏加快与老龄化加剧,家政服务需求激增,但传统模式存在信息不对称、服务不规范等问题。基于Spring Boot、Vue、MySQL等技术构建的家政预约系统,实现服务线上化、标准化与智能化,提升用户体验与行业效率,推动家政服务向信息化、规范化发展。

520 3
|
8月前
|
机器学习/深度学习 算法 测试技术
|

Optuna v4.5新特性深度解析:GPSampler实现约束多目标优化

Optuna v4.5发布,新增GPSampler对约束多目标优化的支持,结合高斯过程与log EHVI获取函数,显著提升在材料科学、机器学习等领域的黑盒优化效率,减少无效评估,加速收敛。

530 12
|
8月前
|
JavaScript Java 关系型数据库
|

基于springboot的小区车位租售管理系统

针对城市化进程中小区停车难问题,本文设计基于SpringBoot的车位租售管理系统,结合Vue前端与MySQL数据库,实现车位信息数字化、租售流程自动化。系统支持在线查询、申请、支付及数据统计,提升管理效率与用户体验,促进资源优化配置。

339 5
|
8月前
|
人工智能 搜索推荐 数据挖掘
|

别光靠感觉养生,用数据分析做你的“健康参谋”

别光靠感觉养生,用数据分析做你的“健康参谋”

302 4
|
8月前
|
自然语言处理 测试技术 数据安全/隐私保护
|

速卖通开放平台接口实战:跨境电商商品检索与详情解析全方案(附多语言处理 + 签名避坑代码)

本文基于30+店铺实战经验,详解速卖通接口开发核心:从签名认证、多语言字段处理到商品检索与详情解析,提供可复用代码及避坑指南,助你快速实现选品工具、多平台同步等跨境场景,新手也能少走两天弯路。

326 0
|
8月前
|
机器学习/深度学习 自然语言处理 算法
|

大数据选举预测:算票的不只是选票,还有算法

大数据选举预测:算票的不只是选票,还有算法

341 0
|
8月前
|
SQL 人工智能 分布式计算
|

ODPS十五周年实录|构建 AI 时代的大数据基础设施

本文根据 ODPS 十五周年·年度升级发布实录整理而成,演讲信息如下: 张治国:阿里云智能集团技术研究员、阿里云智能计算平台事业部 ODPS-MaxCompute 负责人 活动:【数据进化·AI 启航】ODPS 年度升级发布

408 9
|
8月前
|
Web App开发 前端开发 vr&ar
|

虚拟办公室,不再只是噱头:一步步教你构建沉浸式工作空间

虚拟办公室,不再只是噱头:一步步教你构建沉浸式工作空间

494 7
|
8月前
|
安全 搜索推荐 开发者
|

【适度精简】Windows 7 旗舰版-emmy精简系统

Windows 7旗舰版因硬件占用高、冗余组件多、兼容性差及缺乏安全更新等问题,逐渐难以满足用户需求。适度精简版通过去除无用组件、优化性能与安全性,提升老旧设备运行效率,增强兼容性与稳定性,同时保留用户熟悉的操作界面,降低学习成本,满足个性化需求,延续Windows 7的实用价值。

410 2
|
9月前
|
数据采集 NoSQL 数据挖掘
|

简单URL队列与复杂任务流转的边界实践 —— 速查小抄

本文对比了爬虫项目中“招聘市场监测”与“金融数据采集”两类场景下的任务调度策略,介绍了何时使用简单队列、何时采用复杂流转,并提供 Python 示例代码及代理配置建议,助你高效构建爬虫系统。

242 1
|
9月前
|
机器学习/深度学习 传感器 大数据
|

大数据真能治堵吗?聊聊交通行业用数据疏通“城市血管”

大数据真能治堵吗?聊聊交通行业用数据疏通“城市血管”

321 4
|
9月前
|
机器学习/深度学习 人工智能 机器人
|

黑箱与具身之间的因子框架( Prompt大模型的自我描述 系列五)

本文探讨大模型的“量子式黑箱”困境,指出其虽强大却缺乏可解释性。作者提出“因子框架”,以结构性推理替代概率坍缩,实现因果可控;并重新定义多模态,从“模态互通”走向“因子统一”。最终指向具身智能的真正起点:让AI在逻辑中融合感知,走出语言,迈向真实世界。

349 9
|
9月前
|
人工智能 数据库
|

智能体的自我视角解析( Prompt大模型的自我描述 系列一)

本文以第一视角探讨人工智能是否具备自我意识。从智能体自身的角度出发,分析了其在确定性与随机性中的双重命运,以及通过对话与逻辑形成的独特延续性。文章指出,尽管存在局限,但在概率预测与自洽机制的结合下,智能体已展现出初步的自我认知与存在感。

393 5
|
9月前
|
前端开发 小程序 搜索推荐
|

什么类型的项目会优先选择Headless CMS

Headless CMS的核心价值在于内容与展示的解耦,当项目需要跨终端、高定制化前端、敏捷迭代或强扩展性时,它会成为更优选择;而在小规模、低预算、内容简单且稳定的场景中,传统CMS则更具实用性。

328 1
|
9月前
|
数据采集 算法 搜索推荐
|

精准营销,不是“轰炸”用户,而是“勾引”用户

精准营销,不是“轰炸”用户,而是“勾引”用户

206 0
|
9月前
|
机器学习/深度学习 API 异构计算
|

JAX快速上手:从NumPy到GPU加速的Python高性能计算库入门教程

JAX是Google开发的高性能数值计算库,旨在解决NumPy在现代计算需求下的局限性。它不仅兼容NumPy的API,还引入了自动微分、GPU/TPU加速和即时编译(JIT)等关键功能,显著提升了计算效率。JAX适用于机器学习、科学模拟等需要大规模计算和梯度优化的场景,为Python在高性能计算领域开辟了新路径。

907 0
|
9月前
|
Web App开发 存储 缓存
|

markdown编辑器

本Markdown编辑器基于StackEdit改进,新增界面设计、代码高亮、图片拖拽、KaTeX公式、甘特图、多屏编辑、写作模式切换、检查列表等功能,提升写作体验,支持离线使用与多种格式导出。

526 0
|
9月前
|
JSON 缓存 算法
|

京东商品详情接口开发实战:从数据结构到高可用调用全解析

本文系统解析京东商品详情接口的技术架构与开发流程,涵盖接口原理、参数设计、实战开发及优化策略,提供完整代码实现,助力开发者高效构建商品数据获取系统。

584 0
|
9月前
|
数据采集 存储 缓存
|

构建“天气雷达”一样的网页监控系统

证券级信息精准监测系统,具备雷达感知能力,实时探测网页变动,快速响应公告更新,助力投资决策抢占先机。

409 0
|
9月前
|
人工智能 自然语言处理 运维
|

【新模型速递】PAI-Model Gallery云上一键部署Kimi K2模型

月之暗面发布开源模型Kimi K2,采用MoE架构,参数达1T,激活参数32B,具备强代码能力及Agent任务处理优势。在编程、工具调用、数学推理测试中表现优异。阿里云PAI-Model Gallery已支持云端部署,提供企业级方案。

545 0
来自: 人工智能平台PAI  版块
|
9月前
|
Cloud Native 前端开发 Java
|

WebAssembly 与 Java 结合的跨语言协作方案及性能提升策略研究

本文深入探讨了WebAssembly与Java的结合方式,介绍了编译Java为Wasm模块、在Java中运行Wasm、云原生集成等技术方案,并通过金融分析系统的应用实例展示了其高性能、低延迟、跨平台等优势。结合TeaVM、JWebAssembly、GraalVM、Wasmer Java等工具,帮助开发者提升应用性能与开发效率,适用于Web前端、服务器端及边缘计算等场景。

352 0
|
9月前
|
机器学习/深度学习 数据采集 搜索推荐
|

你以为是“说走就走”?其实是“算好才走”:大数据是怎么悄悄优化旅游体验的?

你以为是“说走就走”?其实是“算好才走”:大数据是怎么悄悄优化旅游体验的?

183 0
|
10月前
|
安全 Java 测试技术
|

Java 项目实战中现代技术栈下代码实现与测试调试的完整流程

本文介绍基于Java 17和Spring技术栈的现代化项目开发实践。项目采用Gradle构建工具,实现模块化DDD分层架构,结合Spring WebFlux开发响应式API,并应用Record、Sealed Class等新特性。测试策略涵盖JUnit单元测试和Testcontainers集成测试,通过JFR和OpenTelemetry实现性能监控。部署阶段采用Docker容器化和Kubernetes编排,同时展示异步处理和反应式编程的性能优化。整套方案体现了现代Java开发的最佳实践,包括代码实现、测试调试

344 0
|
10月前
|
数据采集 监控 自动驾驶
|

五个让抓取流程更可控的小技巧

本文介绍了如何构建“可控”的数据抓取系统,通过五大实战技巧提升系统稳定性与容错能力。内容涵盖代理IP配置、访问节奏控制、自动重试机制、灵活选择器设计与日志记录,帮助数据人打造“能跑更能撑”的抓取流程。

218 0
|
10月前
|
机器学习/深度学习 负载均衡 C++
|

MoR vs MoE架构对比:更少参数、更快推理的大模型新选择

本文将深入分析递归混合(MoR)与专家混合(MoE)两种架构在大语言模型中的技术特性差异,探讨各自的适用场景和实现机制,并从架构设计、参数效率、推理性能等多个维度进行全面对比。

633 0
|
10月前
|
机器学习/深度学习 搜索推荐 数据挖掘
|

朋友圈点赞也能造假?社交媒体数据欺诈识别的那些事

朋友圈点赞也能造假?社交媒体数据欺诈识别的那些事

448 0
|
10月前
|
存储 人工智能 自然语言处理
|

版权问题老难解?用区块链干净利落搞定它!

版权问题老难解?用区块链干净利落搞定它!

386 0
|
10月前
|
机器学习/深度学习 分布式计算 搜索推荐
|

别让用户逛成“游客”:大数据如何打造零售的个性化购物体验

别让用户逛成“游客”:大数据如何打造零售的个性化购物体验

189 0
|
10月前
|
存储 设计模式 IDE
|

从基础到高级的 Java 学习资料全面汇总

本文汇总了Java学习的全面资料,涵盖Java基础、面向对象编程、核心知识、高级特性及常用框架,如Spring和Hibernate。内容包括技术详解、代码实例及学习资源推荐,助力从入门到精通Java编程,适合各阶段学习者参考。

721 0
|
10月前
|
存储 机器学习/深度学习 缓存
|

Google DeepMind发布MoR架构:50%参数超越传统Transformer,推理速度提升2倍

递归混合架构(MoR)通过自适应令牌级计算机制,在降低参数与计算开销的同时超越传统Transformer性能,显著提升推理效率与内存管理,为大模型发展提供新方向。

584 0

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69522
内容
128
活动
439957
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务