|
10月前
|
缓存 网络协议 API
|

MyEMS开源能源管理系统核心代码解读014

这是一个基于Python的API应用Dockerfile,使用`python:slim`镜像构建。它安装了必要工具(如nano、telnet),创建了上传文件目录,复制了应用代码,并通过`pip`安装依赖。容器暴露8000端口,使用Gunicorn运行API服务,配置了4个工作进程和600秒超时。适合部署Python API应用,提高可移植性和一致性。

170 4
|
10月前
|
数据采集 移动开发 算法
|

动态与静态结合:抓取移动端新闻数据的探索实践

本文探讨了移动设备上新闻App数据采集的挑战和应对策略。随着App迭代,数据结构变得复杂,今日头条等App的数据多来自动态接口而非静态HTML。应对策略包括界面分析、请求模拟、身份伪装和IP切换。实战案例展示了如何通过H5接口抓取今日头条热门要闻和评论。建议初学者先分析H5页面接口,合理使用代理服务以避免被封锁。文档强调了现代App数据采集需要采用多种技术手段,以应对复杂的数据结构和接口,保证数据采集的稳定性和有效性。

232 12
|
10月前
|
JSON 数据格式 开发者
|

淘宝天猫图片搜索商品接口(附代码示例)

拍立淘图片搜索接口支持开发者通过上传图片或提供图片URL,在淘宝、天猫平台搜索相似商品,适用于商品识别、比价等场景。接口采用POST(上传图片)或GET(图片URL)请求方式,返回JSON格式数据,包含商品ID、标题、价格、卖家信息、销量及图片URL等详情,参数可指定搜索关键词、类目、结果数量等,默认返回20条。

372 3
|
10月前
|
机器学习/深度学习 存储 PyTorch
|

PyTorch + MLFlow 实战:从零构建可追踪的深度学习模型训练系统

本文通过使用 Kaggle 数据集训练情感分析模型的实例,详细演示了如何将 PyTorch 与 MLFlow 进行深度集成,实现完整的实验跟踪、模型记录和结果可复现性管理。文章将系统性地介绍训练代码的核心组件,展示指标和工件的记录方法,并提供 MLFlow UI 的详细界面截图。

422 2
|
10月前
|
数据可视化 算法 数据挖掘
|

Python 3D数据可视化:7个实用案例助你快速上手

本文介绍了基于 Python Matplotlib 库的七种三维数据可视化技术,涵盖线性绘图、散点图、曲面图、线框图、等高线图、三角剖分及莫比乌斯带建模。通过具体代码示例和输出结果,展示了如何配置三维投影环境并实现复杂数据的空间表示。这些方法广泛应用于科学计算、数据分析与工程领域,帮助揭示多维数据中的空间关系与规律,为深入分析提供技术支持。

402 0
|
10月前
|
机器学习/深度学习 存储 算法
|

印刷字体识别系统

一个基于Python的印刷字体识别系统,遵循 GNU_GPL_v3 许可,具备字体倾斜校正、行与字符分割及字符识别功能。采用HOG算法训练SVM模型,使用Chars74K数据集。系统包含简单UI,支持动态加载和结果展示。核心算法包括自适应扩展+连通域辅助的行分割,以及垂直投影+连通域+极小值法细分粘连字符的字符分割。项目文件结构清晰,涵盖图像处理、模型训练与加载等功能模块。

302 6
|
10月前
|
数据管理 数据挖掘 API
|

深入研究:shopee商品列表API接口指南

Shopee 是东南亚和中国台湾地区的跨境电商平台,其开放平台(Shopee Open API)为开发者提供商品数据、店铺管理和订单处理等接口。商品列表 API 为核心功能之一,支持按店铺获取商品列表和搜索平台商品。通过 shop_id 等参数可获取指定店铺商品信息,支持分页与状态筛选;通过关键词、类目 ID 和价格范围等条件可搜索平台商品,适用于构建比价工具和选品分析系统。

483 2
|
10月前
|
算法 安全 Java
|

大学四年学好 Java 拿到 offer 的过来人生成长尾关键词 Java 学习路线分享

这是一篇针对大一学生学习Java的指南,帮助你在大学四年中系统掌握Java,最终成功拿到offer。文章详细介绍了Java的学习路线,包括Java基础(JavaSE)、异常处理、并发多线程(可选)和JVM基础知识。同时提供了具体的学习方法,如观看视频教程、阅读经典书籍和刷技术博客。此外,还给出了简单计算器和多线程打印等应用实例,帮助巩固所学知识。按照此路线认真学习,为未来深入研究和求职打下坚实基础。资源地址:[点击下载](https://pan.quark.cn/s/14fcf913bae6)。

155 1
|
10月前
|
缓存 算法 Java
|

【Java 程序员面试 + 学习指南】覆盖互联网一线大厂 Java 程序员所需面试知识点与技巧

本指南专为Java程序员准备互联网大厂面试而设,涵盖面试知识点与技巧两大部分。知识点包括Java基础(面向对象、集合框架、并发编程)、JVM(内存分区、回收机制、类加载机制)、数据库(MySQL、Redis)、开发框架(Spring、Spring Boot、MyBatis)及其他相关技术(计算机网络、操作系统)。面试技巧涉及简历撰写、项目经验阐述及答题策略,助你全面提升面试成功率。提供资源链接,支持深入学习。

287 4
|
10月前
|
API 开发者
|

鸿蒙NEXT上传图片功能PhotoViewPicker核心功能解析

`PhotoViewPicker` 是鸿蒙系统中用于媒体资源选择的核心组件,通过它可以便捷地实现图片、视频等媒体文件的选择功能。下面从基本用法、参数配置到高级应用进行全面解析:

285 1
|
10月前
|
Java 数据库连接 API
|

互联网大厂校招 JAVA 工程师笔试题解析及常见考点分析

本文深入解析互联网大厂校招Java工程师笔试题,涵盖基础知识(数据类型、流程控制)、面向对象编程(类与对象、继承与多态)、数据结构与算法(数组、链表、排序算法)、异常处理、集合框架、Java 8+新特性(Lambda表达式、Stream API)、多线程与并发、IO与NIO、数据库操作(JDBC、ORM框架MyBatis)及Spring框架基础(IoC、DI、AOP)。通过技术方案讲解与实例演示,助你掌握核心考点,提升解题能力。

374 2
|
10月前
|
定位技术 vr&ar 开发工具
|

戴上VR不是终点,能“沉浸进去”才是——聊聊虚拟现实里的用户体验设计那些事儿

戴上VR不是终点,能“沉浸进去”才是——聊聊虚拟现实里的用户体验设计那些事儿

335 23
|
11月前
|
存储 Rust Go
|

介绍一下这只小水獭 —— Fluss Logo 背后的故事

Fluss是一款开源流存储项目,致力于为Lakehouse架构提供高效的实时数据层。其全新Logo以一只踏浪前行的小水獭为核心形象,象征流动性、适应性和友好性。水獭灵感源于“Fluss”德语中“河流”的含义,传递灵活与亲和力。经过30多版设计迭代,最终呈现动态活力的视觉效果。Fluss计划捐赠给Apache软件基金会,目前已开启孵化提案。社区还推出了系列周边礼品,欢迎加入钉钉群109135004351参与交流!

1023 3
来自: 实时计算 Flink  版块
|
11月前
|
算法 搜索推荐 API
|

京东拍立淘图片搜索 API 接口使用指南:从原理到实践

京东拍立淘图片搜索API,基于先进图像识别技术,支持上传图片、URL或拍摄实物搜索相似商品。其特点包括:搜索便捷高效,用户可快速发起搜索;精准匹配结果,通过算法捕捉商品特征确保准确;数据覆盖广泛,依托京东海量商品资源满足个性化需求;智能推荐拓展,根据用户行为挖掘潜在需求,提升购物体验。

570 2
|
11月前
|
数据采集 机器学习/深度学习 自然语言处理
|

NLP助力非结构化文本抽取:实体关系提取实战

本文介绍了一套基于微博热帖的中文非结构化文本分析系统,通过爬虫代理采集数据,结合NLP技术实现实体识别、关系抽取及情感分析。核心技术包括爬虫模块、请求配置、页面采集和中文NLP处理,最终将数据结构化并保存为CSV文件或生成图谱。代码示例从基础正则规则到高级深度学习模型(如BERT-BiLSTM-CRF)逐步演进,适合初学者与进阶用户调试与扩展,展现了中文NLP在实际场景中的应用价值。

718 3
|
11月前
|
机器学习/深度学习 人工智能 大数据
|

特征越多模型越好?这个AI领域的常识可能是错的

特征选择是机器学习中的"减肥秘方",它能帮助模型去除冗余特征,提高性能并降低计算成本。本文深入浅出地介绍特征选择的概念、方法与实践技巧,带你掌握这门让AI模型更高效的"瘦身术"。

322 1
|
11月前
|
JSON 监控 供应链
|

深度实操:京东商品详情API接入全流程与技术要点剖析

京东商品详情API接口用于获取商品基础信息(标题、价格、库存状态、用户评价等),支持单个或多个商品查询。适用于商品列表展示、竞品分析、价格监控、库存管理、营销活动和数据分析等场景。通过发送HTTP请求(GET/POST)调用接口,服务器返回JSON格式数据,可使用Python等语言解析处理。示例代码中展示了如何用requests库调用API并获取商品详情。

221 4
|
11月前
|
机器学习/深度学习 数据采集 算法
|

大数据加持的预测性维护:让设备故障“未卜先知”

大数据加持的预测性维护:让设备故障“未卜先知”

585 2
|
11月前
|
定位技术 开发者
|

HarmonyOS实战:高德地图自定义定位图标展示

本文详细介绍了在鸿蒙系统中实现地图定位功能的开发流程与注意事项。首先,开发者需要申请两个必要的定位权限,并确保用户手动开启系统设置中的位置权限。接着,通过高德定位获取用户位置信息,并使用自定义图标替代默认的定位箭头。文章特别强调了经纬度数据必须为float类型,否则可能导致定位不准确。此外,还需检查系统的GPS定位按钮是否开启,以确保定位功能正常使用。通过本文的指导,开发者可以避免常见的定位问题,顺利完成地图定位功能的开发。

414 2
|
11月前
|
数据采集 存储 Web App开发
|

逆向音乐APP:Python爬虫获取音乐榜单

逆向音乐APP:Python爬虫获取音乐榜单

681 58
|
11月前
|
前端开发 开发者
|

HarmonyOS实战:自定义时间选择器

在鸿蒙开发中,官方提供的默认时间选择器可能无法满足特定需求。本文分享了自定义时间选择器的实现过程:通过 TextPicker 控件实现年月日及时分的选择,支持默认选中当前时间、精确到时分,并注意闰年计算与日期格式处理。代码中使用 Promise 处理耗时的日期计算,确保显示和逻辑正确。总结指出,尽管看似简单,但需关注时间计算、格式化等细节。快动手试试吧!

420 1
|
11月前
|
机器学习/深度学习 PyTorch 算法框架/工具
|

高效处理多维数组:einsum()函数从入门到精通

本文深入解析了NumPy中的`einsum()`函数,从基础语法到高级应用全面展开。文章首先介绍了爱因斯坦求和约定的数学基础,解释了`einsum()`如何通过简洁的索引符号实现复杂的多维数组运算。

427 5
|
11月前
|
存储 人工智能 API
|

RAG-MCP:基于检索增强生成的大模型工具选择优化框架

RAG-MCP是一种通过检索增强生成技术解决大型语言模型(LLM)工具选择困境的创新框架。它针对提示词膨胀和决策效率低的问题,利用语义检索动态筛选相关工具,显著减少提示词规模并提升准确率。本文深入解析其技术原理,包括外部工具索引构建、查询时检索处理等核心步骤,以及实验评估结果。RAG-MCP不仅优化了LLM的工具使用能力,还为AI代理的发展提供了重要支持,未来可在极端规模检索、多工具工作流等方面进一步探索。

745 16
11月前
|
大数据
|

查询加速 MaxQA 功能解读及使用演示

为满足现代数据分析和业务应用中对低延迟的需求,阿里云推出 MaxQA 查询加速功能,显著减少查询响应时间,适用于 BI 场景、交互式分析以及近实时数仓等对延迟要求高且稳定的场景。​ ​ 本视频为大家介绍MaxQA在性能、稳定性及使用成本上的核心优势以及相较于MCQA1.0的能力升级,还有产品专家实操演示教学。 公测期间可申请100CU(价值15000元)计算资源用于测试(加入钉群申领:87535025714)

463 0
来自: 大数据计算 MaxCompute  版块
|
11月前
|
算法 搜索推荐 vr&ar
|

试衣间OUT!增强现实让购物更丝滑

试衣间OUT!增强现实让购物更丝滑

377 14
|
11月前
|
JSON API 开发者
|

淘宝天猫商品详情API接口攻略

淘宝天猫商品详情API接口是电商开发的重要工具,支持获取商品主图、价格、标题、销量及属性等详细信息。该接口广泛应用于电商数据分析与自动化购物领域。开发者可通过注册淘宝开放平台账号、申请权限并按照流程调用接口,实现商品基础信息、详情描述、图片视频资源、SKU属性及评价数据的查询。示例代码展示了如何使用Python调用此API,帮助快速上手开发。

292 13
|
11月前
|
算法 机器人 数据安全/隐私保护
|

基于双向RRT算法的三维空间最优路线规划matlab仿真

本程序基于双向RRT算法实现三维空间最优路径规划,适用于机器人在复杂环境中的路径寻找问题。通过MATLAB 2022A测试运行,结果展示完整且无水印。算法从起点和终点同时构建两棵随机树,利用随机采样、最近节点查找、扩展等步骤,使两棵树相遇以形成路径,显著提高搜索效率。相比单向RRT,双向RRT在高维或障碍物密集场景中表现更优,为机器人技术提供了有效解决方案。

613 3
|
11月前
|
供应链 安全 物联网
|

5G遇上区块链:速度与信任的完美结合,未来世界的基石

5G遇上区块链:速度与信任的完美结合,未来世界的基石

250 9
|
11月前
|
机器学习/深度学习 算法 搜索推荐
|

数据不忽悠:如何用大数据预测未来?

数据不忽悠:如何用大数据预测未来?

589 12
|
11月前
|
消息中间件 监控 5G
|

5G+智能家居:让生活更智慧、更畅快

5G+智能家居:让生活更智慧、更畅快

457 7
|
11月前
|
分布式计算 运维 大数据
|

5G+大数据:这不是“快上加快”,而是“聪明加聪明”

5G+大数据:这不是“快上加快”,而是“聪明加聪明”

221 13
|
11月前
|
机器学习/深度学习 人工智能 算法
|

“别让模型坑了人”:数据科学中的那些伦理雷区

“别让模型坑了人”:数据科学中的那些伦理雷区

298 16
|
11月前
|
SQL 机器学习/深度学习 算法
|

【数分基本功】 两种不同的用户活跃度,留存率居然完全一致!

两种不同的用户活跃度,留存率居然完全一致。这究竟是为什么?欢迎阅读【数分基本功】系列的第 1 篇。该系列会讲一些数据分析的基本问题,必要时增加拓展和深入

415 21
|
12月前
|
API 分布式计算 MaxCompute
|

MaxCompute 是否有RESTful API文档?

152 1
来自:大数据计算 MaxCompute 版块
|
12月前
|
数据采集 Web App开发 iOS开发
|

Python 爬虫如何伪装 Referer?从随机生成到动态匹配

Python 爬虫如何伪装 Referer?从随机生成到动态匹配

702 2
|
12月前
|
传感器 人工智能 边缘计算
|

5G+智慧城市:让城市自己“思考”的时代来了!

5G+智慧城市:让城市自己“思考”的时代来了!

387 12
|
12月前
|
自动驾驶 安全 物联网
|

5G加持自动驾驶:从“聪明”到“智慧”的进化

5G加持自动驾驶:从“聪明”到“智慧”的进化

387 8
|
12月前
|
机器学习/深度学习 搜索推荐 测试技术
|

ReSearch:基于强化学习的大语言模型推理搜索框架

ReSearch是一种创新框架,利用强化学习训练大语言模型执行“推理搜索”,无需监督数据。它将搜索操作融入推理链,通过文本推理决定搜索时机与方式,并用搜索结果引导后续推理。研究显示,ReSearch自然形成高级推理能力,如反思与自我纠正。技术上,采用特定标签封装搜索查询与结果,迭代生成响应。实验基于Qwen2.5等模型,使用MuSiQue数据集训练,在多跳问答任务中显著超越基线模型,展现出强大泛化能力。动态分析表明,模型逐渐学会通过迭代搜索解决复杂问题,奖励指标也呈现稳定增长趋势。

553 1
|
12月前
|
Web App开发 前端开发 JavaScript
|

如何模拟浏览器行为获取网页中的隐藏表单数据?

如何模拟浏览器行为获取网页中的隐藏表单数据?

354 5
|
12月前
|
算法 安全 数据安全/隐私保护
|

基于AES的遥感图像加密算法matlab仿真

本程序基于MATLAB 2022a实现,采用AES算法对遥感图像进行加密与解密。主要步骤包括:将彩色图像灰度化并重置大小为256×256像素,通过AES的字节替换、行移位、列混合及轮密钥加等操作完成加密,随后进行解密并验证图像质量(如PSNR值)。实验结果展示了原图、加密图和解密图,分析了图像直方图、相关性及熵的变化,确保加密安全性与解密后图像质量。该方法适用于保护遥感图像中的敏感信息,在军事、环境监测等领域具有重要应用价值。

474 35
|
12月前
|
消息中间件 存储 监控
|

Lalamove基于Flink实时湖仓演进之路

本文由货拉拉国际化技术部资深数据仓库工程师林海亮撰写,围绕Flink在实时数仓中的应用展开。文章首先介绍了Lalamove业务背景,随后分析了Flink在实时看板、数据服务API、数据监控及数据分析中的应用与挑战,如多数据中心、时区差异、上游改造频繁及高成本问题。接着阐述了实时数仓架构从无分层到引入Paimon湖仓的演进过程,解决了数据延迟、兼容性及资源消耗等问题。最后展望未来,提出基于Fluss+Paimon优化架构的方向,进一步提升性能与降低成本。

421 11
来自: 实时计算 Flink  版块
|
12月前
|
数据采集 存储 JSON
|

用Python爬虫抓取数据并保存为JSON的完整指南

用Python爬虫抓取数据并保存为JSON的完整指南

749 3
|
12月前
|
数据采集 数据可视化 大数据
|

Python入门修炼:开启你在大数据世界的第一个脚本

Python入门修炼:开启你在大数据世界的第一个脚本

228 6
|
1月前
|
Java
|

java工具:日期毫秒数转日期字符串

java工具:日期毫秒数转日期字符串

122 6
|
2月前
|
人工智能 自然语言处理 小程序
|

你的祝福AI真的好吗?三个维度量化“走心”的秘密

春节将至,AI祝福工具泛滥,但真“走心”吗?本文揭秘评估关键:**事实准确性**(细节不编造)、**风格契合度**(对父母/老板用不同语气)、**表达自然度**(像人话,不堆成语)。告别BLEU等传统指标,用三维标准科学打分,避开“智商税”。

144 4
|
2月前
|
运维 监控 安全
|

NTP时间同步服务器:安徽京准助力公共资源交易中心

安徽京准为公共资源交易中心提供NTP时间同步解决方案,践行“时间即证据,同步即公平”理念。通过北斗/GPS双模授时、分层同步架构,确保投标截止、自动开标、日志审计等关键环节时间毫秒级统一,夯实电子化交易的法律效力、公正性与等保合规基础。(239字)

104 0
|
2月前
|
数据库 C++
|

向量维度、距离函数,如何影响召回结果

本文揭示向量检索效果不佳的根源常被误判:问题不在embedding模型本身,而在于被忽视的底层选择——向量维度与距离函数。二者共同定义了“相似性”的本质,而非仅调节精度。维度决定语义表达自由度与错误类型,距离函数(L2/Cosine/Dot)则确立“何为相近”的世界观。二者强耦合,直接塑造召回空间。调参前,先问:你更怕漏召,还是误召?

119 6
|
2月前
|
安全 数据挖掘 C++
|

基于语义切分 vs 基于结构切分的实际差异

RAG系统中,切分方式并非简单预处理,而是决定系统“如何犯错”的关键设计:语义切分将理解责任前置给embedding,易致“看错”;结构切分保留原文约束,暴露“没看到”,更可控。选型应基于错误成本,而非召回指标。

104 12

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69319
内容
128
活动
439806
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务