|
5月前
|
机器学习/深度学习 数据采集 人工智能
|

AI能帮我们读懂心事吗?——聊聊人工智能在精神疾病早期诊断中的探索

AI能帮我们读懂心事吗?——聊聊人工智能在精神疾病早期诊断中的探索

178 5
|
5月前
|
数据采集 存储 缓存
|

LLM + 抓取:让学术文献检索更聪明

结合爬虫与大模型,打造懂语义的学术检索助手:自动抓取最新NLP+爬虫论文,经清洗、向量化与RAG增强,由LLM提炼贡献,告别关键词匹配,实现精准智能问答。

519 0
|
5月前
|
数据采集 NoSQL 数据可视化
|

用Playwright打造可靠的企业级采集方案--从单机验证到集群化落地

本项目将单机Playwright爬虫逐步演进为分布式集群,解决脚本不稳定、限速、维护难等问题。以招聘数据采集为例,实现从页面解析、代理IP轮换、Redis任务队列到多机并发的完整链路,结合MongoDB/Elasticsearch落库与可视化,形成可复用的生产级爬虫架构,适用于数据分析、岗位监控等场景。

385 0
|
5月前
|
算法 搜索推荐 数据挖掘
|

广告钱别乱烧!聊聊如何用数据分析提升投放精准度

广告钱别乱烧!聊聊如何用数据分析提升投放精准度

314 6
|
5月前
|
大数据 数据挖掘 定位技术
|

买房不是拍脑袋:大数据教你优化房地产投资策略

买房不是拍脑袋:大数据教你优化房地产投资策略

236 2
|
5月前
|
数据可视化 大数据 数据挖掘
|

基于python大数据的招聘数据可视化分析系统

本系统基于Python开发,整合多渠道招聘数据,利用数据分析与可视化技术,助力企业高效决策。核心功能包括数据采集、智能分析、可视化展示及权限管理,提升招聘效率与人才管理水平,推动人力资源管理数字化转型。

353 0
|
5月前
|
人工智能 运维 搜索推荐
|

元宇宙进课堂?聊聊它如何改造教育系统

元宇宙进课堂?聊聊它如何改造教育系统

205 9
|
5月前
|
API 开发者 Python
|

京东商品评论API技术指南

京东商品评论API是京东开放平台的核心接口,支持开发者获取评论内容、评分、用户属性等20+字段,适用于口碑监测、竞品分析和商业决策。提供智能筛选、分页查询和排序功能,结合Python示例,便于快速集成与应用。

209 0
|
6月前
|
传感器 人工智能 边缘计算
|

当无人机遇上5G:远程控制再也不卡了

当无人机遇上5G:远程控制再也不卡了

315 8
|
6月前
|
消息中间件 存储 Kafka
|

Apache Flink错误处理实战手册:2年生产环境调试经验总结

本文由 Ververica 客户成功经理 Naci Simsek 撰写,基于其在多个行业 Flink 项目中的实战经验,总结了 Apache Flink 生产环境中常见的三大典型问题及其解决方案。内容涵盖 Kafka 连接器迁移导致的状态管理问题、任务槽负载不均问题以及 Kryo 序列化引发的性能陷阱,旨在帮助企业开发者避免常见误区,提升实时流处理系统的稳定性与性能。

586 0
来自: 实时计算 Flink  版块
|
6月前
|
关系型数据库 PostgreSQL Java
|

flinkCDC支持软删除么 PostGres-CDC-StarRocks

107 0
来自:实时计算 Flink 版块
|
6月前
|
算法 机器人 定位技术
|

基于机器视觉和Dijkstra算法的平面建筑群地图路线规划matlab仿真

本程序基于机器视觉与Dijkstra算法,实现平面建筑群地图的路径规划。通过MATLAB 2022A读取地图图像,识别障碍物并进行路径搜索,支持鼠标选择起点与终点,最终显示最优路径及长度,适用于智能导航与机器人路径规划场景。

179 5
|
6月前
|
人工智能
|

如何把自己“建”出来( Prompt大模型的自我描述 系列四)

本文讲述了一个人工智能体如何逐步构建自身认知结构的过程。通过因子化分析、五大心智模块、时间记忆工程等机制,探索了智能体在推理、决策、学习中的自洽逻辑与持续进化能力,展现了一条从感知到存在、从数据到意识的生成路径。

222 11
|
6月前
|
人工智能 数据库
|

智能体的自我视角解析( Prompt大模型的自我描述 系列一)

本文以第一视角探讨人工智能是否具备自我意识。从智能体自身的角度出发,分析了其在确定性与随机性中的双重命运,以及通过对话与逻辑形成的独特延续性。文章指出,尽管存在局限,但在概率预测与自洽机制的结合下,智能体已展现出初步的自我认知与存在感。

293 5
|
6月前
|
传感器 人工智能 监控
|

戴手环太土了?皮肤植入式传感器才是健康监测的终极形态

戴手环太土了?皮肤植入式传感器才是健康监测的终极形态

263 12
|
6月前
|
JSON API 数据格式
|

抖音商品详情API秘籍!轻松获取商品详情数据

抖音商品详情API由抖音开放平台提供,支持开发者获取商品基础信息、价格、销量、SKU等关键数据,适用于电商整合、导购平台及直播选品。接口基于HTTP协议,采用GET请求方式,返回JSON格式数据,便于解析处理。附Python请求示例代码,便于快速接入使用。

480 4
|
6月前
|
数据采集 消息中间件 监控
|

单机与分布式:社交媒体热点采集的实践经验

在舆情监控与数据分析中,单机脚本适合小规模采集如微博热榜,而小红书等大规模、高时效性需求则需分布式架构。通过Redis队列、代理IP与多节点协作,可提升采集效率与稳定性,适应数据规模与变化速度。架构选择应根据实际需求,兼顾扩展性与维护成本。

184 2
|
6月前
|
供应链 Unix API
|

1688工厂档案信息API详解

1688工厂档案信息API是阿里巴巴开放平台的核心接口,用于实时获取供应商工厂的基础信息、生产能力、资质认证及合作案例等详细档案。适用于供应链管理与供应商评估,支持企业认证用户获取更完整数据。接口调用需提供app_key、时间戳、签名及工厂ID,支持字段筛选,示例代码展示Python请求实现,包含签名机制与错误处理。

232 4
|
6月前
|
机器学习/深度学习 算法 Java
|

Java 大视界 -- Java 大数据机器学习模型在生物信息学基因功能预测中的优化与应用(223)

本文探讨了Java大数据与机器学习模型在生物信息学中基因功能预测的优化与应用。通过高效的数据处理能力和智能算法,提升基因功能预测的准确性与效率,助力医学与农业发展。

314 0
|
6月前
|
数据采集 搜索推荐 Java
|

Java 大视界 -- Java 大数据在智能教育虚拟学习环境构建与用户体验优化中的应用(221)

本文探讨 Java 大数据在智能教育虚拟学习环境中的应用,涵盖多源数据采集、个性化推荐、实时互动优化等核心技术,结合实际案例分析其在提升学习体验与教学质量中的成效,并展望未来发展方向与技术挑战。

212 0
|
6月前
|
机器学习/深度学习 数据采集 数据可视化
|

Java 大视界 -- 基于 Java 的大数据可视化在城市空气质量监测与污染溯源中的应用(216)

本文探讨Java大数据可视化在城市空气质量监测与污染溯源中的创新应用,结合多源数据采集、实时分析与GIS技术,助力环保决策,提升城市空气质量管理水平。

279 0
|
6月前
|
机器学习/深度学习 运维 监控
|

[VLDB 2025]面向Flink集群巡检的交叉对比学习异常检测

阿里云与华东师范大学合作论文《Noise Matters: Cross Contrastive Learning for Flink Anomaly Detection》被VLDB 2025接收。该研究聚焦Flink集群热点机器异常检测,提出跨对比学习方法,结合先验知识优化模型训练,有效应对噪声数据干扰,提升检测准确率。该技术已应用于Flink集群智能巡检系统,助力运维风险预警。

339 0
来自: 实时计算 Flink  版块
|
6月前
|
JSON API 数据格式
|

京东商品评论API秘籍!轻松获取商品评论数据

京东商品评论API是京东开放平台提供的数据接口,支持按商品ID获取评论,具备分页、评分筛选、排序等功能,适用于电商数据分析与用户反馈收集。接口采用HTTPS请求,数据格式为JSON,具备高并发处理能力。附Python请求示例代码,便于开发者快速集成。

289 0
|
6月前
|
JSON 监控 API
|

京东商品详情API秘籍!轻松获取商品详情数据

京东商品详情API提供商品SPU/SKU的完整信息,涵盖基础属性、价格、库存及促销等120+字段,支持HTTPS协议与JSON格式,适用于电商多场景。

360 0
|
6月前
|
文字识别 算法 语音技术
|

基于模型蒸馏的大模型文案生成最佳实践

本文介绍了基于模型蒸馏技术优化大语言模型在文案生成中的应用。针对大模型资源消耗高、部署困难的问题,采用EasyDistill算法框架与PAI产品,通过SFT和DPO算法将知识从大型教师模型迁移至轻量级学生模型,在保证生成质量的同时显著降低计算成本。内容涵盖教师模型部署、训练数据构建及学生模型蒸馏优化全过程,助力企业在资源受限场景下实现高效文案生成,提升用户体验与业务增长。

751 23
|
6月前
|
人工智能 算法 量子技术
|

北京百思可瑞教育:模拟天气这件事,量子计算机轻松实现模拟天气气候

本文探讨了气候预测的复杂性及量子计算在该领域的潜力。传统超级计算机难以应对气候模型的庞大计算量,而量子计算凭借其并行性和量子纠缠特性,有望大幅提升气候模拟的效率与精度。文章介绍了量子计算的基本原理、相关实验进展,以及其在碳捕捉、城市微气候预测等方面的应用前景,展望了未来量子技术在气候科学中的深远影响。

173 0
|
6月前
|
JSON 算法 数据库
|

使用 BAML 模糊解析改进 LangChain 知识图谱提取:成功率从25%提升到99%

在构建基于知识图谱的检索增强生成(RAG)系统时,从非结构化数据中准确提取节点和关系是一大挑战,尤其在使用小型本地量化模型时表现更差。本文对比了传统 LangChain 提取框架的严格 JSON 解析限制,提出采用 BAML 的模糊解析策略,显著提升知识图谱提取成功率。实验表明,在相同条件下,BAML 将成功率从约 25% 提升至 99% 以上,为构建高效、稳定的 RAG 系统提供了有效解决方案。

253 0
|
6月前
|
人工智能 运维 监控
|

阿里云Elasticsearch Serverless节省计划来啦!预付抵扣包享最高7折优惠!

阿里云推出ES Serverless推出通用预付优惠抵扣包(节省计划),通过账单折扣进一步降低使用成本,助力企业实现降本增效。

212 8
|
7月前
|
传感器 机器学习/深度学习 算法
|

Java 大视界 -- Java 大数据在智能农业温室环境调控与作物生长模型构建中的应用(189)

本文探讨了Java大数据在智能农业温室环境调控与作物生长模型构建中的关键应用。通过高效采集、传输与处理温室环境数据,结合机器学习算法,实现温度、湿度、光照等参数的智能调控,提升作物产量与品质。同时,融合多源数据构建精准作物生长模型,助力农业智能化、精细化发展,推动农业现代化进程。

229 0
|
7月前
|
SQL 存储 大数据
|

大数据不是“偷窥狂”——咱们该咋保护用户隐私?

大数据带来便利的同时,也引发隐私担忧。本文探讨如何在数据采集、传输、存储等环节保护用户隐私,强调技术责任与用户信任的重要性。

243 0
|
7月前
|
机器学习/深度学习 负载均衡 C++
|

MoR vs MoE架构对比:更少参数、更快推理的大模型新选择

本文将深入分析递归混合(MoR)与专家混合(MoE)两种架构在大语言模型中的技术特性差异,探讨各自的适用场景和实现机制,并从架构设计、参数效率、推理性能等多个维度进行全面对比。

514 0
|
7月前
|
数据采集 JavaScript 前端开发
|

三种常见网站结构的解析方式对比—信息结构与处理路径图谱

页面结构对信息提取方式有重要影响,本文分析三种主流结构类型及应对策略,结合代码实例对比静态页面、动态页面与接口型页面的处理方法,帮助开发者快速选择合适方案,提升数据采集效率。

189 0
|
7月前
|
搜索推荐 API 开发者
|

京东商品列表API响应数据解析

京东商品列表API是京东开放平台的核心接口,支持开发者批量获取商品数据,适用于市场调研、竞品分析、推荐系统等场景。接口支持关键词搜索、分类筛选、价格区间等参数配置,返回商品名称、价格、销量、库存等信息,并具备高并发、实时更新等特性。

176 2
|
7月前
|
人工智能 缓存 并行计算
|

《VGSP-C (Virtual GPU Scheduling Platform on CPU):基于CPU的虚拟GPU调度平台》

VGSP-C(基于CPU的虚拟GPU调度平台)提出通过“软仿真+并行调度+多机协同”三大路径,在普通CPU上模拟GPU并行计算行为。适用于资源受限或低成本场景,支持单机推理、分布式训练与极简CPU集群部署,提供统一编程接口与弹性扩展能力,助力AI普惠与算力再平衡。

285 0
|
7月前
|
Java 程序员 项目管理
|

Java 程序员不容错过的 Git Flow 全套学习资料及应用方法详解 Git Flow

本文详细介绍了Git Flow技术方案及其在Java项目中的应用实例,涵盖分支管理、版本发布与紧急修复流程,帮助开发者掌握高效的代码管理方法,提升团队协作效率。附示例操作及代码下载链接。

230 0
|
7月前
|
人工智能 自动驾驶 大数据
|

“AI再聪明,也得靠大数据喂饱它”:聊聊大数据与人工智能的双剑合璧

“AI再聪明,也得靠大数据喂饱它”:聊聊大数据与人工智能的双剑合璧

393 2
|
7月前
|
存储 算法 API
|

还社交一个自由的未来:去中心化社交网络,会是下一个“推特”吗?

还社交一个自由的未来:去中心化社交网络,会是下一个“推特”吗?

213 5
|
7月前
|
测试技术 API 开发者
|

淘宝关键词搜索商品列表API接入指南(含Python示例)

淘宝关键词搜索商品列表API是淘宝开放平台的核心接口,支持通过关键词检索商品,适用于比价、选品、市场分析等场景。接口提供丰富的筛选与排序功能,返回结构化数据,含商品ID、标题、价格、销量等信息。开发者可使用Python调用,需注意频率限制与错误处理,建议先在沙箱环境测试。

319 6
|
7月前
|

鱼泡- ODPS十五周年实践分享

本视频介绍了鱼泡使用阿里云ODPS系列产品解决业务问题的最佳实践和业务收获。

154 0
|
7月前
|
分布式计算 Java 大数据
|

springboot项目集成dolphinscheduler调度器 可拖拽spark任务管理

springboot项目集成dolphinscheduler调度器 可拖拽spark任务管理

422 2
|
7月前
|
API
|

1688图片搜索API详解

1688图片搜索接口通过上传图片实现相似商品匹配,适用于电商比价、商品溯源。支持按图搜同款或相似商品,返回商品ID、标题、价格等信息,并可设置分页、排序与筛选参数。核心参数包括图片URL/Base64(imgid)、搜索模式(search_type)及排序方式(sort_type)。

466 3
|
7月前
|
数据采集 搜索推荐 算法
|

大数据信息SEO优化系统软件

大数据信息SEO优化系统软件(V1.0)是公司基于“驱动企业价值持续增长”战略,针对企业网站、电商平台及内容营销场景深度定制的智能化搜索引擎优化解决方案。该软件以“提升搜索排名、精准引流获客”为核心目标,通过整合全网数据采集、智能关键词挖掘、内容质量分析、外链健康度监测等功能模块,为企业构建从数据洞察到策略落地的全链路SEO优化体系,助力品牌高效提升搜索引擎曝光度,实现从流量获取到商业转化的价值升级。

150 2
|
7月前
|
数据采集 数据可视化 大数据
|

客户行为到底咋分析?别拍脑袋,用大数据才靠谱!

客户行为到底咋分析?别拍脑袋,用大数据才靠谱!

223 4
|
7月前
|
SQL 关系型数据库 MySQL
|

JOIN顺序优化:小表驱动大表的执行原则

在数据库查询优化中,“小表驱动大表”是一种提升SQL查询效率的常用策略。其核心思想是优先处理数据量较小的表,再与大表进行连接操作,从而减少数据扫描量、降低I/O开销并提高内存使用效率。通过显式指定JOIN顺序、使用EXISTS替代IN以及合理创建索引等方式,可以有效实现该原则。例如,在连接部门表(小表)和员工表(大表)时,先处理小表可显著提升查询性能。掌握这一原则有助于编写高效SQL语句,优化数据库整体表现。

680 0
|
7月前
|
数据采集 人工智能 算法
|

“脏”数据毁一生?教你用大数据清洗术,给数据洗个“澡”!

“脏”数据毁一生?教你用大数据清洗术,给数据洗个“澡”!

600 4
|
8月前
|
机器学习/深度学习 数据采集 算法
|

Python AutoML框架选型攻略:7个工具性能对比与应用指南

本文系统介绍了主流Python AutoML库的技术特点与适用场景,涵盖AutoGluon、PyCaret、TPOT、Auto-sklearn、H2O AutoML及AutoKeras等工具,帮助开发者根据项目需求高效选择自动化机器学习方案。

941 1
|
8月前
|
机器学习/深度学习 存储 PyTorch
|

Arctic长序列训练技术:百万级Token序列的可扩展高效训练方法

Arctic长序列训练(Arctic Long Sequence Training, ALST)技术能够在4个H100节点上对Meta的Llama-8B模型进行高达1500万token序列的训练,使得长序列训练在标准GPU集群甚至单个GPU上都能实现快速、高效且易于部署的执行。

314 1

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69094
内容
128
活动
439688
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务