|
7月前
|
机器学习/深度学习 人工智能 算法
|

“别让模型坑了人”:数据科学中的那些伦理雷区

“别让模型坑了人”:数据科学中的那些伦理雷区

201 16
|
8月前
|
SQL 机器学习/深度学习 前端开发
|

【SQL周周练】一句 SQL 如何帮助 5 个人买到电影院最好的座位?

这是一道我改编的 SQL 题目,不仅需要你输出连续的空座,还需要你去计算观影的最优位置。经过改编后,我相信是蛮有趣味的一道题。

218 24
|
8月前
|
SQL 机器学习/深度学习 数据挖掘
|

【Uber 面试真题】SQL :每个星期连续5星评价最多的司机

本文是【SQL周周练】系列的第一篇,作者“蒋点数分”分享了一道来自Uber面试的真题及其解法。题目要求找出每周连续获得5星好评最多的司机ID。文章详细解析了利用SQL窗口函数解决“连续”问题的思路,并通过Python和NumPy生成模拟数据,最终提供Hive SQL解答方案。后续还将涉及Streamlit应用、时间序列分析、AB实验设计等内容,欢迎关注。

242 16
|
8月前
|
前端开发 JavaScript
|

新手博主狂喜!用SimpleMemory一键生成高逼格博客,访客量翻了5倍的秘密在这

`SimpleMemory Theme Extension` 是一款专为博客园设计的前端美化插件,基于 `SimpleMemory` 主题开发,功能强大且易用。使用前需在博客园后台开通 JS 权限,下载最新版插件(v2.1.4)后,按照步骤配置选项、皮肤和代码。将插件中的 CSS 代码粘贴至自定义样式,并添加基础配置脚本即可完成设置,实现美观的博客效果。更多高级参数将在后续教程中详解。

169 10
|
8月前
|
边缘计算 监控 数据可视化
|

5G时代,开启万物互联新篇章

5G时代,开启万物互联新篇章

225 10
|
8月前
|
安全 JavaScript 前端开发
|

引流器即服务(Drainer-as-a-Service)的兴起 | 了解引流器即服务(DaaS)

近期,X(原推特)平台遭遇一波账号接管攻击,多个知名账户被入侵以传播窃取加密货币的恶意内容。这些攻击主要依赖“加密货币引流器”及“引流器即服务”(DaaS)平台实施。DaaS提供现成脚本、智能合约等工具,帮助攻击者从受害者钱包中转移资产。2021年起,此类威胁逐渐兴起,但未引起足够关注。文章深入分析了DaaS运作模式及其影响,并以CLINKSINK恶意软件为例剖析具体攻击手法。为防范此类威胁,建议启用多因素认证(MFA),警惕社会工程学手段,使用硬件钱包提升安全性。DaaS因低门槛、高回报特点,可能吸引更多恶意参与者,需持续关注其演变趋势。

153 0
|
8月前
|
数据采集 JSON 前端开发
|

GraphQL接口采集:自动化发现和提取隐藏数据字段

本文围绕GraphQL接口采集展开,详解如何通过`requests`+`Session`自动化提取隐藏数据字段,结合爬虫代理、Cookie与User-Agent设置实现精准抓取。内容涵盖错误示例(传统HTML解析弊端)、正确姿势(GraphQL请求构造)、原因解释(效率优势)、陷阱提示(反爬机制)及模板推荐(可复用代码)。掌握全文技巧,助你高效采集Yelp商家信息,避免常见误区,快速上手中高级爬虫开发。

161 3
|
8月前
|
XML JSON API
|

亚马逊商品详情 API 接口开发指南

亚马逊商品详情API为开发者、分析师及电商从业者提供了获取商品数据的便捷途径。通过HTTP/HTTPS协议,支持GET/POST请求,可指定市场代码(如US、UK)和其他参数(如数据格式、附加信息)。返回信息涵盖商品基本信息(标题、品牌等)、价格(售价、货币单位)、库存状态、评论与评分(平均分、总评论数)以及销售排名等,助力市场分析、竞品研究和业务优化。

251 22
|
8月前
|
数据采集 数据挖掘 大数据
|

你还在光采不洗?聊聊数据采集和数据分析到底啥关系!

你还在光采不洗?聊聊数据采集和数据分析到底啥关系!

233 8
|
8月前
|
自动驾驶 安全 物联网
|

5G加持自动驾驶:从“聪明”到“智慧”的进化

5G加持自动驾驶:从“聪明”到“智慧”的进化

241 8
|
8月前
|
算法 搜索推荐 大数据
|

数据驱动增长:大数据与营销自动化的结合之道

数据驱动增长:大数据与营销自动化的结合之道

197 3
|
8月前
|
SQL 关系型数据库 MySQL
|

大数据新视界--大数据大厂之MySQL数据库课程设计:MySQL 数据库 SQL 语句调优方法详解(2-1)

本文深入介绍 MySQL 数据库 SQL 语句调优方法。涵盖分析查询执行计划,如使用 EXPLAIN 命令及理解关键指标;优化查询语句结构,包括避免子查询、减少函数使用、合理用索引列及避免 “OR”。还介绍了索引类型知识,如 B 树索引、哈希索引等。结合与 MySQL 数据库课程设计相关文章,强调 SQL 语句调优重要性。为提升数据库性能提供实用方法,适合数据库管理员和开发人员。

346 11
|
8月前
|
机器学习/深度学习 传感器 数据采集
|

可穿戴设备助力远程医疗:从数据监测到智能诊疗的技术变革

可穿戴设备助力远程医疗:从数据监测到智能诊疗的技术变革

390 3
|
8月前
|
数据采集 自然语言处理 JavaScript
|

Playwright多语言生态:跨Python/Java/.NET的统一采集方案

随着数据采集需求的增加,传统爬虫工具如Selenium、Jsoup等因语言割裂、JS渲染困难及代理兼容性差等问题,难以满足现代网站抓取需求。微软推出的Playwright框架,凭借多语言支持(Python/Java/.NET/Node.js)、统一API接口和优异的JS兼容性,解决了跨语言协作、动态页面解析和身份伪装等痛点。其性能优于Selenium与Puppeteer,在学术数据库(如Scopus)抓取中表现出色。行业应用广泛,涵盖高校科研、大型数据公司及AI初创团队,助力构建高效稳定的爬虫系统。

467 2
|
8月前
|
消息中间件 存储 监控
|

Lalamove基于Flink实时湖仓演进之路

本文由货拉拉国际化技术部资深数据仓库工程师林海亮撰写,围绕Flink在实时数仓中的应用展开。文章首先介绍了Lalamove业务背景,随后分析了Flink在实时看板、数据服务API、数据监控及数据分析中的应用与挑战,如多数据中心、时区差异、上游改造频繁及高成本问题。接着阐述了实时数仓架构从无分层到引入Paimon湖仓的演进过程,解决了数据延迟、兼容性及资源消耗等问题。最后展望未来,提出基于Fluss+Paimon优化架构的方向,进一步提升性能与降低成本。

350 11
来自: 实时计算 Flink  版块
|
8月前
|
机器学习/深度学习 人工智能 运维
|

智能可穿戴设备如何革新职业健康管理?

智能可穿戴设备如何革新职业健康管理?

261 6
|
8月前
|
自然语言处理 并行计算 C++
|

FlashTokenizer: 基于C++的高性能分词引擎,速度可以提升8-15倍

FlashTokenizer是一款高性能CPU分词引擎,专为BERT等Transformer架构优化。基于高效C++实现与多线程并行处理,性能较传统分词器提升8-15倍,显著加速文本预处理。支持跨平台安装,适用于大规模文本处理、实时NLP应用及资源受限场景,助力开发者提升模型推理效率、降低硬件成本。

277 13
|
8月前
|
数据采集 算法 大数据
|

揭秘大数据:洞察客户行为,发掘营销真机

揭秘大数据:洞察客户行为,发掘营销真机

203 6
|
8月前
|
算法 数据安全/隐私保护
|

基于GA遗传算法的斜拉桥静载试验车辆最优布载matlab仿真

本程序基于遗传算法(GA)实现斜拉桥静载试验车辆最优布载的MATLAB仿真,旨在自动化确定车辆位置以满足加载效率ηq(0.95≤ηq≤1.05)的要求,目标是使ηq尽量接近1,同时减少加载车辆数量和布载耗时。程序通过迭代优化计算车辆位置、方向、类型及占用车道等参数,并展示适应度值收敛过程。测试版本为MATLAB2022A,包含核心代码与运行结果展示。优化模型综合考虑车辆总重量、间距及桥梁允许载荷密度等约束条件,确保布载方案科学合理。

195 15
|
9月前
|
算法 数据安全/隐私保护
|

基于分数Talbot效应的阵列光学涡旋产生matlab模拟与仿真

本程序基于分数Talbot效应,使用MATLAB(2013b版本)模拟与仿真光学涡旋阵列的生成,测试了正方形、旋转正方形和六边形三种阵列形状下的光学涡旋效果。分数Talbot效应是经典Talbot效应的推广,可精确控制衍射光场在任意距离处的重现,生成复杂光场分布,包括光学涡旋阵列。程序运行结果展示无水印,核心代码完整,适用于研究分数Talbot效应对光学涡旋的应用场景。

201 0
|
9月前
|
数据采集 监控 Python
|

Python爬虫异常处理:自动跳过无效URL

Python爬虫异常处理:自动跳过无效URL

362 1
|
9月前
|
数据采集 机器学习/深度学习 存储
|

可穿戴设备如何重塑医疗健康:技术解析与应用实战

可穿戴设备如何重塑医疗健康:技术解析与应用实战

357 4
|
9月前
|
存储 算法 数据安全/隐私保护
|

基于风险的完整性和检查建模(RBIIM)MATLAB仿真

本程序为基于风险的完整性和检查建模(RBIIM)的MATLAB仿真,适用于评估和优化资产完整性管理计划,特别针对石油化工等领域的管道、储罐等设备。程序在MATLAB 2022A版本下运行,对比了先验密度(Prior Density)、后验完美检测(Posterior Perfect Inspection)、后验不完美检测(Posterior Imperfect Inspection)及累积后验不完美检测四个关键指标。算法采用贝叶斯统计框架,通过更新资产健康状况估计,制定最佳维护与检查策略。示例展示了核心原理与运行效果,完整程序无水印。

133 0
|
9月前
|
数据采集 存储 机器学习/深度学习
|

构建高效的LinkedIn图像爬取工具

构建高效的LinkedIn图像爬取工具

190 0
|
9月前
|
存储 机器学习/深度学习 缓存
|

特征平台PAI-FeatureStore的功能列表

本内容介绍了阿里云PAI FeatureStore的功能与使用方法,涵盖离线和在线特征管理、实时特征视图、行为序列特征视图、FeatureStore SDK的多语言支持(如Go、Java、Python)、特征生产简化方案、FeatureDB存储特性(高性能、低成本、及时性)、训练样本导出以及自动化特征工程(如AutoFE)。同时提供了相关文档链接和技术细节,帮助用户高效构建和管理特征工程。适用于推荐系统、模型训练等场景。

262 2
来自: 智能搜索推荐  版块
|
9月前
|
存储 虚拟化 Docker
|

对 Docker 理解的补充 docker容器虚拟化技术有什么用?怎么使用?

docker容器虚拟化技术有什么用?怎么使用?

267 21
|
9月前
|
数据采集 算法 前端开发
|

社交媒体分析:破解无限滚动的技术实践

本方案介绍了一种高效的数据采集技术,涵盖技术演化路径、传统痛点解决及架构设计。通过代理IP轮换、请求指纹管理与滚动加载模拟等核心模块,大幅提升请求成功率(98%)和数据完整率(91%),显著降低封禁概率(3.2%)。实战代码以微博热搜为例,展示如何结合动态User-Agent、Cookie管理与三级校验机制实现稳定采集。行业应用表明,该方案可将采集效率提升3.8倍,封禁率降至0.7次/日,助力热点事件早期捕捉。适配大规模任务需求,同时注重流量控制与异常处理,确保稳定性与安全性。

184 7
|
9月前
|
算法 调度 云计算
|

云计算任务调度优化matlab仿真,对比蚁群优化和蛙跳优化

本程序针对云计算任务调度优化问题,旨在减少任务消耗时间、提升经济效益并降低设备功耗。通过对比蚁群优化算法(ACO)与蛙跳优化算法(SFLA),分别模拟蚂蚁信息素路径选择及青蛙跳跃行为,在MATLAB2022A环境下运行测试。核心代码实现任务分配方案的动态调整与目标函数优化,结合任务集合T与服务器集合S,综合考量处理时间与能耗等约束条件,最终输出优化结果。两种算法各具优势,为云计算任务调度提供有效解决方案。

265 17
|
9月前
|
机器学习/深度学习 人工智能 搜索推荐
|

技术革新下的培训新趋势:案例解析

从最初的“试试看”,到如今的“非做不可”,企业培训已经成为央国企和上市公司不可或缺的战略环节。无论是AI与大模型的赋能,DeepSeek,还是具身智能、智算技术和数据科学的实战应用,这些课程都在为企业打开新的可能性。

479 2
|
9月前
|
机器学习/深度学习 PyTorch 调度
|

MiTS与PoTS:面向连续值时间序列的极简Transformer架构

本文探讨了将标准Transformer架构应用于连续值时间序列数据的最小化调整方案,提出了极简时间序列Transformer(MiTS-Transformer)和位置编码扩展时间序列Transformer(PoTS-Transformer)。通过替换嵌入层为线性映射层,MiTS-Transformer实现了对正弦波序列的有效学习。而PoTS-Transformer则通过在高维空间中进行位置编码,结合低维模型架构,解决了长序列处理与过拟合问题。实验结果表明,这两种模型在不同类型的时间序列预测任务中表现出色,为基于Transformer的时间序列预测提供了高效基准方案。

236 5
|
9月前
|
人工智能 数据可视化 数据挖掘
|

《智能商业分析 Quick BI》初体验

Quick BI 是一款全场景数据消费式的BI平台,用户可制作仪表板、电子表格、大屏及数据门户,并将报表集成到业务流程中分享给同事或合作伙伴,展现了强大的数据展示能力。

196 4
|
9月前
|
机器学习/深度学习 人工智能 算法
|

穿越量子边界:量子计算的伦理与社会影响

穿越量子边界:量子计算的伦理与社会影响

453 73
|
9月前
|
机器学习/深度学习 资源调度 算法
|

基于入侵野草算法的KNN分类优化matlab仿真

本程序基于入侵野草算法(IWO)优化KNN分类器,通过模拟自然界中野草的扩散与竞争过程,寻找最优特征组合和超参数。核心步骤包括初始化、繁殖、变异和选择,以提升KNN分类效果。程序在MATLAB2022A上运行,展示了优化后的分类性能。该方法适用于高维数据和复杂分类任务,显著提高了分类准确性。

194 6
|
9月前
|
算法 数据安全/隐私保护
|

泵浦光与斯托克斯光相遇耦合效应的matlab模拟与仿真

本程序使用MATLAB2022A模拟泵浦光与斯托克斯光在非线性光学材料中的耦合效应,基于拉曼散射原理。通过非线性薛定谔方程描述两者相互作用,实现能量转换与放大。核心代码展示了时间与距离上的光强变化,最终生成动态图像展示耦合过程。完整程序无水印,运行结果如附图所示。该仿真有助于理解非线性光学现象及其应用。

211 14
|
9月前
|
资源调度 算法 数据可视化
|

基于IEKF迭代扩展卡尔曼滤波算法的数据跟踪matlab仿真,对比EKF和UKF

本项目基于MATLAB2022A实现IEKF迭代扩展卡尔曼滤波算法的数据跟踪仿真,对比EKF和UKF的性能。通过仿真输出误差收敛曲线和误差协方差收敛曲线,展示三种滤波器的精度差异。核心程序包括数据处理、误差计算及可视化展示。IEKF通过多次迭代线性化过程,增强非线性处理能力;UKF避免线性化,使用sigma点直接处理非线性问题;EKF则通过一次线性化简化处理。

302 14
|
9月前
|
算法 数据安全/隐私保护
|

基于二次规划优化的OFDM系统PAPR抑制算法的matlab仿真

本程序基于二次规划优化的OFDM系统PAPR抑制算法,旨在降低OFDM信号的高峰均功率比(PAPR),以减少射频放大器的非线性失真并提高电源效率。通过MATLAB2022A仿真验证,核心算法通过对原始OFDM信号进行预编码,最小化最大瞬时功率,同时约束信号重构误差,确保数据完整性。完整程序运行后无水印,展示优化后的PAPR性能提升效果。

220 14
|
9月前
|
存储 Java 关系型数据库
|

ssm151大学生就业信息管理系统+jsp(文档+源码)_kaic

大学生就业信息管理系统基于现代经济快速发展和信息化技术的升级,旨在通过软件工具提升数据管理效率。该系统利用SSM框架、Java语言和Mysql数据库开发,实现数据的科学化、规范化与自动化管理。系统界面简洁美观,功能模块布局合理,提供高效的数据处理能力,并注重数据安全。通过此系统,管理者能够快速处理大量信息,提高工作效率,同时确保数据的安全性和可靠性。关键词:大学生就业信息管理系统;SSM框架;Mysql;自动化。

201 13
|
9月前
|
安全 量子技术 数据安全/隐私保护
|

量子计算的未来蓝图:从量子比特到量子霸权

量子计算的未来蓝图:从量子比特到量子霸权

398 28
|
9月前
|
JSON API 开发者
|

淘宝商品详情API接口全攻略

淘宝商品详情API接口为开发者提供了获取淘宝平台上商品详细信息的桥梁,涵盖商品基础信息、价格、图片、描述、评价、物流及店铺信息等。通过输入商品ID,返回JSON格式数据,便于解析处理。该接口支持电商导购、竞品分析、智能选品等业务需求,确保数据准确详尽。示例代码展示了如何用Python调用此API并处理响应数据。

244 0
|
9月前
|
并行计算 算法 量子技术
|

量子计算在金融模型中的应用:未来金融的“黑科技”

量子计算在金融模型中的应用:未来金融的“黑科技”

447 1
|
9月前
|
JavaScript API 数据安全/隐私保护
|

淘宝店铺订单相关API接口详解

本文详细介绍了淘宝店铺订单相关的三个关键API接口:订单列表、订单详情和订单物流。通过这些接口,开发者可以获取订单信息、买家详情、商品清单、支付信息及物流轨迹,支持多种筛选条件和复杂参数传递。此外,文章还强调了接口权限申请、数据安全处理及调用频率限制等注意事项,帮助开发者高效集成这些接口,提升电商系统的功能和用户体验。供稿者:Taobaoapi2014。 (239字符)

613 0
|
10月前
|
机器学习/深度学习 缓存 PyTorch
|

为什么要用TorchEasyRec processor?

TorchEasyRec处理器支持Intel和AMD的CPU服务器及GPU推理,兼容普通PyTorch模型。它具备TorchEasyRec的特征工程(FG)和模型推理功能,提供更快的推理性能,降低成本。通过Item Feature Cache特性,它能够缓存特征以减少网络传输,进一步提升特征工程与推理的速度。

255 2
|
10月前
|
机器学习/深度学习 人工智能 并行计算
|

量子计算机揭秘:从结构到工作原理的深入探索

量子计算机揭秘:从结构到工作原理的深入探索

286 23
|
10月前
|
算法 API 数据安全/隐私保护
|

淘宝商品详情 API 接口(淘宝 API 系列)

淘宝商品详情API接口为电商从业者、数据分析师及开发者提供获取淘宝商品详细信息的便捷途径。该接口涵盖商品名称、价格、图片、描述、用户评价等多维度数据,助力市场分析与应用开发。严格的权限管理和灵活的请求方式确保数据安全和高效获取。Python示例代码展示了如何通过API获取特定商品的详情信息,包括构建请求参数、生成签名及处理响应结果。 供稿:Taobaoapi2014 接口特点: - **丰富的数据内容**:提供商品基础信息、价格、图片、描述及用户评价。 - **多种请求方式**:支持GET和POST请求,灵活设置参数满足不同需求。

270 0
|
10月前
|
数据采集 存储 机器学习/深度学习
|

探索Python的力量:如何处理大数据

探索Python的力量:如何处理大数据

212 7
|
10月前
|
搜索推荐 数据挖掘 UED
|

电竞数据怎么助力创业者在电竞行业发展

电竞数据对创业者至关重要,助力精准市场定位、个性化产品开发、赛事组织优化及吸引投资。通过分析用户行为、市场需求和行业趋势,创业者能降低调研成本,提高决策准确性。同时,基于数据的产品如赛事分析工具、直播数据分析等,可提升用户体验,增强竞争力。数据不仅是分析工具,更是驱动创新的重要资产,帮助创业者在电竞行业中找到立足点。

113 1
|
10月前
|
关系型数据库 应用服务中间件 Linux
|

Linux云服务器如何搭建LNMP环境

LNMP环境是Linux系统中常用的Web服务架构,由Linux、Nginx、MySQL/MariaDB和PHP组成,适用于高效托管动态网站。本文以CentOS 7为例,详细介绍了LNMP环境的搭建步骤,包括Nginx、MariaDB和PHP的安装与配置,以及最终通过创建`index.php`文件验证环境是否成功部署。具体操作涵盖配置YUM仓库、安装服务、编辑配置文件、启动服务等关键步骤,确保用户能够顺利搭建并运行LNMP环境。

235 1
|
10月前
|
JSON 搜索推荐 API
|

小红书商品列表 API 接口(小红书 API 系列)

小红书作为社交与电商结合的平台,拥有丰富的商品信息。通过小红书商品列表API接口,用户可高效、合法地获取商品数据,支持按关键词、品类等筛选条件查询,并返回JSON格式的商品列表,包含名称、图片链接、价格等信息。该接口帮助商家分析市场、制定策略,开发者构建推荐系统。示例代码展示了如何使用Python发送HTTP请求并处理响应数据。

420 6
|
10月前
|
机器学习/深度学习 算法 Serverless
|

基于Itô扩散过程的交易策略偏微分方程matlab求解与仿真

本程序基于Itô扩散过程的交易策略偏微分方程,确定了Itô扩散过程,并推导出交易长度的分布和密度函数,计算预期交易频率。核心代码在MATLAB2022A上运行,展示了交易策略的概率分布及卷积结果。算法原理涉及金融衍生品定价与风险管理,利用随机微分方程建模资产价格动态,求解相关偏微分方程以确定最优交易策略。

185 5

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

1
今日
67714
内容
128
活动
439500
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务