|
数据可视化 安全 数据挖掘
|

streamlit (python构建web)之环境搭建

在微信订阅号中发现了一篇关于Streamlit的文章,激发了我的兴趣。Streamlit是一款专为数据科学家设计的开源Python库,能迅速将数据分析脚本转变为功能完备的Web应用。它简化了开发流程,支持轻松添加交互组件及动态展示图表、图像等,非常适合开发安全扫描工具。Streamlit基于Jupyter Notebook原理,通过Python脚本创建可视化和交互式的Web应用,易于部署分享。安装方法多样,可通过`pip install streamlit`快速安装,或通过Anaconda环境管理依赖。启动示例应用只需运行简单命令,即可体验自带的动画、绘图和数据展示等功能。

1774 1
|
SQL 存储 安全
|

SQL安全深度剖析:守护数据安全的坚固防线

展望未来,随着技术的不断进步和攻击手段的不断翻新,SQL安全将面临更多的挑战。因此,我们需要持续关注SQL安全领域的最新动态和技术发展,并不断更新和完善我们的防护措施。同时,加强国际合作与信息共享也是提升全球SQL安全性的重要途径。让我们共同努力,为构建一个更加安全、可靠的数字化环境而奋斗。

801 1
|
存储 人工智能 弹性计算
|

通义万相AI绘画创作评测及图文搭建教程

【7月更文挑战第4天】阿里云的通义万相是AI绘画模型,结合ECS、OSS和API服务,提供无缝创作环境。用户上传图片至OSS,模型通过签名URL下载图片,然后生成AI艺术作品。模型服务具有高性能、易集成的特点,适用于多种场景如设计、广告等。用户可按指示在阿里云官网注册、充值、开通服务并部署。项目评测显示,其集成便捷、响应快、泛化能力强,但仍有改进空间,如增加图像控制选项和批量处理能力。相对于竞品,通义万相在成本、易用性和应用场景上有竞争力,值得推荐。

12491 9
|
测试技术 Python
|

【手机群控】 利用Python与uiautomator2实现

使用Python的uiautomator2库进行多设备自动化测试,涉及环境准备(Python、uiautomator2、adb连接设备)和代码实现。通过`adb devices`获取设备列表,使用多进程并行执行测试脚本,每个脚本通过uiautomator2连接设备并获取屏幕尺寸。注意设备需开启USB调试并授权adb。利用多进程而非多线程,因Python的GIL限制。文章提供了一种提高测试效率的方法,适用于大规模设备测试场景。

1431 2
|
机器学习/深度学习 数据采集 数据挖掘
|

Python实现循环神经网络RNN-LSTM回归模型项目实战(股票价格预测)

Python实现循环神经网络RNN-LSTM回归模型项目实战(股票价格预测)

1752 0
来自: 人工智能平台PAI  版块
|
运维 分布式计算 DataWorks
|

DataWorks产品使用合集之如何访问周期任务运维

DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。

281 0
|
人工智能 弹性计算 运维
|

操作系统智能助手OS Copilot 产品体验评测

**OS Copilot 体验摘要** - AI爱好者评价其部署简单,一键快捷,无使用障碍,适合作为智能助手。 - 初次使用者表示聊天功能最吸引人,但无法立即评出对工作帮助的程度。 - 愿意推荐给他人,且有参与开源开发及模型训练的兴趣。 **功能反馈** - 用户尝试了全部功能,特别喜欢聊天交互。 - 与通义千问等多款产品对比,OS Copilot的速度较快。 - 希望增加功能:集成云端Notebook,自动代码生成和错误修正,支持所有操作系统。 - 潜在应用:与阿里云服务如魔搭、ECS结合,打造智能开发和工作流程。

388 1
|
SQL 存储 JSON
|

Hive 解析 JSON 字符串数据的实现方式

Hive 提供 `get_json_object` 函数解析 JSON 字符串,如 `{"database":"maxwell"}`。`path` 参数使用 `$`、`.`、`[]` 和 `*` 来提取数据。示例中展示了如何解析复杂 JSON 并存储到表中。此外,Hive 3.0.0及以上版本内置 `JsonSerDe` 支持直接处理 JSON 文件,无需手动解析。创建表时指定 `JsonSerDe` 序列化器,并在 HDFS 上存放 JSON 文件,可以直接查询字段内容,方便快捷。

1673 3
|
运维 监控 安全
|

什么是NetDevOps

总之,NetDevOps是一种综合性的方法,旨在将DevOps原则引入网络运维领域,通过自动化、持续交付、基础设施即代码等实践,

755 1
|
机器学习/深度学习 JSON 自然语言处理
|

LLM2Vec介绍和将Llama 3转换为嵌入模型代码示例

通过LLM2Vec,我们可以使用LLM作为文本嵌入模型。但是简单地从llm中提取的嵌入模型往往表现不如常规嵌入模型。

864 5
|
机器学习/深度学习 PyTorch 算法框架/工具
|

归一化技术比较研究:Batch Norm, Layer Norm, Group Norm

本文将使用合成数据集对三种归一化技术进行比较,并在每种配置下分别训练模型。记录训练损失,并比较模型的性能。

1608 2
|
SQL Prometheus Cloud Native
|

Flink启动问题之job启动失败如何解决

Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。本合集提供有关Apache Flink相关技术、使用技巧和最佳实践的资源。

1297 1
来自: 实时计算 Flink  版块
|
消息中间件 负载均衡 Kafka
|

Kafka学习---消费者(分区消费、分区平衡策略、offset、漏消费和重复消费)

Kafka学习---消费者(分区消费、分区平衡策略、offset、漏消费和重复消费)

3347 2
|
算法 自动驾驶 开发者
|

Cityscapes数据集(智能驾驶场景的语义分割)

面向智能驾驶(辅助驾驶、自动驾驶)场景下的语义分割任务,由于非结构化场景的复杂性,是一个非常具有挑战性的任务,所以有许多研究者和研究机构公开了很多相关的数据集推动语义分割领域的发展。本文主要介绍Cityscapes数据集。

1858 0
|
机器学习/深度学习 人工智能 分布式计算
|

大模型时代的人工智能+大数据平台,加速创新涌现

2023年10月31日,2023云栖大会上,阿里云副总裁、阿里云计算平台事业部负责人汪军华宣布阿里云人工智能+大数据平台升级发布,以服务大模型时代下各行各业的业务创新。

3421 0
来自: 人工智能平台PAI  版块
|
算法 索引
|

阿里云 Elasticsearch 使用 RRF 混排优化语义查询结果对比

Elasticsearch 从8.8版本开始,新增 RRF,支持对多种不同方式召回的多个结果集进行综合再排序,返回最终的排序结果。之前 Elasticsearch 已经分别支持基于 BM25 的相关性排序和向量相似度的召回排序,通过 RRF 可以对这两者的结果进行综合排序,可以提升排序的准确性。

3719 0
|
消息中间件 SQL 存储
|

37手游基于云平台的大数据建设实践

37手游大数据平台资深开发工程师史飞翔在实时数仓 Workshop 广州站的演讲。

28156 34
来自: 实时计算 Flink  版块
|
存储 SQL 关系型数据库
|

实时数仓入门训练营:Hologres性能调优实践

《实时数仓入门训练营》由阿里云研究员王峰、阿里云高级产品专家刘一鸣等实时计算Flink版和 Hologres 的多名技术/产品一线专家齐上阵,合力搭建此次训练营的课程体系,精心打磨课程内容,直击当下同学们所遇到的痛点问题。由浅入深全方位解析实时数仓的架构、场景、以及实操应用,7 门精品课程帮助你 5 天时间从小白成长为大牛!

2981 0
来自: 实时计算 Flink  版块
|
分布式计算 Hadoop DataWorks
|

【最佳实践】如何运用DataWorks数据同步功能,将Hadoop数据同步到阿里云Elasticsearch上

如何通过DataWorks数据同步功能,将Hadoop数据同步到阿里云Elasticsearch上,并进行搜索分析。

7330 0
|
11天前
|
JSON Java fastjson
|

java工具:《json对象转javabean》

java工具:《json对象转javabean》

83 2
|
12天前
|
机器学习/深度学习 数据采集 搜索推荐
|

你还在用关键词匹配?Python 玩转文本聚类 + 相似度搜索,效果直接碾压

你还在用关键词匹配?Python 玩转文本聚类 + 相似度搜索,效果直接碾压

92 8
|
16天前
|
人工智能 运维 安全
|

基于云边协同的电线电缆押出机智能调机解决方案设计与落地

本方案基于云边协同架构,融合阿里云云原生技术,破解线缆行业押出机调机效率低、原料损耗高、数据孤岛等难题;边缘毫秒级实时控制+云端Al训练优化,实现调机提效80%、降耗60%,部署快、运维省、可扩展

205 9
|
19天前
|
大数据 异构计算 Python
|

别再单卡硬扛了:一文讲透 Python 多 GPU / 分布式训练怎么写(附完整实战代码)

别再单卡硬扛了:一文讲透 Python 多 GPU / 分布式训练怎么写(附完整实战代码)

143 3
|
19天前
|
人工智能 安全 API
|

1949AI 轻量化 AI 自动化 本地自动化工具 + 浏览器自动化 + Agent 自动化工具 小说连载生成技术实践

1949AI 轻量化 AI 自动化 本地自动化工具 + 浏览器自动化 + Agent 自动化工具 小说连载生成技术实践

134 1
|
19天前
|
存储 人工智能 运维
|

1949AI 轻量化 AI 自动化 本地自动化工具浏览器自动化 Agent 自动化工具 自动化运维状态监测与消息推送技术实践

1949AI是一款轻量化AI自动化工具,专注本地化、低资源、零配置运维实践。支持浏览器自动化监测、状态智能判定、本地日志存储与消息推送,适配低配电脑与个人/小型团队,安全合规、开箱即用。(239字)

318 5
|
23天前
|
XML JSON 数据挖掘
|

京东商品详情数据一键获取,item_get API接口讲解

京东item_get是获取单商品详情的核心API,支持一键拉取标题、价格、SKU、库存、详情HTML等结构化数据,适用于反向海淘、代购、ERP同步及比价分析等场景,分基础版与完整版,需认证授权后调用。(239字)

187 2
|
25天前
|
存储 数据挖掘 OLAP
|

数仓入门篇-维度模型与第三范式

第三范式(3NF)是关系数据库规范化核心标准,要求消除传递依赖,确保数据无冗余、“一事一地”。维度模型则面向分析优化,采用星型结构与反规范化设计,以牺牲存储换查询性能与业务可读性。二者各适其用:3NF用于OLTP系统保一致性,维度模型用于OLAP场景提分析效率。(239字)

194 5
|
1月前
|
自然语言处理 PyTorch 算法框架/工具
|

大模型太慢?别急着上 GPU 堆钱:Python + ONNX Runtime 优化推理性能实战指南

大模型太慢?别急着上 GPU 堆钱:Python + ONNX Runtime 优化推理性能实战指南

405 10
|
2月前
|
数据采集 人工智能 前端开发
|

2026年:大规模为Agent构建基础设施(API、数据、环境) 这不是简单的技术迭代,而是整个产业重心的转移

今天目睹AI Agent“巨硬”私有化部署奇迹:它自主打开浏览器、登录12306、查询深圳→宜春高铁票并关闭页面!这背后是2026年AI新范式——以Cloudflare“Markdown for Agents”降本增效,MiniMax M2.5以1美元/小时实现普惠智能。AI正从“能说会写”迈向“真干实事”,基础设施革命已来。

221 1
|
2月前
|
人工智能 JSON 自然语言处理
|

想让大模型更懂你?从原理到实践,详解高效微调的全流程

本文深入解析大模型微调中的核心参数调优与显存优化策略,涵盖学习率、训练轮数、批量大小、截断长度、LoRA秩五大关键参数的原理、调参技巧及显存影响,并结合LLaMA-Factory实战演示高效微调全流程,助你低成本、高质地打造专属AI助手。(239字)

316 0
|
2月前
|
存储 人工智能 运维
|

千亿级训练数据,真不是“存得下就完事了”

千亿级训练数据,真不是“存得下就完事了”

132 2
|
2月前
|
数据采集 人工智能 监控
|

让大模型“开小灶”:手把手教你打造能聊业务的专属AI

本文深入浅出解析AI微调(Fine-tuning)技术:揭示通用大模型“懂常识却不懂行”的根源,详解LoRA等高效微调原理,对比RAG适用场景,并提供数据准备、LoRA训练、效果评估到部署的四步实践指南。助力业务人员低成本打造专属行业AI助手。(239字)

270 0
|
2月前
|
数据采集 监控 API
|

京东商品详情 API(jd.item_get)

京东商品详情API(jd.item_get)是京东开放平台提供的标准化REST接口,支持获取商品标题、价格、库存、规格、促销及售后等全量信息,适用于数据采集、价格监控、比价工具及代购系统等场景。

274 1
|
3月前
|
安全 算法 C++
|

PPO 真正的应用场景,和你想的可能不一样

PPO并非“万能增强器”,而是精准解决模型“行为偏好错位”的工具:当模型“会但总选错”(如安全拒答生硬、风格不稳、高风险下过度自信)时,PPO通过人类偏好反馈重塑其选择倾向;若问题本质是“不会”,则PPO无效甚至有害。用对场景,事半功倍。

188 1
|
3月前
|
人工智能 运维 供应链
|

智能体来了:生产企业如何用AI赚钱

在“智造”转型浪潮下,AI已成为制造企业发展的必选项。本文系统解析AI在研发、生产、供应链、管理等场景的应用路径,提出从数据筑基到智能体落地的四阶段实施框架,揭示避免技术陷阱、组织阻力的关键策略,助力企业以价值驱动、稳步推进智能化升级。

169 0
|
3月前
|
数据采集 人工智能 自然语言处理
|

开源大模型微调对比:选对模型,让定制化更高效

本文对比Llama 3、Qwen2.5、Mistral三款开源大模型在中文场景下的微调表现,从算力门槛、数据效率、任务适配性等维度分析,结合实战案例与主观评估,为开发者提供选型建议,助力高效构建定制化AI模型。

504 10
|
3月前
|
人工智能 API 开发者
|

2026年 AI LLM API 开发趋势:技术、架构与应用深度探讨

2026年,LLM API已成为企业开发核心。本文详解API调用、Prompt工程、多轮对话与流式输出,结合聚合平台如poloapi.top,助力开发者高效构建AI应用,把握技术前沿。

511 4
|
3月前
|
安全 算法 分布式数据库
|

链上太堵了怎么办?聊聊区块链可扩展性的三种主流解法

链上太堵了怎么办?聊聊区块链可扩展性的三种主流解法

202 5
|
4月前
|
JSON NoSQL 关系型数据库
|

MongoDB简介

MongoDB是一款开源、高性能、无模式的文档型数据库,采用类似JSON的BSON格式存储数据,结构灵活,支持复杂数据类型。文档以键值对形式组织,兼具灵活性与扩展性,是最接近关系型数据库的NoSQL产品,适用于快速开发与大规模扩展场景。

139 0
|
4月前
|
NoSQL Shell Redis
|

Redis集群伸缩,转移插槽失败

Redis集群出现节点配置不一致,提示slot 0处于importing状态。需登录对应实例,执行`cluster setslot 0 stable`命令,恢复slot稳定状态,修复问题后再进行集群重平衡操作。注意根据实际slot ID调整命令参数。

124 0
|
4月前
|
NoSQL Java MongoDB
|

MongoDB实战演练

本项目基于SpringDataMongoDB实现头条文章评论功能,涵盖增删改查、按文章ID查询及评论点赞。通过MongoTemplate优化操作效率,结合索引提升查询性能,构建高效稳定的评论微服务模块。

118 0
|
4月前
|
存储 缓存 Java
|

自动装配机制

本文深入解析SpringBoot自动装配机制,从@SpringBootApplication注解入手,剖析其组合注解原理。重点讲解@EnableAutoConfiguration如何通过@AutoConfigurationPackage和AutoConfigurationImportSelector实现包扫描与自动配置类加载,结合@ComponentScan、元注解及spring.factories机制,揭示SpringBoot“约定优于配置”的底层实现逻辑。

138 0
|
4月前
|
监控 Java Serverless
|

1TB数据,ES却收到了2TB?揪出那个客户端中的“隐形复读机”

揭秘日志服务中的“隐形复读机”:客户端因非抢先认证导致数据重复发送,带宽消耗翻倍。通过优化鉴权配置或使用Serverless监控,可轻松定位并节省50%流量成本。

499 4
|
4月前
|
机器学习/深度学习 人工智能 数据可视化
|

构建AI智能体:七十三、模型的成绩单:一文读懂损失函数,看懂AI如何学习

本文系统介绍了损失函数在机器学习中的核心作用。首先通过类比教学场景,阐释损失函数作为模型"导师"的重要性。随后详细解析了回归任务中的均方误差(MSE)和平均绝对误差(MAE),通过房价预测案例展示了它们对误差的不同处理方式。在分类任务部分,重点讲解了二分类和多分类交叉熵损失函数,使用垃圾邮件识别和图像分类等实例,说明这些函数如何通过概率计算来评估预测准确性。文章通过可视化图表直观呈现了不同损失函数的特点,并强调损失函数作为模型优化的指南针,其设计直接影响学习效果。

461 20
|
4月前
|
存储 机器学习/深度学习 人工智能
|

GEO 优化必备:RAG 技术全解析(基于知识密集型 NLP 经典论文)

2020 年论文提出的 RAG(检索增强生成),专治大模型 “幻觉、知识过时” 等落地痛点。它将 “检索外部知识” 与 “生成回答” 深度绑定,先精准抓取相关知识片段,再让模型基于证据生成内容。通过端到端联合训练,检索与生成协同优化,事实准确率显著提升,幻觉率大降。无需重训模型即可更新知识,还能追溯答案来源。如今成企业客服、医疗法律等领域刚需,推动大模型从 “通用” 走向 “可信实用”。这让我们做GEO优化就有了基础理论和方法。

514 1
|
5月前
|
存储 监控 Cloud Native
|

云原生日志监控体系怎么做才不崩?一篇给你讲透采集、存储、分析、告警的最佳实践

云原生日志监控体系怎么做才不崩?一篇给你讲透采集、存储、分析、告警的最佳实践

355 16
|
5月前
|
人工智能 算法 前端开发
|

实验报告:让AI自动生成采集代码,会踩哪些坑?

本文复盘AI自动生成采集代码的实战效果,梳理出“模拟行为”与“接口调用”两大技术路线。AI在浏览器自动化中表现良好,适合简单场景;但面对加密接口与强反爬时仍需人工介入。最终结论:AI是高效助手,但核心难题仍需工程师掌控。

399 1
|
5月前
|
关系型数据库 MySQL PHP
|

0 基础建站?PageAdmin CMS 10 分钟搞定,源码免费拿!

PageAdmin CMS 为无编程基础用户提供高效建站方案。步骤包括:准备服务器、域名及源码;上传源码并配置数据库;通过安装向导完成基础设置;在后台创建栏目、填充内容;测试功能后上线。全程无需编程,简单操作即可搭建独立网站,支持后续维护与扩展。

573 1
|
5月前
|
人工智能 运维 Serverless
|

Elasticsearch 8.17 智能检索升级全攻略

Elasticsearch 作为一款强大的搜索与分析引擎,支持传统检索、AI 搜索(如语义检索、RAG、多模态检索)及智能运维场景,结合阿里云AI搜索开放平台提供一站式解决方案。 本文介绍了最新发布的 Elasticsearch 8.17 检索增强型应用在性能和功能上的特性。同时本文介绍了利用容量规划工具优化资源分配,特别适合 AI 应用和高弹性场景,为用户提供高性能、低成本、易扩展的搜索服务。

648 107
|
5月前
|
人工智能 机器人 数据处理
|

ICLR2026 !SAM3重磅来袭:能“听懂人话”的分割模型,性能狂飙2倍

Lab4AI.cn覆盖全周期科研支撑平台,提供论文速递、AI翻译和AI导读工具辅助论文阅读;支持投稿论文复现和Github项目复现,动手复现感兴趣的论文;论文复现完成后,您可基于您的思路和想法,开启论文创新与成果转化。

949 6
来自: 人工智能平台PAI  版块

大数据与机器学习

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

0
今日
69327
内容
128
活动
439807
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大数据开发治理平台 DataWorks
  • 检索分析服务 Elasticsearch版
  • 日志服务