|
数据采集 存储
|

4个步骤:如何使用 SwiftSoup 和爬虫代理获取网站视频

本文介绍了如何使用SwiftSoup库和爬虫代理技术抓取网站视频资源。通过安装SwiftSoup、获取HTML内容、解析HTML以提取视频链接,以及设置爬虫代理来绕过访问限制,可以实现高效、灵活的视频资源获取。示例代码展示了一个完整的过程,包括下载并存储视频文件到设备。结合这两种技术,可以有效应对网站访问挑战,方便地获取互联网视频资源。

449 3
|
机器学习/深度学习 Python
|

使用Python实现超参数调优

使用Python实现超参数调优

196 0
|
数据采集 搜索推荐 JavaScript
|

Next.js进阶:静态生成、服务器端渲染与SEO优化

【4月更文挑战第13天】Next.js是现代Web开发的关键框架,以其对静态生成(Static Generation)、服务器端渲染(Server-Side Rendering)和SEO的支持而备受青睐。本文深入解析了这三个核心特性的原理、应用和最佳实践。静态生成在构建时生成HTML,适用于内容更新少的页面,通过`getStaticProps`和`getStaticPaths`获取静态数据。服务器端渲染则在每次请求时生成HTML,适合实时数据,使用`getServerSideProps`获取服务器端数据。

560 1
|
存储 分布式计算 Apache
|

官宣|Apache Paimon 毕业成为顶级项目,数据湖步入实时新篇章!

Apache Paimon 在构建实时数据湖与流批处理技术领域取得了重大突破,数据湖步入实时新篇章!

3521 6
来自: 实时计算 Flink  版块
|
算法 数据可视化 数据挖掘
|

使用Python实现高斯混合模型聚类算法

使用Python实现高斯混合模型聚类算法

313 3
|
安全
|

选择最佳供应商:ERP系统的供应商选择与评估方法论

选择最佳供应商:ERP系统的供应商选择与评估方法论

1466 0
|
SQL Cloud Native 架构师
|

深入浅出Presto:大数据查询引擎的原理与应用

【4月更文挑战第7天】Presto是高性能的分布式SQL查询引擎,专为大规模数据交互式分析设计。它采用分离式架构,内存计算和动态规划优化查询,支持跨源查询、交互式查询和ANSI SQL兼容性。应用于大数据分析、实时数据湖查询和云原生部署。Presto的灵活性和效率使其在大数据处理领域备受推崇,适合分析师、数据科学家和IT架构师使用。未来将在博客中分享更多实践和案例。

1439 1
|
数据可视化 BI
|

探索ERP系统的移动端应用与移动办公解决方案

探索ERP系统的移动端应用与移动办公解决方案

473 2
|
缓存 Ubuntu 搜索推荐
|

Ubuntu执行apt-get install xxx报错怎么办?

如果以上步骤无法解决问题,你可以在搜索引擎或Linux社区中查找更详细的解决方案。 买CN2云服务器,免备案服务器,高防服务器,就选蓝易云。百度搜索:蓝易云

494 0
|
供应链 监控
|

解密ERP系统的采购与物料管理模块

解密ERP系统的采购与物料管理模块

391 8
|
算法 数据可视化 Python
|

使用Python实现K近邻算法

使用Python实现K近邻算法

135 3
|
机器学习/深度学习 人工智能 负载均衡
|

基于 NVIDIA Megatron-Core 的 MoE LLM 实现和训练优化

本文将分享阿里云人工智能平台 PAI 团队与 NVIDIA Megatron-Core 团队在 MoE (Mixture of Experts) 大型语言模型(LLM)实现与训练优化上的创新工作。

1506 8
来自: 人工智能平台PAI  版块
|
人工智能 算法 PyTorch
|

TorchAcc:基于 TorchXLA 的分布式训练框架

阿里云研究员、阿里云人工智能平台 PAI 技术负责人--林伟在GTC 2024 大会 China AI Day 线上中文演讲专场上介绍了TorchAcc,这是一个基于 PyTorch/XLA 的大模型分布式训练框架。

108531 13
来自: 人工智能平台PAI  版块
|
Linux API 开发工具
|

使用PySimpleGUI库打造一款轻量级计算器

使用PySimpleGUI创建简单计算器的教程。PySimpleGUI是Python的GUI库,适合新手快速构建GUI应用。文中通过实例介绍PySimpleGUI的基本操作,包括组件、事件处理和布局管理。首先讲解PySimpleGUI的特性与安装,接着展示计算器界面的代码,定义布局和窗口。然后实现计算器功能,包括数字和运算符的回调函数处理。最后,总结了如何使用PySimpleGUI创建GUI应用,并鼓励读者进一步探索其更多功能。

325 1
|
API 开发者
|

1688API接口推荐:1688口令转换真实链接接口

1688平台的item_password接口用于将淘口令短链接转为商品链接。开发者需注册获取API key和secret,通过POST或GET请求接口,输入淘口令代码和参数,返回结果包含商品ID和详细链接。商品详情可进一步通过商品详情接口获取。注意遵守1688平台的规定和条款,确保合法使用API。

478 0
|
IDE Java 开发工具
|

Python新手常见问题四:如何规避Python中的缩进错误?

在Python编程语言中,代码块的结构和逻辑是通过缩进来组织的,这与其他许多语言依赖花括号(如Java、C++)的方式大相径庭。对于初学者来说,正确理解和使用缩进规则至关重要,因为不恰当的缩进会导致IndentationError,从而影响程序的执行。本文将详细探讨Python缩进错误的常见场景,并提供有效的预防措施。

1108 1
|
网络安全 Python Windows
|

pyspark--完美解决 Could not find a version that satisfies the requirement 安装包名字 (from versions: )

pyspark--完美解决 Could not find a version that satisfies the requirement 安装包名字 (from versions: )

818 9
|
SQL 存储 BI
|

数仓学习---数仓开发之ADS层

数仓学习---数仓开发之ADS层

885 1
|
机器学习/深度学习 存储 人工智能
|

从16-bit 到 1.58-bit :大模型内存效率和准确性之间的最佳权衡

通过量化可以减少大型语言模型的大小,但是量化是不准确的,因为它在过程中丢失了信息。通常较大的llm可以在精度损失很小的情况下量化到较低的精度,而较小的llm则很难精确量化。

310 0
|
人工智能 前端开发 PyTorch
|

AI加速引擎PAI-TorchAcc:整体介绍与性能概述

PAI-TorchAcc(Torch Accelerator)是阿里云人工智能平台PAI开发的Pytorch上的大模型训练加速框架。PAI-TorchAcc提供了一套基于Pytorch的简洁、易用的接口,无需进行模型转换就可以无缝地接入HuggingFace上的模型,并用多种分布式策略进行训练加速。本文详细介绍PAI-TorchAcc的产品能力与性能。

115081 166
来自: 人工智能平台PAI  版块
|
SQL Java Apache
|

Flink内存问题之内存溢出如何解决

Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。本合集提供有关Apache Flink相关技术、使用技巧和最佳实践的资源。

879 3
来自: 实时计算 Flink  版块
|
机器学习/深度学习 算法 atlas
|

RAG 2.0架构详解:构建端到端检索增强生成系统

RAG(检索增强生成)旨在通过提供额外上下文帮助大型语言模型(LLM)生成更精准的回答。现有的RAG系统由独立组件构成,效率不高。RAG 2.0提出了一种预训练、微调和对齐所有组件的集成方法,通过双重反向传播最大化性能。文章探讨了不同的检索策略,如TF-IDF、BM25和密集检索,并介绍了如SPLADE、DRAGON等先进算法。目前的挑战包括创建可训练的检索器和优化检索-生成流程。研究表明,端到端训练的RAG可能提供最佳性能,但资源需求高。未来研究需关注检索器的上下文化和与LLM的协同优化。

1635 1
|
算法
|

MATLAB | 插值算法 | 二维griddata插值法 | 附数据和出图代码 | 直接上手

MATLAB | 插值算法 | 二维griddata插值法 | 附数据和出图代码 | 直接上手

1192 0
|
数据采集 存储 监控
|

京东商品详情数据采集方法代码展示

京东商品详情数据采集方法代码展示

253 1
|
存储 Python
|

如何使用Python实现“猜数字”游戏

本文介绍了使用Python实现“猜数字”游戏的过程。游戏规则是玩家在给定范围内猜一个由计算机随机生成的整数,猜对则获胜。代码中,首先导入random模块生成随机数,然后在循环中获取玩家输入并判断大小,提供猜小、猜大提示。通过增加猜测次数限制、难度选择、优化输入提示和图形化界面等方式可优化游戏。这篇文章旨在帮助初学者通过实际操作学习Python编程。

670 2
|
存储 缓存 数据处理
|

Flink 2.0 状态存算分离改造实践

本文整理自阿里云智能 Flink 存储引擎团队兰兆千在 FFA 2023 核心技术(一)中 的分享,内容关于 Flink 2.0 状态存算分离改造实践的研究。

780 1
来自: 实时计算 Flink  版块
|
存储 人工智能 Cloud Native
|

阿里云向量检索 Milvus 版开启公测,助力企业打造高质量 AI 服务

阿里云向量检索 Milvus 版正式开启公测,诚邀广大开发者及企业用户参与公测,赋能智能检索,解锁 AI 潜能。

926 1
|
SQL Java HIVE
|

使用 Paimon + StarRocks 极速批流一体湖仓分析

本文整理自阿里云智能高级开发工程师王日宇,在 Flink Forward Asia 2023 流式湖仓(二)专场的分享。

80508 3
来自: 实时计算 Flink  版块
|
SQL 数据挖掘 数据安全/隐私保护
|

即席查询结果交互体验大升级,好用到爆

Dataphin v4.0提升了即席查询体验,新增支持多条SQL语句同时执行并查看独立日志,允许用户移动或隐藏列,以及全屏查看结果。此外,为增强数据安全,引入了禁止数据复制的功能。新版本还优化了细节,如单行详细信息查看和更灵活的列管理,旨在提高数据分析效率并保障数据安全。

295 1
|
机器学习/深度学习 算法 算法框架/工具
|

OpenAI Gym 中级教程——深入强化学习算法

OpenAI Gym 中级教程——深入强化学习算法

554 6
|
机器学习/深度学习 人工智能 编解码
|

CES亮点:AI赋能与产业创新 | DALL-E 3、SD等20+图像生成模型综述

随着科技飞速发展,CES(国际消费电子展)已然成为全球科技产业的风向标,每年的CES大会都是业界瞩目的盛事。回顾2024年CES大会,不难发现其亮点纷呈,其中以人工智能的深度赋能为最引人注目之处。AI技术的深入应用成为CES大会上的一大亮点,各大厂商纷纷展示了在AI领域的最新成果。

496 0
|
机器学习/深度学习 Python
|

Scikit-Learn 中级教程——网格搜索和交叉验证

Scikit-Learn 中级教程——网格搜索和交叉验证

724 6
|
机器学习/深度学习 数据可视化 Python
|

Scikit-Learn 中级教程——学习曲线

Scikit-Learn 中级教程——学习曲线

946 3
|
SQL 分布式计算 Java
|

数仓学习---7、数据仓库设计、数据仓库环境准备、模拟数据生成

数仓学习---7、数据仓库设计、数据仓库环境准备

430 2
|
存储 人工智能 机器人
|

使用CLIP和LLM构建多模态RAG系统

在本文中我们将探讨使用开源大型语言多模态模型(Large Language Multi-Modal)构建检索增强生成(RAG)系统。本文的重点是在不依赖LangChain或LLlama index的情况下实现这一目标,这样可以避免更多的框架依赖。

804 0
|
SQL 分布式计算 NoSQL
|

快速实践: 通过 Flink CDC 一键整库同步 MongoDB 到 Paimon

Apache Paimon (incubating) 是一项流式数据湖存储技术,可以为用户提供高吞吐、低延迟的数据摄入、流式订阅以及实时查询能力。

77302 4
来自: 实时计算 Flink  版块
|
机器学习/深度学习 算法 测试技术
|

处理不平衡数据的过采样技术对比总结

在不平衡数据上训练的分类算法往往导致预测质量差。模型严重偏向多数类,忽略了对许多用例至关重要的少数例子。这使得模型对于涉及罕见但高优先级事件的现实问题来说不切实际。

439 0
|
API 开发工具 开发者
|

淘宝店铺所有商品数据接口(Taobao.item_search_shop)

淘宝店铺所有商品数据接口(Taobao.item_search_shop)

309 0
|
SQL 分布式计算 分布式数据库
|

Hive命令大全

Hive命令大全

263 2
|
Prometheus 监控 关系型数据库
|

Linux监控之夜莺

Linux监控之夜莺

912 0
|
Linux 网络虚拟化
|

Debian系统安装OpenVPN

Debian系统安装OpenVPN

1666 0
|
机器学习/深度学习 算法 PyTorch
|

挑战Transformer的新架构Mamba解析以及Pytorch复现

今天我们来详细研究这篇论文“Mamba:具有选择性状态空间的线性时间序列建模”

1987 1
|
编译器 数据处理 Python
|

Python的xlrd模块在Anaconda中的安装

本文介绍在Anaconda环境下,安装Python读取.xls格式表格文件的库xlrd的方法~

808 1
|
关系型数据库 MySQL BI
|

用友畅捷通基于阿里云 EMR StarRocks 搭建实时湖仓实战分享

本文从用友畅捷通公司介绍及业务背景;数据仓库技术选型、实际案例及未来规划等方面,分享了用友畅捷通基于阿里云 EMR StarRocks 搭建实时湖仓的实战经验。

1507 0
|
算法 计算机视觉
|

【MATLAB 】VMD信号分解+FFT傅里叶频谱变换组合算法

【MATLAB 】VMD信号分解+FFT傅里叶频谱变换组合算法

1071 0
|
机器学习/深度学习 人工智能 弹性计算
|

阿里云GPU V100 4卡:高效AI推理的领航者

随着人工智能的发展,AI推理在各种应用中扮演着越来越重要的角色。本文将详细介绍如何利用阿里云GPU产品中的V100 4卡完成高效的AI推理。我们将涵盖什么是AI推理、V100 4卡的产品介绍、程序代码以及具体使用流程,带你一步步了解和应用这一先进的技术。

1373 0
|
人工智能 自然语言处理 前端开发
|

🔥🔥🔥数字人对话系统 Linly-Talker🔥🔥🔥

Linly-Talker是一个将大型语言模型与视觉模型相结合的智能AI系统,创建了一种全新的人机交互方式。它集成了各种技术,例如Whisper、Linly、微软语音服务和SadTalker会说话的生成系统。该系统部署在Gradio上,允许用户通过提供图像与AI助手进行交谈。用户可以根据自己的喜好进行自由的对话或内容生成。

1236 0
|
算法 计算机视觉
|

【MATLAB】GWO灰狼算法优化的VMD信号分解算法

【MATLAB】GWO灰狼算法优化的VMD信号分解算法

1319 0
|
算法 搜索推荐 Python
|

Python高级数据结构——图论算法(Graph Algorithms)

Python高级数据结构——图论算法(Graph Algorithms)

282 0
|
存储 算法 区块链
|

Python算法——Merkle树

Python算法——Merkle树

287 2