算精通_社区达人页

个人头像照片
算精通
已加入开发者社区2342

勋章 更多

个人头像照片
专家博主
专家博主
个人头像照片
星级博主
星级博主
个人头像照片
乘风问答官
乘风问答官
个人头像照片
技术博主
技术博主
个人头像照片
开发者认证勋章
开发者认证勋章
个人头像照片
一代宗师
一代宗师

成就

已发布1785篇文章
1780条评论
已回答17125个问题
316条评论
已发布0个视频
github地址

技术能力

兴趣领域
  • Java
  • C++
  • C语言
  • Python
  • Shell
  • Go
  • Kotlin
  • iOS开发
  • Android开发
  • 设计模式
擅长领域

北京阿里云ACE会长

暂无精选文章
暂无更多信息

2024年08月

  • 发表了文章 2025-02-07

    ubyte 数据集的制作【2月更文挑战第07天】

  • 发表了文章 2025-02-07

    10分钟搭建微信小程序ecs【2月更文挑战第07天】

  • 发表了文章 2025-02-07

    秒杀系统部署【2月更文挑战第07天】

  • 发表了文章 2025-01-23

    PAI ArtLab 平台红包制作【1月更文挑战第23天】

  • 发表了文章 2025-01-23

    一键创作 AI 有声绘本【1月更文挑战第23天】

  • 发表了文章 2025-01-23

    【1月更文挑战第23天】新年剧本动画截图

  • 发表了文章 2025-01-22

    【1月更文挑战第22天】

  • 发表了文章 2024-12-24

    【12月更文挑战第24天】

  • 发表了文章 2024-12-23

    【12月更文挑战第23天】

  • 发表了文章 2024-12-20

    【12月更文挑战第20天】

  • 发表了文章 2024-12-19

    【12月更文挑战第19天】

  • 发表了文章 2024-12-18

    【12月更文挑战第18天】

  • 发表了文章 2024-12-17

    【12月更文挑战第17天】

  • 发表了文章 2024-12-16

    【12月更文挑战第16天】

  • 发表了文章 2024-12-15

    【12月更文挑战第15天】

  • 发表了文章 2024-12-14

    【12月更文挑战第14天】

  • 发表了文章 2024-12-13

    【12月更文挑战第13天】

  • 发表了文章 2024-12-11

    【12月更文挑战第11天】

  • 发表了文章 2024-12-10

    【12月更文挑战第10天】

  • 发表了文章 2024-12-09

    【12月更文挑战第09天】

正在加载, 请稍后...
滑动查看更多
  • 回答了问题 2025-10-27

    如何训练属于自己的AI大模型呢?有没有大佬有相关文档参考学习下

    阿里云有很多实验案例 训练学习 魔搭社区 很多模型训练
    踩0 评论0
  • 回答了问题 2025-10-27

    做跨境电商,采集数据用python自己写还是用亮数据API?

    方案对比 Python自研爬虫 适合场景: 监控特定竞争对手网站(你知道的具体网站)采集公开的社交媒体讨论、论坛评价定制化的价格跟踪和库存监控预算有限,但技术能力较强 优势: 成本可控,只需服务器费用完全自定义,灵活度高数据采集频率和字段自主决定 挑战: 需要应对反爬虫机制维护成本高(网站改版就要调整)IP容易被封,需要代理池开发周期长 亮数据API 适合场景: 大规模平台数据(亚马逊、eBay等)需要稳定、合规的数据源快速启动项目,时间紧迫缺乏专业爬虫团队 优势: 开箱即用,快速上手数据稳定,避免封IP风险数据结构化,节省清洗时间相对更合规 挑战: 成本较高(按调用量收费)数据字段可能不完全符合需求依赖第三方服务 建议:混合方案 第一阶段:启动期(建议亮数据API) 先用亮数据API快速验证业务需求: 采集主要平台(亚马逊、eBay)的3C产品数据分析热销品类、价格区间、用户评价建立初步的数据分析模型 第二阶段:扩展期(混合使用) 在亮数据基础上,补充自研爬虫: 用Python监控特定竞争对手网站采集社交媒体和论坛的用户讨论跟踪行业新闻和趋势报告 第三阶段:优化期(根据效果调整) 评估数据价值: 如果数据带来的收益 > API成本,继续使用亮数据如果某些数据源价值有限,转为自研或停止采集 具体实施思路 先明确你要分析什么: 哪些产品的销量趋势?竞争对手的定价策略?用户关注哪些产品特性? 从亮数据开始: 选择适合的API套餐先跑通数据采集流程验证数据质量是否满足需求 逐步补充自研能力: 针对亮数据覆盖不足的网站开发定制化的监控工具 这样既能快速获得商业价值,又能保持长期的数据采集能力。
    踩0 评论0
  • 回答了问题 2025-10-27

    如何使用Python playwright采集网页数据不被检测到?

    关键防检测要点 指纹多样性:每次会话使用不同的 User-Agent、视窗大小、时区行为随机化:添加随机延迟、模拟人类鼠标移动和滚动自动化特征移除:清除 webdriver 特征和 Chrome 自动化标志IP 轮换:使用高质量代理池避免 IP 被封会话管理:定期更换浏览器上下文和 Cookie 这些措施能显著提高采集稳定性,但要注意遵守网站的 robots.txt 和服务条款。 1. 浏览器指纹伪装 import asyncio from playwright.async_api import async_playwright async def create_stealth_browser(): playwright = await async_playwright().start() # 使用 Chromium 并随机化视窗大小 browser = await playwright.chromium.launch( headless=False, # 建议使用非无头模式 args=[ '--disable-blink-features=AutomationControlled', '--disable-features=VizDisplayCompositor', '--no-first-run', '--no-default-browser-check', '--disable-default-apps', '--disable-dev-shm-usage', '--disable-accelerated-2d-canvas', '--no-zygote', f'--window-size={random.randint(1200, 1920)},{random.randint(800, 1080)}' ] ) # 创建上下文并设置高级伪装 context = await browser.new_context( viewport={'width': 1920, 'height': 1080}, user_agent='Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36', permissions=[], geolocation=None, locale='zh-CN', timezone_id='Asia/Shanghai', color_scheme='light', extra_http_headers={ 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8', 'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8', 'Accept-Encoding': 'gzip, deflate, br', } ) # 移除自动化特征 await context.add_init_script(''' Object.defineProperty(navigator, 'webdriver', { get: () => undefined, }); delete navigator.__proto__.webdriver; Object.defineProperty(navigator, 'plugins', { get: () => [1, 2, 3, 4, 5], }); window.chrome = { runtime: {}, }; ''') return browser, context 2. 人类行为模拟 import random import time from playwright.async_api import Page class HumanBehavior: @staticmethod async def random_delay(page: Page, min_delay=1, max_delay=3): '''随机延迟''' await page.wait_for_timeout(random.randint(min_delay * 1000, max_delay * 1000)) @staticmethod async def human_click(page: Page, selector: str): '''模拟人类点击行为''' element = await page.wait_for_selector(selector) # 随机移动鼠标到元素 box = await element.bounding_box() if box: x = box['x'] + box['width'] * random.uniform(0.3, 0.7) y = box['y'] + box['height'] * random.uniform(0.3, 0.7) # 分段移动鼠标 steps = random.randint(3, 8) for i in range(steps): progress = (i + 1) / steps current_x = x * progress + random.uniform(-5, 5) current_y = y * progress + random.uniform(-5, 5) await page.mouse.move(current_x, current_y) await page.wait_for_timeout(random.randint(50, 150)) await element.click() @staticmethod async def human_scroll(page: Page): '''模拟人类滚动行为''' scroll_steps = random.randint(3, 8) for _ in range(scroll_steps): scroll_amount = random.randint(200, 800) await page.evaluate(f'window.scrollBy(0, {scroll_amount})') await page.wait_for_timeout(random.randint(500, 2000)) @staticmethod async def human_typing(page: Page, selector: str, text: str): '''模拟人类输入''' await page.click(selector) for char in text: await page.type(selector, char, delay=random.uniform(50, 200)) await page.wait_for_timeout(random.randint(50, 150)) 3. 代理和会话管理 class AntiDetectionManager: def __init__(self, proxy_list=None): self.proxy_list = proxy_list or [] self.current_proxy_index = 0 def get_next_proxy(self): '''轮换代理''' if not self.proxy_list: return None proxy = self.proxy_list[self.current_proxy_index] self.current_proxy_index = (self.current_proxy_index + 1) % len(self.proxy_list) return proxy async def rotate_session(self, browser, context): '''轮换会话''' await context.close() proxy = self.get_next_proxy() new_context = await browser.new_context( user_agent=self.get_random_user_agent(), proxy=proxy ) # 重新应用伪装脚本 await new_context.add_init_script(self.get_stealth_script()) return new_context @staticmethod def get_random_user_agent(): '''获取随机 User-Agent''' user_agents = [ 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36', 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36' ] return random.choice(user_agents) 4. 完整的采集示例 async def stealthy_data_collection(url: str, selectors: dict): '''完整的防检测数据采集流程''' # 创建伪装浏览器 browser, context = await create_stealth_browser() page = await context.new_page() try: # 访问页面 await page.goto(url, wait_until='networkidle') # 模拟人类行为 await HumanBehavior.random_delay(page, 2, 5) await HumanBehavior.human_scroll(page) # 采集数据 data = {} for key, selector in selectors.items(): try: elements = await page.query_selector_all(selector) data[key] = [await element.text_content() for element in elements] await HumanBehavior.random_delay(page, 1, 2) except Exception as e: print(f'采集 {key} 时出错: {e}') data[key] = [] return data finally: await context.close() await browser.close() # 使用示例 async def main(): url = 'https://example.com/jobs' selectors = { 'job_titles': '.job-title', 'companies': '.company-name', 'locations': '.job-location', 'salaries': '.salary-range' } data = await stealthy_data_collection(url, selectors) print(data)
    踩0 评论0
  • 回答了问题 2025-10-27

    我想用AI采集数据,如何部署和使用MCP服务,比如brightdata-mcp?

    概括为以下几步: 步骤关键任务说明与提示1. 获取凭据注册Bright Data并获取API密钥在控制台找到API密钥和用户身份验证字符串。2. 配置MCP服务编写MCP服务器配置文件使用npx命令运行,在配置中填入你的API密钥和身份验证字符串。3. 集成与使用将MCP服务配置到你的AI应用或智能体中在智能体平台(如Trae)配置MCP服务,并设置提示词指导AI调用工具。 🛠️ 注意事项 数据合规性:Bright Data在数据抓取和存储过程中遵守全球数据隐私法规,使用起来相对合规安全。免费额度:Bright Data通常会提供免费试用额度,足够用于前期的测试和验证。 Bright Data MCP 服务的部署和使用示例: 1. 安装和配置 # 安装 MCP 客户端 npm install @modelcontextprotocol/sdk 2. 创建 MCP 服务器配置 // brightdata-mcp-server.js import { Server } from '@modelcontextprotocol/sdk/server/index.js'; import { StdioServerTransport } from '@modelcontextprotocol/sdk/server/stdio.js'; import { BrightDataClient } from 'brightdata-mcp-client'; const server = new Server({ name: 'brightdata-mcp', version: '1.0.0', }); // 初始化 Bright Data 客户端 const brightData = new BrightDataClient({ apiKey: process.env.BRIGHT_DATA_API_KEY, authentication: process.env.BRIGHT_DATA_AUTH }); // 注册搜索工具 server.setRequestHandler(ListToolsRequestSchema, async () => { return { tools: [ { name: 'search_jobs', description: '搜索海外职位数据', inputSchema: { type: 'object', properties: { query: { type: 'string', description: '搜索关键词' }, location: { type: 'string', description: '职位地点' }, limit: { type: 'number', description: '返回结果数量' } }, required: ['query'] } } ] }; }); 3. 使用示例 # 使用 Bright Data MCP 采集职位数据 import asyncio from mcp_client import McpClient async def collect_job_data(): client = McpClient('brightdata-mcp-server.js') # 搜索数据科学家职位 result = await client.call_tool( 'search_jobs', { 'query': '数据科学家', 'location': '美国', 'limit': 50 } ) # 处理返回的职位数据 jobs = result.content for job in jobs: print(f'职位: {job.title}') print(f'公司: {job.company}') print(f'地点: {job.location}') print('---') return jobs # 运行采集 asyncio.run(collect_job_data()) 4. 环境变量配置 # .env 文件 BRIGHT_DATA_API_KEY=your_api_key_here BRIGHT_DATA_AUTH=your_auth_string_here MCP_SERVER_PATH=./brightdata-mcp-server.js 这样你就可以通过 AI 模型直接调用 MCP 工具来采集和分析海外职位数据了。
    踩0 评论0
  • 回答了问题 2025-10-27

    钉钉如何根据 request id 查询接口异常信息

    这是官方提供的自助查询工具,信息最全,包括请求参数、返回结果和错误堆栈。 操作步骤: 登录开放平台后台: 访问 钉钉开放平台。使用企业管理员或子管理员(拥有应用管理权限)的钉钉账号扫码登录。 进入“运维管理”: 在左侧导航栏中,找到并点击 “运维管理” -> “日志查询”。 输入 Request ID 查询: 在日志查询页面,你会看到一个 “请求ID” 的输入框。将你从错误响应中获取的 requestid(例如:0A1234B5C6D7_1234567890)完整地复制粘贴进去。选择合适的时间范围(通常覆盖你发起请求的时间即可)。点击 “查询”。 分析查询结果: 查询成功后,你会看到一条或多条记录。点击记录查看详情,通常包含以下关键信息:请求详情:你调用 API 时使用的 URL、HTTP Method、请求头等。请求参数:你发送的 Body 参数,这对于排查参数错误至关重要。返回结果:钉钉服务器返回的完整 HTTP 状态码和响应体,其中就包含了具体的错误码和错误信息。错误堆栈:对于某些服务端异常,这里可能会显示更详细的堆栈信息,有助于钉钉技术支持分析问题。
    踩0 评论0
  • 回答了问题 2025-09-12

    Kimi-K2-Instruct 开了挂一般的推理和调用,底层魔法是什么?

    模型基于混合专家(MoE)架构构建,在知识处理、推理和编程等任务上表现优异,尤其优化了工具使用与API调用的性能。现支持通过云端API快速集成和部署,无需编码背景,大大降低了使用门槛。
    踩0 评论0
  • 回答了问题 2025-09-12

    资源部署与调用相关技术咨询

    ModelScope不会为每个模型长期占用一个GPU或一台服务器。 容器化封装:每一个模型都被封装成一个独立的、标准化的Docker容器。这个容器内包含了模型文件、依赖的环境(Python, PyTorch, TensorFlow等)、以及一套统一的API接口(例如基于HTTP的RESTful API)。这保证了模型环境的一致性,也实现了模型与模型之间的隔离。 按需加载:当用户点击“在线体验”时,调度系统并不会立即启动一个模型容器。而是先检查资源池中是否有该模型正在运行中的实例。 如果有(模型是“热”的):直接将用户的请求路由到该运行中的实例,用户几乎无感知地获得结果。 如果没有(模型是“冷”的):调度系统会从模型仓库中拉取对应的容器镜像,然后在资源池中找一个有空闲资源的服务器(CPU/GPU),启动这个模型的容器。这个过程需要一定时间(十几秒到一分钟,这就是为什么有时体验需要“等待加载”)。
    踩1 评论2
  • 回答了问题 2025-09-10

    阿里云数据库叫什么

    按数据模型可大致分为关系型、NoSQL、分析型与时序/图四类 关系型RDS MySQL / PostgreSQL / SQL Server / MariaDBPolarDB(云原生,兼容 MySQL/PostgreSQL)PolarDB-X(分布式关系型)NoSQLTair(兼容 Redis,内存型)MongoDB(文档型)Tablestore(宽表/键值,海量结构化)Lindorm(多模型,含宽表、时序、文件等)分析型(数据仓库)AnalyticDB(ADB,支持 MySQL/PostgreSQL 协议)时序与图TSDB(时序数据库)GDB(图数据库)
    踩0 评论0
  • 回答了问题 2025-09-10

    阿里云服务器多少钱一年?

    阿里云服务器的价格根据配置、类型和促销活动差异较大https://www.aliyun.com/price/detail?spm=5176.21213303.nav-v2-dropdown-menu-5.d_main_0.2ff72f3d4ot30H&scm=20140722.M_10513479._.V_1&saleProductCode=ecs 价格对比(以包年为例
    踩0 评论0
  • 回答了问题 2025-09-10

    阿里云服务器收费价格表最新

    产品定价中心 https://www.aliyun.com/price/detail?spm=5176.21213303.nav-v2-dropdown-menu-5.d_main_0.2ff72f3d4ot30H&scm=20140722.M_10513479._.V_1&saleProductCode=ecs 一台云服务器ECS包括计算、存储、网络、快照服务等计费项,每个计费项及其支持的计费模式具体如下图所示。
    踩0 评论0
  • 回答了问题 2025-08-21

    NAS文件系统支持自定义share_name吗

    阿里云 NAS根据阿里云开发者社区的信息,NAS 文件系统支持自定义 share_name。在阿里云的文件存储 NAS 服务中,你可以通过管理控制台或 API 创建和管理共享目录,并指定共享名称。vserver cifs share create -vserver vserver_name -share-name my_custom_share_name -path /path/to/directory 大多数 NAS 系统支持自定义 share_name,但具体操作方式取决于你使用的 NAS 解决方案。如果你使用的是阿里云 NAS、NetApp ONTAP 或其他支持自定义共享名称的系统,可以直接通过管理界面或命令行工具进行配置。
    踩0 评论0
  • 回答了问题 2025-08-21

    我正在搭建智能体,遇到下图问题,不知道怎么解决

    检查拼写错误:确保你输入的 API Key 拼写正确,注意区分大小写 检查前后空格:控制台复制的 API Key 可能含有前后空格 业务空间权限:如果你使用的是子业务空间的 API Key,请确认该 API Key 是否有权限访问你正在调用的模型或应用
    踩0 评论1
  • 回答了问题 2025-08-21

    将数组作为url参数

    对于大多数后端框架(如 Spring Boot、Express.js 等),传递数组参数的正确格式是:kemu=交通费&kemu=管理交通费这种方式会将 kemu 解析为一个数组,包含两个元素:['交通费', '管理交通费']。 前端如果你使用的是 HTML 表单或 JavaScript,确保你的代码能够正确生成这样的 URL。例如,如果你使用的是 JavaScript,可以这样生成 URL: let params = new URLSearchParams(); params.append('kemu', '交通费'); params.append('kemu', '管理交通费'); let url = `your-endpoint?${params.toString()}`; console.log(url); // 输出: your-endpoint?kemu=交通费&kemu=管理交通费 后端后端框架通常会自动将这种格式的参数解析为数组。例如,在 Spring Boot 中: @GetMapping('/your-endpoint') public String handleRequest(@RequestParam ListString> kemu) { System.out.println(kemu); // 输出: [交通费, 管理交通费] return 'success'; } 在 Express.js 中: app.get('/your-endpoint', (req, res) => { console.log(req.query.kemu); // 输出: [ '交通费', '管理交通费' ] res.send('success'); }); 使用 JSON 格式如果后端支持接收 JSON 格式的参数,可以将数组转换为 JSON 字符串,然后传递: let params = new URLSearchParams(); params.append('kemu', JSON.stringify(['交通费', '管理交通费'])); let url = `your-endpoint?${params.toString()}`; console.log(url); // 输出: your-endpoint?kemu=['交通费','管理交通费'] 使用 Base64 编码如果你的报表工具或框架确实无法正确处理数组参数,可以考虑将数组转换为 Base64 编码的字符串,然后传递: let kemuArray = ['交通费', '管理交通费']; let kemuBase64 = btoa(JSON.stringify(kemuArray)); let url = `your-endpoint?kemu=${kemuBase64}`; console.log(url); // 输出: your-endpoint?kemu=W3sidmFsdWUiOiLku4bku4Hku4Xku4Xku4Hku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku4Xku
    踩0 评论0
  • 回答了问题 2025-08-21

    本地登录docker镜像仓库时登录不了

    阿里云容器镜像服务(Container Registry)时,认证失败了 确保你使用的 AccessKey ID 和 AccessKey Secret 是正确 正确格式:使用以下命令登录阿里云容器镜像服务: docker login registry.cn-hangzhou.aliyuncs.com -u your-access-key-id> -p your-access-key-secret> 你可以尝试以下命令检查网络连通性: ping registry.cn-hangzhou.aliyuncs.com
    踩0 评论0
  • 回答了问题 2025-08-06

    使用dingtalk-jsapi的openDocument方法ios不显示文件

    iOS 端 dd.openDocument 出现空白页 / 提示“无网络”并不是网络真断了,而是 钉钉 iOS SDK 的 WebView 本身不支持在线预览 docx,且不会自动跳转到第三方 App;而 Android 会弹起系统应用,所以表现正常。 “安卓端仅支持端内预览 pdf,其他格式不支持端内访问;iOS 端只允许预览 pdf”。因此 docx 在 iOS 会直接显示空白或“无网络”。 // 1. 后端提供 /convertToPdf 接口 // 2. 前端拿到 pdf 地址后统一处理 dd.openDocument({ filePath: pdfUrl, // 必须是 pdf fileType: 'pdf' // 指定类型 });
    踩0 评论1
  • 回答了问题 2025-08-06

    GLM4.5 8-bit量化报错

    GLM4.5 目前 官方权重和代码都没有放出 FP8 版本,你看到的 raise ValueError(f'Unsupported quant_config: {quant_config}') 是因为:你传入的 quant_config={'quantmethod':'fp8'}(或 --quantization fp8)但 GLM4.5 的 modeling*.py 里 只登记了 ['awq','gptq','bnb','eetq'] 等量化方案,没有 'fp8' 这一项,于是被框架直接 ValueError 拦下来。换句话说——不是 GPU 不支持 FP8,而是模型代码还没写 FP8 分支。 改用 AWQ-INT4(已验证) vllm serve zai-org/glm-4.5-air-awq \ --quantization awq \ --tensor-parallel-size 2
    踩0 评论0
  • 回答了问题 2025-08-06

    DBeaver连接MaxCompute权限问题

    DBeaver 连 MaxCompute 时“看得到表却查不到数据”基本都是 数据通道(Tunnel Endpoint)网络不可达 导致的——连接元数据用的是 HTTP 80/443,查询数据走的是 Tunnel Endpoint 的 443,而你的机器/公司网络把后者拦截了。 先确认是网络还是权限在 DBeaver 里任意打开一个表 → 右键 “View Data” → 报错信息里如果同时出现ErrorCode=Local Error, ErrorMessage=...301 Moved Permanently...或java.net.UnknownHostException: tunnel-xxx.odps.aliyun.com说明 Tunnel Endpoint 域名被重定向或解析不到,跟 AK/SK 权限无关。 MaxCompute 控制台 → 项目列表 → 点击对应项目 → “网络” 页签公有云:形如 tunnel-xxx.odps.aliyuncs.com金融云/政务云:域名会带 vpc-、finance- 等前缀把域名复制出来,在当前机器上 ping / nslookup 一次如果解析不到, 本地 hosts 手动映射:把控制台显示的 Tunnel Endpoint IP 写到C:\Windows\System32\drivers\etc\hosts(Windows)或 /etc/hosts(mac/Linux)示例:100.118.x.x tunnel-xxx.odps.aliyuncs.com 让 443 端口能出去公司防火墙放行 tunnel-xxx.odps.aliyuncs.com:443或者给 DBeaver 配公司代理:“首选项 → 连接 → 网络 → 代理” 填上 HTTP/HTTPS 代理即可。
    踩0 评论0
  • 回答了问题 2025-08-06

    阿里云服务器计算型c9i是什么?性能怎么样?

    c9i = 最新一代计算型实例,采用阿里云自研 CIPU 架构 + Intel Xeon 6 “Granite Rapids” P-Core(全核 3.6 GHz、504 MB L3),CPU︰内存=1︰2,2–192 vCPU 任选,独享物理核无争抢,整机算力、AI、网络、存储和安全全部拉到当前阿里云 ECS 的顶配水平。性能速览• 计算:单核性能比上一代再提 20%,512-bit AMX 指令集让 AI 数据预处理快 3 倍。• 网络:最高 36 Gbps 基础带宽 + 50 Gbps 突发,1200 万 PPS,支持 eRDMA 和巨型帧。• 存储:NVMe ESSD 云盘,单盘 IOPS 可冲到 60 万,延迟 8 µs。• 安全:TDX 机密虚拟机 + vTPM 可信启动,硬件级隔离性能损耗 适用场景AI 推理/训练、实时数据库、高并发游戏前端、视频编解码、科学计算、大规模批处理等。价格参考(活动价)• 2 核 4 G 约 1686 元/年起• 8 核 16 G 约 6037 元/年起(券后最低 4527 元/年,折合 12 元/天)
    踩0 评论0
  • 提交了问题 2025-07-10

    这个选项在哪里,谁能找到

  • 回答了问题 2025-06-21

    MonkeyOCR怎么训练自定义数据集

    准备数据集数据收集:收集各种包含文本的文档图像,如 PDF、图片等,确保这些文档涵盖了自定义任务中可能出现的各种文本类型、字体、格式和布局等情况。数据标注:对于文档中的文本块、图片块、表格块等不同类型的元素,使用标注工具进行标注,明确每个块的类型和位置信息。如果有表格,还需要标注表格的结构信息,如行列数、单元格内容等。对于文本内容,可能需要进行转录,即将图像中的文字转换为可编辑的文本形式,作为标注的一部分。数据预处理格式转换:将收集到的各种格式的文档图像统一转换为模型可接受的格式,如常见的图像格式(如 JPEG、PNG 等)或特定的文档格式(如 PDF 转成图像序列)。数据增强:为了增加数据集的多样性,提高模型的泛化能力,可以对图像进行数据增强操作,如随机旋转、缩放、平移、添加噪声、调整亮度和对比度等。配置训练参数选择模型架构:根据任务需求和数据集特点,选择合适的 MonkeyOCR 模型架构或对其进行调整。例如,调整模型的层数、神经元数量等超参数。设置训练超参数:包括学习率、批量大小、训练轮数(epochs)、优化器类型等。这些参数的设置会影响模型的训练速度和最终性能,通常需要通过实验进行调整。
    踩0 评论0
正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息