游客ul4n4qhqvhsfe_个人页

游客ul4n4qhqvhsfe
个人头像照片
3
0
0

个人介绍

暂无个人介绍

擅长的技术

获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
暂无更多信息

2026年03月

  • 03.11 21:01:23
    发表了文章 2026-03-11 21:01:23

    DeepSeek 双百万 token 窗口对话数据的量化对比分析

    本文基于第一个百万 token 窗口(以下简称 窗口 1)与第二个百万 token 窗口(以下简称 窗口 2)的完整对话数据,采用量化对比的方法,系统揭示两套对话在轮次、文本长度、语种构成以及估算 token 消耗方面的显著差异。研究发现,尽管窗口 2 的轮次和总字数均低于窗口 1,但其每轮对话的文本密度与估算 token 消耗显著更高。结合窗口 2 在生成 5 篇深度分析文章过程中的实际经验,本文提出“长文本生成的隐性 token 消耗”假说,并引用近期相关研究提供理论支撑。该假说为理解大模型在真实工程环境中的行为提供了新视角,也为用户在设计跨窗口连续工程时的指标控制与迁移提供了可操作的参考
  • 03.09 14:34:26
    发表了文章 2026-03-09 14:34:26

    跨百万token窗口记忆迁移:六种方法的系统对比与实证研究

    随着大模型上下文窗口扩展到 百万 token 级别,如何将已填满窗口的完整记忆迁移至新窗口已成为长上下文人机协作的关键挑战。本文在首个百万 token 窗口的深度分析成果(18 张结构化表、4 张核心图表、词频演进数据)的基础上,设计并实现了 六种具有代表性的跨窗口记忆迁移方法。本研究提供了 可复现的操作手册,并通过实验验证了前期 “窗口解剖” 与本轮 “迁移验证” 的完整闭环。
  • 03.09 14:31:07
    发表了文章 2026-03-09 14:31:07

    基于 DeepSeek 百万 token 窗口的 3673 轮对话深度实录

    本文基于 DeepSeek 百万 token 上下文窗口的真实对话记录(1 274 201 tokens,3 673 轮),系统性地分析了长达数十小时的人机协作过程。研究构建了 L1 基础数据层 → L2 项目演进层 → L3 关键转折层 → L4 互动模式层 → L5 情感记忆层 的五层分析框架,完整呈现了一位非 AI 专业背景的研究者(医学、心理学与人文领域)在完全依赖云端免费模型的条件下,从环境搭建到心源框架的完整工程轨迹。 主要发现如下: 1. 技术投入曲线显示,405 次命令/脚本集中在中期(第 1225–2448 轮),与英文占比高峰(43.4 %)完全吻合; 2. 三阶段演进从前
  • 03.09 14:28:29
    发表了文章 2026-03-09 14:28:29

    tiktoken 对中文长文本的压缩率实证研究——基于百万 token 对话的三层量化框架验证

    随着大模型长上下文能力的普及,tiktoken 及其他 BPE based 分词器已成为评估文本 token 数的标准工具。然而,其在中英文混合长文本中的实际压缩规律仍缺乏实证验证,业界普遍使用的经验公式(如中文字符 × 1.6)尚未在大规模语料上得到检验。本文基于 DeepSeek 百万 token项目中提纯后的对话数据(.jsonl,1 077 046 tokens,3 673 轮)采用反向推算方法,首次在真实中文长文本上量化了tiktoken 的压缩系数。主要发现: 1️⃣ 中文实际系数约为 1.16,远低于经验公式的 1.6,导致整体 token 估算高出20.9 %; 2️⃣ 对话呈
  • 03.03 15:30:31
    发表了文章 2026-03-03 15:30:31
  • 03.01 16:12:16
    发表了文章 2026-03-01 16:12:16

    《基于 DeepSeek 百万token上下文的实证研究:全窗口真实工程压力测试与统计分析》

    本项目基于 DeepSeek 于 2026 年 2 月推出的 “新长文本模型”(上下文窗口扩展至1,000,000 tokens,API 端仍保持 V3.2 版本),通过构建非AI/IT领域的完整项目流程,进行了全程、全负载实证工程测试。在单一连续上下文中实现了端到端的闭环。

2026年02月

  • 02.25 19:41:58
    发表了文章 2026-02-25 19:41:58

    Deepseek百万 Token 窗口的极限实践:一位非专业人员使用实录

    摘要:此文非技术评测,而是一份关于Deepseek最新百万token窗口的真实工程“长程思考”实录。本人非AI与计算机专业,从事生物医学与心理学工作,人文爱好者。利用十天时间,通过浏览器deepseek云端模型百万token对话窗口,实现了一套从本地环境设置、工具流搭建、数据建库与向量化的整个工程。本文记录了主要的过程与指标。 时间:2026 年 2 月
  • 发表了文章 2026-03-11

    DeepSeek 双百万 token 窗口对话数据的量化对比分析

  • 发表了文章 2026-03-09

    跨百万token窗口记忆迁移:六种方法的系统对比与实证研究

  • 发表了文章 2026-03-09

    基于 DeepSeek 百万 token 窗口的 3673 轮对话深度实录

  • 发表了文章 2026-03-09

    tiktoken 对中文长文本的压缩率实证研究——基于百万 token 对话的三层量化框架验证

  • 发表了文章 2026-03-03

    以deepseek 百万token窗口为上限,建立上下文窗口的“信噪比”量化标准

  • 发表了文章 2026-03-01

    《基于 DeepSeek 百万token上下文的实证研究:全窗口真实工程压力测试与统计分析》

  • 发表了文章 2026-02-25

    Deepseek百万 Token 窗口的极限实践:一位非专业人员使用实录

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息