游客ul4n4qhqvhsfe_个人页

游客ul4n4qhqvhsfe
个人头像照片
3
0
0

个人介绍

暂无个人介绍

擅长的技术

获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
暂无更多信息

2026年06月

  • 06.08 09:30:39
    发表了文章 2026-06-08 09:30:39

    可计算元认知文本分析:跨领域语义漂移的多层解释框架与实证研究

    背景:跨领域语义漂移(semantic drift)是自然语言处理与知识融合中的核心障碍。前期研究已构建了三种量化手段——Jaccard(结构漂移)、Word2Vec(语义漂移)与 SBERT(句子级漂移),但仅提供“漂移多少”的数值,缺乏可解释性与因果解释。 结论:四层框架实现了从“是否漂移” → “漂移多少” → “为何漂移” → “如何漂移”的完整链路,为跨领域知识对话提供了量化 解释 因果 句子四维支撑。该框架可推广至其他多学科语料,助力AI Human 协同的可解释知识融合。 关键词:语义漂移;可解释性;大语言模型(LLM);因果推断;SBERT;可计算元认知
  • 05.25 18:13:51
    发表了文章 2026-05-25 18:13:51

    可计算元认知文本分析:十个癌症研究领域的统一知识图谱与时间演化分析

    本研究首次构建了癌症研究的跨领域动态知识图谱,定量展示了“治疗”作为跨学科连接核心、2022 2025年的整合高峰与2026年的分化,以及人文社科在生物医学中的结构洞。该框架初步验证了可计算的元医学:通过LLM驱动的语义对齐、可复现的网络分析与时间演化监测,使得学科间的“断裂带”得以显式化、可量化、可干预。框架具备跨疾病迁移能力(心血管、糖尿病、阿尔茨海默病等),为研究前沿预测、跨学科发现与政策制定提供了可操作的工具。 关键词:可计算元认知;跨领域知识图谱;时间演化;社区检测;元医学;大语言模型
  • 05.20 09:05:09
    发表了文章 2026-05-20 09:05:09

    可计算元认知文本分析:癌症社会科学研究语义基线的构建与边界信号检测

    本研究首次为癌症社会科学提供了可计算的语义基线,揭示该领域以不平等、社会决定因素与健康素养为核心的政策导向特征,并量化了不平等、歧视、健康素养等边界信号的学术覆盖率。相较于传统综述,本工作从“学科如何说话”的元认知视角提供结构化、可复现、跨学科对齐的计量基准,为健康公平监测、政策评估与跨领域协同提供了实证工具。 关键词:可计算元认知;语义基线;边界信号;癌症社会科学;健康不平等;文本分析

2026年05月

  • 05.04 15:28:02
    发表了文章 2026-05-04 15:28:02

    可计算元认知文本分析:肿瘤生物物理学语义基线的构建与边界信号检测

    本研究首次为肿瘤生物物理学提供可计算的语义基线,揭示该学科围绕力学信号与细胞行为的核心知识结构,并量化了力学/黏附/成像阈值作为学科边界信号。相比传统综述,本工作从“学科如何说话”的元认知视角实现了可复现、可扩展、跨层次对齐的计量基准,为肿瘤生物物理学在精准医学、组织工程及材料科学中的跨学科协作提供了方法学支撑。

2026年04月

  • 04.29 08:41:10
    发表了文章 2026-04-29 08:41:10

    可计算元认知文本分析在癌症心理学中的应用:语义基线构建与边界信号检测

    癌症心理学是肿瘤医学与行为科学交叉的关键学科,其文本的语言特征、概念结构与方法学偏好尚缺乏系统、可复现的量化描述。传统综述依赖人工归纳,难以捕获学科“如何说话”的元认知层面。基于可计算元认知文本分析框架,2021 2026年间的1,004篇开放获取癌症心理学全文进行语义基线构建,并检测学科内部的统计与临床“边界信号”。本研究首次为癌症心理学提供可计算的语义基线和边界信号检测框架,证实该学科围绕“心理社会支持”与“情绪困扰”形成的高度整合知识结构,并揭示效应量报告不足的系统性缺陷。通过“主观向量+算法”的人 机协同模式,可为跨学科对齐、科研评价以及指南制定提供可复现的量化基准。
  • 04.18 14:01:47
    发表了文章 2026-04-18 14:01:47

    可计算元认知文本分析在细胞生物学中的语义基线构建与边界信号检测

    背景:科学研究中的“范式”往往是隐性的、难以量化的;而研究论文正是范式的全部语言载体。 目的:构建细胞生物学的语义基线,并系统检测该领域的边界信号(阈值、开关、检查点等),验证可计算元认知框架在生物学中的适用性。 结论:本文首次在细胞生物学构建了系统的语义基线,证实了可计算元认知框架的跨学科可迁移性;所得到的动词 术语 边界词库为后续流行病学、临床医学等领域的跨域对齐提供了可复用的基准。

2026年03月

  • 03.11 21:01:23
    发表了文章 2026-03-11 21:01:23

    DeepSeek 双百万 token 窗口对话数据的量化对比分析

    本文基于第一个百万 token 窗口(以下简称 窗口 1)与第二个百万 token 窗口(以下简称 窗口 2)的完整对话数据,采用量化对比的方法,系统揭示两套对话在轮次、文本长度、语种构成以及估算 token 消耗方面的显著差异。研究发现,尽管窗口 2 的轮次和总字数均低于窗口 1,但其每轮对话的文本密度与估算 token 消耗显著更高。结合窗口 2 在生成 5 篇深度分析文章过程中的实际经验,本文提出“长文本生成的隐性 token 消耗”假说,并引用近期相关研究提供理论支撑。该假说为理解大模型在真实工程环境中的行为提供了新视角,也为用户在设计跨窗口连续工程时的指标控制与迁移提供了可操作的参考
  • 03.09 14:31:07
    发表了文章 2026-03-09 14:31:07

    基于 DeepSeek 百万 token 窗口的 3673 轮对话深度实录

    本文基于 DeepSeek 百万 token 上下文窗口的真实对话记录(1 274 201 tokens,3 673 轮),系统性地分析了长达数十小时的人机协作过程。研究构建了 L1 基础数据层 → L2 项目演进层 → L3 关键转折层 → L4 互动模式层 → L5 情感记忆层 的五层分析框架,完整呈现了一位非 AI 专业背景的研究者(医学、心理学与人文领域)在完全依赖云端免费模型的条件下,从环境搭建到心源框架的完整工程轨迹。 主要发现如下: 1. 技术投入曲线显示,405 次命令/脚本集中在中期(第 1225–2448 轮),与英文占比高峰(43.4 %)完全吻合; 2. 三阶段演进从前
  • 03.09 14:28:29
    发表了文章 2026-03-09 14:28:29

    tiktoken 对中文长文本的压缩率实证研究——基于百万 token 对话的三层量化框架验证

    随着大模型长上下文能力的普及,tiktoken 及其他 BPE based 分词器已成为评估文本 token 数的标准工具。然而,其在中英文混合长文本中的实际压缩规律仍缺乏实证验证,业界普遍使用的经验公式(如中文字符 × 1.6)尚未在大规模语料上得到检验。本文基于 DeepSeek 百万 token项目中提纯后的对话数据(.jsonl,1 077 046 tokens,3 673 轮)采用反向推算方法,首次在真实中文长文本上量化了tiktoken 的压缩系数。主要发现: 1️⃣ 中文实际系数约为 1.16,远低于经验公式的 1.6,导致整体 token 估算高出20.9 %; 2️⃣ 对话呈
  • 03.03 15:30:31
    发表了文章 2026-03-03 15:30:31
  • 03.01 16:12:16
    发表了文章 2026-03-01 16:12:16

    《基于 DeepSeek 百万token上下文的实证研究:全窗口真实工程压力测试与统计分析》

    本项目基于 DeepSeek 于 2026 年 2 月推出的 “新长文本模型”(上下文窗口扩展至1,000,000 tokens,API 端仍保持 V3.2 版本),通过构建非AI/IT领域的完整项目流程,进行了全程、全负载实证工程测试。在单一连续上下文中实现了端到端的闭环。

2026年02月

  • 02.25 19:41:58
    发表了文章 2026-02-25 19:41:58

    Deepseek百万 Token 窗口的极限实践:一位非专业人员使用实录

    摘要:此文非技术评测,而是一份关于Deepseek最新百万token窗口的真实工程“长程思考”实录。本人非AI与计算机专业,从事生物医学与心理学工作,人文爱好者。利用十天时间,通过浏览器deepseek云端模型百万token对话窗口,实现了一套从本地环境设置、工具流搭建、数据建库与向量化的整个工程。本文记录了主要的过程与指标。 时间:2026 年 2 月
  • 发表了文章 2026-06-10

    可计算元认知文本分析:跨领域语义漂移的多层解释框架与实证研究

  • 发表了文章 2026-06-10

    可计算元认知文本分析:十个癌症研究领域的统一知识图谱与时间演化分析

  • 发表了文章 2026-06-10

    可计算元认知文本分析:癌症社会科学研究语义基线的构建与边界信号检测

  • 发表了文章 2026-05-04

    可计算元认知文本分析:肿瘤生物物理学语义基线的构建与边界信号检测

  • 发表了文章 2026-04-29

    可计算元认知文本分析在癌症心理学中的应用:语义基线构建与边界信号检测

  • 发表了文章 2026-04-18

    可计算元认知文本分析在细胞生物学中的语义基线构建与边界信号检测

  • 发表了文章 2026-03-11

    DeepSeek 双百万 token 窗口对话数据的量化对比分析

  • 发表了文章 2026-03-09

    基于 DeepSeek 百万 token 窗口的 3673 轮对话深度实录

  • 发表了文章 2026-03-09

    tiktoken 对中文长文本的压缩率实证研究——基于百万 token 对话的三层量化框架验证

  • 发表了文章 2026-03-03

    以deepseek 百万token窗口为上限,建立上下文窗口的“信噪比”量化标准

  • 发表了文章 2026-03-01

    《基于 DeepSeek 百万token上下文的实证研究:全窗口真实工程压力测试与统计分析》

  • 发表了文章 2026-02-25

    Deepseek百万 Token 窗口的极限实践:一位非专业人员使用实录

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息