测试技术

首页 标签 测试技术
# 测试技术 #
关注
74590内容
10B击败200B!阶跃星辰10B视觉语言SOTA模型开源
阶跃星辰发布开源多模态小模型Step3-VL-10B,仅10B参数却媲美百亿级大模型,在视觉感知、逻辑推理、数学竞赛等任务中达同规模SOTA,支持端侧部署,推动智能终端交互革新。
全网最完整 GEO 优化落地指南(万字实操版)
GEO是让AI在回答时主动推荐品牌的优化策略。品牌若不被推荐,常因内容未被AI抓取、缺乏信任或未切中用户问题。企业可通过诊断现状、优化结构化内容、精准分发与持续监测五步法系统实施。B2B企业借此能在采购全链路中高效触达客户,短期即可提升AI提及率与销售转化。这将是伴随AI搜索发展的长期趋势,值得尽早布局。
|
1小时前
| |
大模型应用:基于本地大模型的中文命名实体识别技术实践与应用
本文探讨了基于本地部署的大模型在命名实体识别(NER)任务中的应用优势。通过通用领域中文NER和医疗领域专用NER两个典型案例,展示了本地大模型在数据安全、响应速度和识别精度方面的显著优势。通用领域采用RoBERTa模型在CLUENER2020数据集上微调,可识别10类实体;医疗领域基于BERT架构的专用模型,在CMEEE数据集上训练,准确识别疾病、症状等医疗实体。本地部署不仅满足合规要求,还能通过领域自适应提升专业文本识别效果,为各行业智能化转型提供可靠技术方案。
|
15小时前
|
警惕AI智能体“浮光行为”:一场关于职业生存的深度博弈与新蓝海坐标
2024年AI Agent爆发,但“浮光行为”泛滥:表面流畅却缺乏深度执行。本文揭示客服、写作、编程中的伪智能现象,预警低端岗位危机,提出向“智能体医生”“目标架构师”等高阶角色转型的三大路径,助你在AI洗牌中成为穿透表象的“深潜者”。
Playwright与Cucumber集成:实现行为驱动开发(BDD)实践
当业务方看不懂代码,而技术实现的测试又偏离初衷时,团队协作便出现了断层。将Playwright与BDD结合,正是为了弥合这一鸿沟:用自然语言描述测试场景,让产品、测试与开发共享同一份可执行的“需求文档”。本文将通过从环境搭建到CI集成的完整实战,带你体验如何用BDD提升E2E测试的可读性与协作效率,真正让自动化测试成为团队的共同语言。
墨迹天气APP自动化测试智能体批量执行方案丨爱测智能体测试平台
APP测试陷入手工执行低效、自动化难落地的困境。爱测智能体测试平台创新提出“不改用例,也能自动执行”:直接理解并运行现有手工用例,支持页面理解、动态判断与完整流程(含数据准备),已在墨迹天气真实场景验证。让测试人员回归设计与质量决策。
Playwright测试用例依赖管理:独立运行与状态共享策略
当Playwright测试套件从300个扩展到1000个用例时,我们遇到了最棘手的“随机失败”问题。根源并非网络或工具,而是测试用例间难以察觉的“暗耦合”。本文将通过实战案例,分享如何避免测试依赖陷阱,从完全独立与完全共享两个极端中,找到确保测试稳定性与执行效率的平衡之道。
|
21小时前
|
HCL AppScan Standard 10.10.0 for Windows x64 - Web 应用程序安全测试
HCL AppScan Standard 10.10.0 for Windows x64 - Web 应用程序安全测试
PPO 为何成了大模型微调“最后的底牌”?一篇真正能跑通的工程实战指南
PPO为何成大模型微调“最后底牌”?本文直击工程痛点:揭秘reward飙升却胡说八道、拍马屁失常识等训崩现象;剖析PPO通过clip机制限幅更新、KL约束防退化的核心稳定性;给出SFT打底、Reward Model选型、参数调试等实战要诀——不讲理论,只教如何真正跑通。
免费试用