北大李戈团队提出大模型单测生成新方法，显著提升代码测试覆盖率-阿里云开发者社区

北大李戈团队提出大模型单测生成新方法，显著提升代码测试覆盖率

2024-10-11 119

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【10月更文挑战第1天】北京大学李戈教授团队提出了一种名为“统一生成测试”的创新方法，有效提升了大模型如GPT-2和GPT-3在单一测试中的代码生成覆盖率，分别从56%提升至72%和从61%提升至78%。这种方法结合了模糊测试、变异测试和生成对抗网络等多种技术，克服了传统测试方法的局限性，在大模型测试领域实现了重要突破，有助于提高系统的可靠性和安全性。然而，该方法的实现复杂度较高且实际应用效果仍需进一步验证。论文可从此链接下载：【https://drive.weixin.qq.com/s?k=ACAAewd0AA48Z2kXrJ】

北京大学李戈教授领导的研究团队最近提出了一种创新的方法，用于提高大模型在单一测试中的代码生成覆盖率。这一研究成果在学术界引起了广泛关注，并被认为是大模型测试领域的一项重要突破。

该研究团队提出了一种名为"统一生成测试"的方法，旨在解决现有大模型测试方法在覆盖率方面的局限性。传统的大模型测试方法通常依赖于随机生成测试用例或基于搜索的策略，但这些方法往往无法全面覆盖大模型的代码生成能力。相比之下，统一生成测试方法通过结合多种测试技术，包括模糊测试、变异测试和生成对抗网络，显著提高了测试的覆盖率。

研究团队在实验中使用了多个大模型进行测试，包括GPT-2、GPT-3和T5等。结果显示，统一生成测试方法能够显著提高这些模型在单一测试中的代码生成覆盖率。例如，对于GPT-2模型，统一生成测试方法将代码生成覆盖率从56%提高到72%，而对于GPT-3模型，覆盖率从61%提高到78%。

这一研究成果对于大模型的测试和验证具有重要意义。首先，它提供了一种更全面、更有效的测试方法，可以帮助开发人员更好地评估大模型的代码生成能力。其次，通过提高测试覆盖率，可以减少大模型在实际应用中的错误和漏洞，提高系统的可靠性和安全性。

然而，该研究也存在一些局限性。首先，统一生成测试方法的实现复杂度较高，需要结合多种测试技术，这可能会增加测试的成本和时间。其次，尽管该方法在实验中取得了较好的结果，但在实际应用中的效果还有待进一步验证。此外，由于大模型的复杂性和多样性，如何将统一生成测试方法应用于不同类型的大模型也是一个挑战。

论文下载链接：https://drive.weixin.qq.com/s?k=ACAAewd0AA48Z2kXrJ

北大李戈团队提出大模型单测生成新方法，显著提升代码测试覆盖率

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

直播

下载

镜像站

技术资料

北大李戈团队提出大模型单测生成新方法，显著提升代码测试覆盖率

热门文章

最新文章

相关课程

相关电子书

相关实验场景