在人工智能领域,关于通用大模型VS垂直大模型,在选择上我并不倾向于任何一方,而是会根据实际的场景来选择具体的大模型。
通用大模型
通用大模型是指那些设计用来处理多种任务和数据类型的大型人工智能模型。它们通常在大规模的多领域数据集上进行训练,以学习到广泛的知识和技能,从而具备跨领域的泛化能力。通用大模型通常参数量巨大,在百万到数十亿级别,这使得它们能够捕捉和学习数据中的复杂模式和细微差别。同时能够处理多种数据类型,包括文本、图像、声音等多种模态的数据,实现跨模态的理解和生成。通用大模型能够应用于各种不同的场景和任务,如自然语言处理、计算机视觉、语音识别等。因此对于通用大模型而言,主打的一个就是跨行业、跨专业、上知天文下知地理、无所不能这样的一个角色。不管你问通用大模型什么问题,他总能给到你他认为符合你要求的答案,就比如我们日常会用到的通义千问、文心一言等。在广度上,通用大模型更具优势,当你对于当前所需模型的专业领域边界不是很清晰的时候,选择通用大模型无疑是一个正确的选择。
垂直大模型
再来说说垂直大模型,垂直大模型顾名思义就是在一个行业或者一个领域垂直深挖,指针对特定行业或领域定制的大型人工智能模型。它们通常基于对该领域有深入理解的专家设计和训练,以确保模型能够满足该领域的特殊需求。那么带来的往往就是能提供更专业的回答或者解决方案。比如在医药领域的垂直大模型深耕医疗领域,提供专业解答。或者是法律行业的垂直大模型,比如通义法睿,可以为用户提供更专业的咨询服务。当然也不是说通用大模型就不能提供这些场景的咨询服务,而是说垂直大模型基于当前行业的训练内容更丰富,提供的专业咨询也更精准一些。
因此,对于通用大模型或者垂直大模型,更倾向于哪一方不取决于个人想法,而是取决于用户需要。