SEMIKONG:专为半导体领域设计的大型语言模型,支持制造优化、辅助 IC 设计等半导体制造任务

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
简介: SEMIKONG 是专为半导体行业定制的大型语言模型,能够优化制造过程、辅助 IC 设计,并整合专家知识,推动领域特定 AI 模型的研究与应用。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

  1. 领域定制:专为半导体行业设计,解决制造和设计中的复杂问题。
  2. 功能强大:支持制造过程优化、IC 设计辅助和专家知识整合。
  3. 技术先进:基于大规模领域特定数据集,结合预训练和微调技术。

正文(附运行示例)

SEMIKONG 是什么

公众号: 蚝油菜花 - semikong

SEMIKONG 是专为半导体行业定制的大型语言模型(LLM),由 Aitomatic、FPT Software 和东京电子有限公司联合推出。该模型基于深入的领域知识,旨在解决半导体制造和设计中的独特挑战,如复杂的物理和化学问题。

SEMIKONG 通过整合专家知识和优化预训练过程,提供了能够专家级理解刻蚀问题的基础模型。相较于通用 LLMs,SEMIKONG 在半导体制造任务中展现出更优的性能,为公司或工具特定的专有模型开发奠定了基础,推动了领域特定 AI 模型的进一步研究和应用。

SEMIKONG 的主要功能

  • 理解半导体专业知识:能够理解半导体制造和设计中的复杂问题,尤其是在刻蚀领域。
  • 优化制造过程:基于学习大量的半导体相关数据,协助优化半导体制造过程,如参数优化、异常检测和预测性维护。
  • 辅助 IC 设计:能够辅助集成电路(IC)设计任务,包括设计规则检查、布局生成和设计空间探索。
  • 提高 AI 解决方案性能:基于微调预训练的大型语言模型,提高 AI 驱动的半导体制造任务的性能。
  • 专家知识整合:引入一个框架,整合专家知识推进领域特定 AI 模型的评估过程。

SEMIKONG 的技术原理

  • 数据策划:开发始于大规模、高质量的半导体领域特定文本数据集的策划,包括技术书籍、论文和专利。
  • 预训练和微调:用预训练和微调的方法训练模型,预训练阶段用特定领域的数据增强模型的领域知识,微调阶段让模型执行特定的任务。
  • 领域本体论:与半导体专家合作,构建系统化的半导体制造过程本体论,有助于 AI 研究人员更有效地开发领域特定的 AI 模型。
  • 专家反馈循环:基于专家反馈循环,用专家评估模型生成的答案,生成评估标准和高质量的基准测试。
  • 模型量化和适配:在预训练和微调之后,进行模型量化和适配处理,便于模型部署。

如何运行 SEMIKONG

1. 准备环境

首先,确保已安装 Python 3.10 或更高版本,并克隆 SEMIKONG 的 GitHub 仓库:

git clone https://github.com/aitomatic/semikong.git
cd semikong
pip install -r requirements.txt

2. 下载模型

从 Hugging Face 下载 SEMIKONG 模型的权重和分词器:

# 示例:下载 SEMIKONG-8B-Instruct 模型
from transformers import AutoModelForCausalLM, AutoTokenizer

model_path = 'pentagoniac/SEMIKONG-8B-Instruct'
tokenizer = AutoTokenizer.from_pretrained(model_path, use_fast=False)
model = AutoModelForCausalLM.from_pretrained(model_path, device_map="auto", torch_dtype='auto').eval()

3. 执行推理

使用以下代码进行推理:

messages = [{
   "role": "user", "content": "hi"}]
input_ids = tokenizer.apply_chat_template(conversation=messages, tokenize=True, add_generation_prompt=True, return_tensors='pt')
output_ids = model.generate(input_ids.to('cuda'))
response = tokenizer.decode(output_ids[0][input_ids.shape[1]:], skip_special_tokens=True)
print(response)

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
XML 数据格式 Python
Labelimg标注自己的数据集,及如何划分训练集和验证集,应用于Yolov5
Labelimg标注自己的数据集,及如何划分训练集和验证集,应用于Yolov5
3511 0
|
9月前
|
人工智能 自然语言处理 开发工具
Languine:专为开发者设计的 AI 多语言翻译工具,快速生成100+种语言的准确翻译,简化应用程序的 i18n 国际化配置
Languine 是一款面向开发者的 AI 翻译工具,支持 100+ 种语言,自动化翻译流程,提升多语言应用开发效率。
339 15
Languine:专为开发者设计的 AI 多语言翻译工具,快速生成100+种语言的准确翻译,简化应用程序的 i18n 国际化配置
|
存储 Linux 虚拟化
超详细!VMware虚拟机迁移操作教程
为VMware虚拟机迁移提供从0到1的详尽操作指导
1200 0
超详细!VMware虚拟机迁移操作教程
|
5月前
|
存储 机器学习/深度学习 人工智能
多模态RAG实战指南:完整Python代码实现AI同时理解图片、表格和文本
本文探讨了多模态RAG系统的最优实现方案,通过模态特定处理与后期融合技术,在性能、准确性和复杂度间达成平衡。系统包含文档分割、内容提取、HTML转换、语义分块及向量化存储五大模块,有效保留结构和关系信息。相比传统方法,该方案显著提升了复杂查询的检索精度(+23%),并支持灵活升级。文章还介绍了查询处理机制与优势对比,为构建高效多模态RAG系统提供了实践指导。
1506 0
多模态RAG实战指南:完整Python代码实现AI同时理解图片、表格和文本
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
Dolphin:40语种+22方言!清华联合海天瑞声推出的语音识别大模型,识别精度超Whisper两代
Dolphin是清华大学与海天瑞声联合研发的语音识别大模型,支持40种东方语言和22种中文方言,采用CTC-Attention混合架构,词错率显著低于同类模型。
3083 50
Dolphin:40语种+22方言!清华联合海天瑞声推出的语音识别大模型,识别精度超Whisper两代
|
9月前
|
人工智能 JSON 自然语言处理
Jina Reader:一键将网页内容转为适合 LLM 处理的文本格式,自动抓取和清洗网页内容,支持多种输出格式
Jina Reader 是一款由 Jina AI 推出的开源工具,能够将网页内容快速转换为适合大型语言模型(LLMs)处理的纯文本格式,支持多种输出格式和动态内容处理。
1319 20
Jina Reader:一键将网页内容转为适合 LLM 处理的文本格式,自动抓取和清洗网页内容,支持多种输出格式
|
9月前
|
存储 Kubernetes 安全
k8s存储类型:emptyDir、hostPath、nfs、pvc及存储类storageclass的静态/动态创建pv
Kubernetes提供了多种存储类型,满足不同的应用需求。`emptyDir`和 `hostPath`适用于临时和宿主机存储需求,`nfs`适用于共享存储,`PersistentVolumeClaim`和 `StorageClass`实现了持久存储的灵活管理。通过理解和配置这些存储类型,可以有效提升Kubernetes集群的存储管理能力。
412 13
|
11月前
|
开发者 异构计算
现在,一行命令使用Ollama运行任意魔搭GGUF模型
为了让开发者更方便地把这些模型用起来,社区最近支持了Ollama框架和ModelScope平台的链接,通过简单的 ollama run命令,就能直接加载运行ModelScope模型库上的GGUF模型。
|
9月前
|
人工智能 API
MMedAgent:专为医疗领域设计的多模态 AI 智能体,支持医学影像处理、报告生成等多种医疗任务
MMedAgent 是专为医疗领域设计的多模态AI智能体,支持多种医疗任务,包括医学影像处理、报告生成等,性能优于现有开源方法。
521 19
MMedAgent:专为医疗领域设计的多模态 AI 智能体,支持医学影像处理、报告生成等多种医疗任务

热门文章

最新文章