SEMIKONG:专为半导体领域设计的大型语言模型,支持制造优化、辅助 IC 设计等半导体制造任务

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
简介: SEMIKONG 是专为半导体行业定制的大型语言模型,能够优化制造过程、辅助 IC 设计,并整合专家知识,推动领域特定 AI 模型的研究与应用。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

  1. 领域定制:专为半导体行业设计,解决制造和设计中的复杂问题。
  2. 功能强大:支持制造过程优化、IC 设计辅助和专家知识整合。
  3. 技术先进:基于大规模领域特定数据集,结合预训练和微调技术。

正文(附运行示例)

SEMIKONG 是什么

公众号: 蚝油菜花 - semikong

SEMIKONG 是专为半导体行业定制的大型语言模型(LLM),由 Aitomatic、FPT Software 和东京电子有限公司联合推出。该模型基于深入的领域知识,旨在解决半导体制造和设计中的独特挑战,如复杂的物理和化学问题。

SEMIKONG 通过整合专家知识和优化预训练过程,提供了能够专家级理解刻蚀问题的基础模型。相较于通用 LLMs,SEMIKONG 在半导体制造任务中展现出更优的性能,为公司或工具特定的专有模型开发奠定了基础,推动了领域特定 AI 模型的进一步研究和应用。

SEMIKONG 的主要功能

  • 理解半导体专业知识:能够理解半导体制造和设计中的复杂问题,尤其是在刻蚀领域。
  • 优化制造过程:基于学习大量的半导体相关数据,协助优化半导体制造过程,如参数优化、异常检测和预测性维护。
  • 辅助 IC 设计:能够辅助集成电路(IC)设计任务,包括设计规则检查、布局生成和设计空间探索。
  • 提高 AI 解决方案性能:基于微调预训练的大型语言模型,提高 AI 驱动的半导体制造任务的性能。
  • 专家知识整合:引入一个框架,整合专家知识推进领域特定 AI 模型的评估过程。

SEMIKONG 的技术原理

  • 数据策划:开发始于大规模、高质量的半导体领域特定文本数据集的策划,包括技术书籍、论文和专利。
  • 预训练和微调:用预训练和微调的方法训练模型,预训练阶段用特定领域的数据增强模型的领域知识,微调阶段让模型执行特定的任务。
  • 领域本体论:与半导体专家合作,构建系统化的半导体制造过程本体论,有助于 AI 研究人员更有效地开发领域特定的 AI 模型。
  • 专家反馈循环:基于专家反馈循环,用专家评估模型生成的答案,生成评估标准和高质量的基准测试。
  • 模型量化和适配:在预训练和微调之后,进行模型量化和适配处理,便于模型部署。

如何运行 SEMIKONG

1. 准备环境

首先,确保已安装 Python 3.10 或更高版本,并克隆 SEMIKONG 的 GitHub 仓库:

git clone https://github.com/aitomatic/semikong.git
cd semikong
pip install -r requirements.txt

2. 下载模型

从 Hugging Face 下载 SEMIKONG 模型的权重和分词器:

# 示例:下载 SEMIKONG-8B-Instruct 模型
from transformers import AutoModelForCausalLM, AutoTokenizer

model_path = 'pentagoniac/SEMIKONG-8B-Instruct'
tokenizer = AutoTokenizer.from_pretrained(model_path, use_fast=False)
model = AutoModelForCausalLM.from_pretrained(model_path, device_map="auto", torch_dtype='auto').eval()

3. 执行推理

使用以下代码进行推理:

messages = [{
   "role": "user", "content": "hi"}]
input_ids = tokenizer.apply_chat_template(conversation=messages, tokenize=True, add_generation_prompt=True, return_tensors='pt')
output_ids = model.generate(input_ids.to('cuda'))
response = tokenizer.decode(output_ids[0][input_ids.shape[1]:], skip_special_tokens=True)
print(response)

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
8月前
|
传感器 算法 机器人
在实用化人形机器人控制系统中深入应用FPGA的框架设计(基于特斯拉Optimus-Gen2的硬件系统)
针对实用化人形机器人的控制系统,以深入应用FPGA技术为指导思想做了一个框架设计,提供一个具象化的设计实例、参考技术方案,协助各研发团队及相关决策者了解这一技术思路的价值。 进而,笔者希望读者将这个框架设计与《在实用化人形机器人研发流程中深入应用FPGA技术的流程图》结合起来进行分析、思考,希望: 进一步降低将FPGA深入应用于人形机器人在纯粹技术维度上的门槛; 助力更多正在人形机器人领域参与竞争的团队 -- 及时做出实质性决策,及时将更多资源分配到深入应用FPGA技术这一竞争维度。
351 4
在实用化人形机器人控制系统中深入应用FPGA的框架设计(基于特斯拉Optimus-Gen2的硬件系统)
|
人工智能 自然语言处理 运维
工业组态 + LLM : 大模型技术引领传统工业软件创新与实践(上)
工业组态 + LLM : 大模型技术引领传统工业软件创新与实践(上)
1894 1
|
8月前
|
监控 安全 物联网
相比4G,5G有那些优势满足工业4.0的技术需求
5G凭借其超高速率、超低延迟、高可靠性、大连接数等核心技术优势,有力满足了工业4.0对于实时通信、灵活生产、高效自动化及大规模物联网应用的需求。
184 0
|
JSON 自然语言处理 算法
工业组态 + LLM : 大模型技术引领传统工业软件创新与实践(下)
工业组态 + LLM : 大模型技术引领传统工业软件创新与实践(下)
760 0
对话赛灵思Gilles Garcia:深度糅合技术属性与客户需求,做极致的Xilinx式服务
因为对技术的持续追求与钻研以及可编程芯片特有的灵活性,赛灵思能够在变幻莫测的市场环境中以不变应万变,深入到各行各业的应用创新中。
374 0
|
存储 机器学习/深度学习 人工智能
CPU将进入新时代:押注计算芯片的极限协同设计
我们现在进入了一个时代,那就是IT行业的计算引擎将需要比以往任何时候都更需要更低的价格,更好的性能以及更好的散热特性。这将需要一种在更大范围的工作负载和设备上进行协同设计系统(co-designing systems )的进化方法。
|
机器学习/深度学习 区块链 芯片
后通用芯片时代: 专用芯片兴起背后的经济学
_周末抽空整理了一下关于从经济学视角看专用(e.g. AI/挖矿)芯片崛起的感想,首发于[StarryHeavensAbove](https://mp.weixin.qq.com/s/99AQC20w2_Ene4o1zYlTkg)公众号,然后被[新智元](https://mp.
854 0
|
大数据 芯片 异构计算

热门文章

最新文章