doccano数据标注平台搭建

简介: 基于阿里云服务器ESC示例,搭建doccano数据标注平台

参考 https://github.com/doccano/doccano

  1. 登录服务器
  2. 安装anaconda,并配置环境变量
  3. 创建python虚拟环境,python版本为3.8.13。
    conda create -n dcn python=3.8
    安装过程中网速过慢,可配置aliyun镜像;并且临时改变配置,续费几小时提高网速。
  4. 进入dcn虚拟环境,安装doccano,版本为1.8.0
    pip install doccano
  5. 打开一个terminal,在dcn环境下,运行命令

    Initialize database.

    doccano init

    Create a super user.

    doccano createuser --username admin --password pass

    Start the webserver.

    doccano webserver --port 8088

  6. 打开另一个terminal,在dcn环境下,运行命令
    doccano task
  7. 此时可通过http//:服务器公网ip:8088访问doccano网站
    注意http不能有s
相关文章
|
6月前
|
存储 计算机视觉 开发者
【mobileSam】使用大模型推理赋能标注工作,让标注工作不再困难
【mobileSam】使用大模型推理赋能标注工作,让标注工作不再困难
314 1
|
22天前
|
自然语言处理 数据可视化 前端开发
从数据提取到管理:合合信息的智能文档处理全方位解析【合合信息智能文档处理百宝箱】
合合信息的智能文档处理“百宝箱”涵盖文档解析、向量化模型、测评工具等,解决了复杂文档解析、大模型问答幻觉、文档解析效果评估、知识库搭建、多语言文档翻译等问题。通过可视化解析工具 TextIn ParseX、向量化模型 acge-embedding 和文档解析测评工具 markdown_tester,百宝箱提升了文档处理的效率和精确度,适用于多种文档格式和语言环境,助力企业实现高效的信息管理和业务支持。
3965 5
从数据提取到管理:合合信息的智能文档处理全方位解析【合合信息智能文档处理百宝箱】
|
3月前
|
人工智能 自然语言处理 搜索推荐
彻底摒弃人工标注,AutoAlign方法基于大模型让知识图谱对齐全自动化
【8月更文挑战第18天】知识图谱作为结构化语义库,在AI领域应用广泛,但构建中实体对齐难题一直存在。近期,AutoAlign提供了一种全自动对齐方案,由张锐等人研发并发布于arXiv。此方法摒弃传统的人工标注依赖,利用大型语言模型实现全自动化对齐。AutoAlign包括谓词与实体对齐两部分,通过构建谓词邻近图及计算实体嵌入,有效提升对齐性能。实验显示其性能超越现有方法,尤其适用于大规模数据集。尽管如此,AutoAlign仍面临计算资源消耗及不同领域适应性等挑战,未来需进一步优化以增强鲁棒性和泛化能力。
71 7
|
6月前
|
前端开发
基于jeecgboot的大屏设计器开发——数据集设计(一)
基于jeecgboot的大屏设计器开发——数据集设计(一)
143 3
|
6月前
|
算法 API 对象存储
视觉智能平台菜品识别要怎么做对比库呀?
视觉智能平台菜品识别要怎么做对比库呀?
101 1
|
数据采集 数据建模 BI
数据中台实战(05)-如何统一管理纷繁杂乱的数据指标?
数据中台实战(05)-如何统一管理纷繁杂乱的数据指标?
464 1
|
机器学习/深度学习 算法 数据挖掘
Sentieon DNAscope:适配多测序平台数据的快速精准分析流程
Sentieon DNAscope:适配多测序平台数据的快速精准分析流程
236 0
|
运维 安全 fastjson
【干货】自动化批量挖洞流程 之 四工具联动
【干货】自动化批量挖洞流程 之 四工具联动
697 0
|
算法 数据可视化 小程序
ATPdock:一种基于模板的ATP特异性蛋白质-配体对接方法
ATPdock:一种基于模板的ATP特异性蛋白质-配体对接方法
178 0
|
SQL 机器学习/深度学习 监控
拥有几百个模型的机构和企业,怎么进行模型管理
数百个模型放在面前,金融机构要如何高效管理
110 0
拥有几百个模型的机构和企业,怎么进行模型管理