开发者社区> 问答> 正文

宜搭流程表单中Word模版组件,如何获取富文本组件中的多行文本?

在开发公文系统,需要为公文的正文套上固定的格式。为方便拟稿人编辑文件,选择使用富文本组件输入正文,直接将富文本组件放入word模版中,出来的是一串html代码,如何能只把文本值取出来吗?

展开
收起
x6lzdrdmhmdnc 2024-08-30 15:39:49 125 0
来自:钉钉宜搭
4 条回答
写回答
取消 提交回答
  • 资深 C++与人工智能程序员。精通 C++,善用其特性构建稳健架构。在人工智能领域,深入研习机器学习算法,借 C++与 OpenCV 等实现计算机视觉应用,于自然语言处理构建文本处理引擎。以敏锐洞察探索技术融合边界,用代码塑造智能未来。

    在宜搭流程表单中,要通过Word模版组件获取富文本组件中的多行文本,以下是大致思路:

    一、了解组件数据存储与关联方式

    宜搭中的每个组件都有其数据存储规则。富文本组件中的多行文本数据存储在数据模型中,而Word模版组件需要与这个数据模型建立关联,才能获取相应的数据。

    二、建立数据关联

    1. 确保富文本组件和Word模版组件在同一个表单或流程表单环境中。
    2. 在Word模版组件的设置中,找到数据绑定或者变量引用相关的选项。这个选项允许你将Word模版中的占位符与表单中的其他组件数据进行关联。
    3. 找到富文本组件对应的字段名或者数据标识。这个标识通常在表单的组件属性或者数据管理部分可以找到。

    三、引用多行文本数据到Word模版

    1. 在Word模版中设置相应的占位符。例如,使用类似“${富文本组件字段名}”这样的占位符格式。
    2. 将富文本组件中的多行文本对应的字段名准确地填写到占位符中,这样当生成Word文档时,Word模版组件就会自动获取富文本组件中的多行文本内容,并填充到指定的位置。

    不过,具体的操作可能因宜搭平台的更新和具体版本细节略有差异。如果在操作过程中遇到问题,也可以参考宜搭官方提供的文档和帮助中心来获取更精准的步骤。

    2024-12-12 21:41:25
    赞同 4 展开评论 打赏
  • 有以下几种方法可以将 HTML 实体代码转换为文本:

    1、使用 HTMLParser

    HTMLParser 是 Python 标准库中的一个模块,它提供了用于解析 HTML 文档的功能。HTMLParser 中有一个名为 unescape() 的方法,可以将 HTML 实体代码转换为文本。

    import HTMLParser

    html_string = "<p>This is a paragraph.</p>"
    parser = HTMLParser.HTMLParser()
    text_string = parser.unescape(html_string)

    print(text_string)

    输出:

    This is a paragraph.

    1
    2
    3
    4
    5
    6
    7
    8
    2、使用 BeautifulSoup

    BeautifulSoup 是一个流行的 Python 库,用于解析 HTML 文档。BeautifulSoup 中有一个名为 convertEntities 的参数,可以将 HTML 实体代码转换为文本。

    from bs4 import BeautifulSoup

    html_string = "<p>This is a paragraph.</p>"
    soup = BeautifulSoup(html_string, "html.parser", convertEntities=BeautifulSoup.HTML_ENTITIES)
    text_string = soup.get_text()

    print(text_string)

    输出:

    This is a paragraph.

    1
    2
    3
    4
    5
    6
    7
    8
    3、使用 htmlentitydefs 模块

    htmlentitydefs 模块是 Python 标准库中的一个模块,它提供了用于处理 HTML 实体代码的函数和常量。

    import htmlentitydefs

    html_string = "<p>This is a paragraph.</p>"
    text_string = htmlentitydefs.codepoint2name[ord("<")]

    print(text_string)

    输出: lt

    image.png
    参考文档https://blog.csdn.net/weixin_44617651/article/details/137453731

    2024-09-02 14:24:11
    赞同 56 展开评论 打赏
  • 如果富文本组件输出的是HTML代码,您可以使用HTML解析工具或编程语言(如JavaScript、Python等)来提取文本内容。通常,您可以找到HTML中的

    或其他内容标签,并通过标签的innerText或textContent属性获取纯文本。在阿里云的机器流程自动化中,您可以使用“获取文本(网页)”组件来提取指定网页元素的文本内容。如果您的富文本内容在特定元素内,配置组件选择该元素,即可获取文本。更多详情可参考【获取文本(网页)组件](https://help.aliyun.com/document_detail/438817.html?spm=cpm._chatcloud.0.0.5fb26c80Lx4Dvn)的文档。
    2024-08-30 16:01:31
    赞同 60 展开评论 打赏
  • 网站:http://ixiancheng.cn/ 微信订阅号:小马哥学JAVA
    2024-08-30 16:05:35
    赞同 65 展开评论 打赏
问答分类:
问答地址:
关联地址:
相关产品:
来源圈子
更多
收录在圈子:
+ 订阅
「宜搭」是云钉原生低代码平台(钉钉 PaaS - aPaaS),让企业应用搭建更简单! 帮助中小企业降本提效,加强组织的数字化自主权; 帮助大型企业释放个体创新力,助力组织创新涌现。
相关文档: 宜搭
问答排行榜
最热
最新

相关电子书

更多
宜搭 - 企业智能化应用搭建平台 立即下载
《云市场-宜搭解决方案》 立即下载
《宜搭开发手册》 立即下载