宜搭流程表单中Word模版组件，如何获取富文本组件中的多行文本？

在开发公文系统，需要为公文的正文套上固定的格式。为方便拟稿人编辑文件，选择使用富文本组件输入正文，直接将富文本组件放入word模版中，出来的是一串html代码，如何能只把文本值取出来吗？

展开

收起

x6lzdrdmhmdnc 2024-08-30 15:39:49 554 版权

来自：钉钉宜搭

4 条回答

写回答

取消提交回答

技术员阿伟

资深 C++与人工智能程序员。精通 C++，善用其特性构建稳健架构。在人工智能领域，深入研习机器学习算法，借 C++与 OpenCV 等实现计算机视觉应用，于自然语言处理构建文本处理引擎。以敏锐洞察探索技术融合边界，用代码塑造智能未来。
在宜搭流程表单中，要通过Word模版组件获取富文本组件中的多行文本，以下是大致思路：

一、了解组件数据存储与关联方式

宜搭中的每个组件都有其数据存储规则。富文本组件中的多行文本数据存储在数据模型中，而Word模版组件需要与这个数据模型建立关联，才能获取相应的数据。

二、建立数据关联
1. 确保富文本组件和Word模版组件在同一个表单或流程表单环境中。
2. 在Word模版组件的设置中，找到数据绑定或者变量引用相关的选项。这个选项允许你将Word模版中的占位符与表单中的其他组件数据进行关联。
3. 找到富文本组件对应的字段名或者数据标识。这个标识通常在表单的组件属性或者数据管理部分可以找到。
三、引用多行文本数据到Word模版
1. 在Word模版中设置相应的占位符。例如，使用类似“${富文本组件字段名}”这样的占位符格式。
2. 将富文本组件中的多行文本对应的字段名准确地填写到占位符中，这样当生成Word文档时，Word模版组件就会自动获取富文本组件中的多行文本内容，并填充到指定的位置。
不过，具体的操作可能因宜搭平台的更新和具体版本细节略有差异。如果在操作过程中遇到问题，也可以参考宜搭官方提供的文档和帮助中心来获取更精准的步骤。
2024-12-12 21:41:25

赞同 18 展开评论
vohelon

有以下几种方法可以将 HTML 实体代码转换为文本：

1、使用 HTMLParser

HTMLParser 是 Python 标准库中的一个模块，它提供了用于解析 HTML 文档的功能。HTMLParser 中有一个名为 unescape() 的方法，可以将 HTML 实体代码转换为文本。

import HTMLParser

html_string = "This is a paragraph."
parser = HTMLParser.HTMLParser()
text_string = parser.unescape(html_string)

print(text_string)

输出:
This is a paragraph.

1
2
3
4
5
6
7
8
2、使用 BeautifulSoup

BeautifulSoup 是一个流行的 Python 库，用于解析 HTML 文档。BeautifulSoup 中有一个名为 convertEntities 的参数，可以将 HTML 实体代码转换为文本。

from bs4 import BeautifulSoup

html_string = "This is a paragraph."
soup = BeautifulSoup(html_string, "html.parser", convertEntities=BeautifulSoup.HTML_ENTITIES)
text_string = soup.get_text()

print(text_string)

输出:
This is a paragraph.

1
2
3
4
5
6
7
8
3、使用 htmlentitydefs 模块

htmlentitydefs 模块是 Python 标准库中的一个模块，它提供了用于处理 HTML 实体代码的函数和常量。

import htmlentitydefs

html_string = "This is a paragraph."
text_string = htmlentitydefs.codepoint2name[ord("<")]

print(text_string)

输出: lt

参考文档https://blog.csdn.net/weixin_44617651/article/details/137453731

2024-09-02 14:24:11

赞同 64 展开评论
以山向海

如果富文本组件输出的是HTML代码，您可以使用HTML解析工具或编程语言（如JavaScript、Python等）来提取文本内容。通常，您可以找到HTML中的
或其他内容标签，并通过标签的innerText或textContent属性获取纯文本。在阿里云的机器流程自动化中，您可以使用“获取文本（网页）”组件来提取指定网页元素的文本内容。如果您的富文本内容在特定元素内，配置组件选择该元素，即可获取文本。更多详情可参考【获取文本（网页）组件](https://help.aliyun.com/document_detail/438817.html?spm=cpm._chatcloud.0.0.5fb26c80Lx4Dvn)的文档。

2024-08-30 16:01:31

赞同 71 展开评论
喜欢猪猪

网站：http://ixiancheng.cn/ 微信订阅号：小马哥学JAVA

参考官网：https://docs.aliwork.com/docs/yida_support/wtwabe/gdi5p8/zk6dhy/hp0v761qmyg33r82

2024-08-30 16:05:35

赞同 73 展开评论

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

宜搭流程表单中Word模版组件，如何获取富文本组件中的多行文本？

输出:

输出:

输出: lt

相关文章